Ecología Microbiana y Herramientas bioinformáticas

Autor/a

Afiliación

Fecha de publicación

2024-01-01

Introducción

Los avances en la biología molecular, como la secuenciación de ADN a gran escala y la creación de grandes repositorios de secuencias, han posibilitado nuevas preguntas de investigación. En esta serie de talleres del curso de Ecología microbiana y Herramientas bioinformáticas nos adentraremos en el uso de herramientas computacionales para explorar y analizar datos de secuenciación masiva, con el fin de comprender mejor los procesos ecológicos que ocurren a escala microbiana. A lo largo de las sesiones, trabajaremos en línea de comando para aprender a procesar datos, manipular archivos y responder preguntas sobre ecología microbiana.

Algunas de las aplicaciones del análisis de datos de secuenciación masiva en ecología microbiana incluyen:

Estudio de la diversidad microbiana: se centra en la identificación y cuantificación de los microorganismos presentes en distintos ambientes, como suelos, aguas, sedimentos o el intestino de organismos, a partir de datos de secuenciación. Este enfoque permite caracterizar la composición taxonómica de las comunidades microbianas y analizar sus patrones de distribución entre diferentes entornos.
Análisis de interacciones microbianas: el estudio de las interacciones entre microorganismos es fundamental para comprender la estructura y la dinámica de las comunidades microbianas. A partir de datos de secuenciación, es posible inferir patrones de co-ocurrencia y exclusión mediante el análisis de abundancias y la construcción de redes de co-ocurrencia, lo que proporciona información sobre posibles relaciones ecológicas entre taxones.
Funcionalidad microbiana: el análisis de datos de secuenciación también permite investigar el potencial funcional de las comunidades microbianas. Mediante la identificación de genes funcionales y rutas metabólicas, se pueden inferir las capacidades metabólicas de los microorganismos y su contribución a procesos ecosistémicos, como los ciclos biogeoquímicos.

Ahora, la razón por la que suele trabajarse en la línea de comando es que permite trabajar de manera eficiente, reproducible y flexible con grandes volúmenes de datos. A través de ella, es posible automatizar flujos de análisis, integrar múltiples programas bioinformáticos y manejar archivos de gran tamaño que resultarían difíciles de procesar mediante interfaces gráficas. Además, facilita la trazabilidad y la reproducibilidad de los análisis, aspectos clave para la investigación científica.

Ingreso al cluster Hypatia

Para ingresar al cluster de computo de alto rendimiento de la universidad solo es necesario usar un protocolo de seguridad simple en el Shell. Esto consiste esencialmente en usar el comando ssh junto con el usuario y contraseña de la cuenta del curso. Para el curso tenemos la cuenta bcom4102, de este modo la dirección completa es bcom4102@hypatia.uniandes.edu.co y para ingresar entonces usamos el siguiente comando en cualquier terminal:

ssh bcom4102@hypatia.uniandes.edu.co

Al ejecutar este comando nos pedirá registrar un llave (key) de acceso e ingresar la contraseña seguidamente (esta se proveerá al inicio de la clase). Ahora aterrizamos en el nodo central del cluster. Recuerde que también existen interfaces gráficas para ingresar a una terminal como por ejemplo PuTTY para Windows o MoBaXterm para Linux y Mac.

En esta practica algunos trabajos se realizaran de manera interactiva en el cluster, por lo que es importante que ejecutar cualquier comando en el nodo central del cluster, use en en su lugar un nodo interactivo. Para esto simplemente debe correr el siguiente comando:

srun --pty bash

Si quieres ser más especifico al pedir recursos puedes usar las siguientes opciones en el comando: srun --pty -p <partition> -N <nodes> -n <tasks> -t <time> --mem=<XG> bash

Instrucciones para entrega de talleres

El taller resuelto debe mostrar el soporte de los comandos que ejecutaron y sus salidas correspondientes.

El archivo de entrega debe ser en formato PDF y estar titulado con el número del taller y el grupo, (e.g. taller01-grupo01.pdf).

Con respecto a la notación para los bloques de código en el documento, se recomienda usar una fuente monoespaciada, como Console o Courier. Sin embargo, una manera más sencilla y estética de generar PDF con bloques de código es usando Markdown y luego compilar (guardar) como PDF.

De no seguir estas instrucciones se les bajará una unidad en el taller. (El uso de Markdown es opcional, pero la entrega en PDF es obligatoria).