tcj-cimat2024

Taller de Ciencia para Jóvenes 2024 CIMAT. Descubriendo la diversidad microbiana a través del ADN

View the Project on GitHub nselem/tcj-cimat2024

Sesión 4 Bases de datos (50 min)

Introducción

Las bases de datos pueden ser públicas o privadas, acumulan información de los organismos y usualmente tienen algún paquete de análisis asociado a ellas.

Bases de datos públicas

NCBI

NCBI es una de las grandes bases de datos biológicas. Hay información de genes, genomas proteínas, etc de muchos organismos.
Streptomyces

Esta secuencia del gen de 16s de Streptomyces lividans proviene de NCBI

LC026160.1 Streptomyces lividans gene for 16S ribosomal RNA, partial sequence, strain: AS2 GGGGAGCTCTGCAGTCGACGATGACCACTTCGGTGGGGATTAGTGGCGAACGGGTGAGTAACACGTGGGC AATCTGCCCTGCACTCTGGGACAAGCCCTGGAAACGGGGTCTAATACCGGATACTGACCCTCGCAGGCAT CTGCGAGGTTCGAAAGCTCCGGCGGTGCAGGATGAGCCCGCGGCCTATCAGCTTGTTGGTGAGGTAATGG CTCACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCA GACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTG AGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGAAGAAGCGAAAGTGACGGTACCTGCAGAA GAAGCGCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGCGCAAGCGTTGTCCGGAATTATTG GGCGTAAAGAGCTCGTAGGCGGCTTGTCGCGTCGGTTGTGAAAGCCCGGGGCTTAACCCCGGGTCTGCAG TCGATACGGGCAGGCTAGAGTTCGGTAGGGGAGATCGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATA TCAGGAGGAACACCGGTGGCGAAGGCGGATCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGG AGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGCACTAGGTGTGGGCAACATTCCA CGTTGTCCGTGCCGCAGCTAACGCATTAAGTGCCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAA AGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTGGCTTAATTCGACGCAACGCGAAGAACCTTAC CAAGGCTTGACATACACCGGAAAGCATCAGAGATGGTGCCCCCCTTGTGGTCGGTGTACAGGTGGTGCAT GGCTGTCGTCAACTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCCGTGGT GGCCACCAGGCCCTTGGGGTGCTGGGGAACTCACGGGAAAACCGCCGGGGTCAAATCCGAAGGAAAGTGG GGGACGACGTCAAAGTCTTCATTGCCCCTTATGGTCTTGGGCTGGCCACCGTGGCTACAAATGGCCCGGT ACAAATGAACTTGCGATACCCGCCAGGGTGGAAGCGAAACCTCAAAAAGCCCGGTTCCAATTCCNGAATG GGGGGCTTCGAACCTCACCCCCCTGGAAAGTCCGAGATCCCCTAGGAATCCGGAAATACCCATTTTGCGC GGGGTAAAACATTTTCCCGCGGCCTTTTTTACACACGCCGCCCTTAAACTCTCAAGAAATTCTTGTACAC CCCCCAGGAACCGGGTGGCCCCCACCCTCTTTTGGGGGAAGGGACTGTTCCCAAAGGTGGGGTTCCCGGC ACTGGGGGGGGAATNGTTTTCCTCAAGAAGGTAA

Ejercicio 1

Busca la taxonomía completa de Streptomyces coelicolor en NCBI taxonomy.

Ejercicio 2

Utiliza blastn para buscar como query el 16S de Streptomyces lividans contra toda la base de NCBI. Guarda las cinco secuencias que mejor alineen (no 100% idéntica) en un formato fasta archivo de texto. La utilizaremos después para realizar un árbol.

Ejercicio 3

Ve a NCBI y descarga el 16S de tu bacteria favorita. Anota el 16S aquí: Documento colaborativov de 16s. El encabezado con el nombre de la bacteria no debe llevar espacios, caracteres raros, ni pasar de 5o caracteres.

Árbol de la vida

En el árbol de la vida podrás explorar la diversidad de la vida.

RAST

RAST es un anotador automático. Encuentra genes codificantes y les asigna función.
Anota en RAST Streptomyces coelicolor y tu organismo ensamblado
Compáralos

MIBiG

antibioticos
Obten la secuencia de un gen que pertenezca a un cluster de antibióticos y anótala en el documento colaborativo

antiSMASH

Anota rápidamente los genomas de Streptomyces y de tu ensamblado. ¿Qué diferencias ves? Anóta tu conclusión en el documento colaborativo.

Kegg,Brenda, pfam

Busca HisA en ambas bases ¿Qué obtienes? Toma la secuencia de HisA y analízala en pFAM, qué obtienes?

¿Cómo son tus organismos en RAST?

También existen bases de datos privadas

Clavigenomics una base de datos de Clavibacter michiganensis Bacteria patógena de tomate.