tcj-cimat2024

Taller de Ciencia para Jóvenes 2024 CIMAT. Descubriendo la diversidad microbiana a través del ADN

View the Project on GitHub nselem/tcj-cimat2024

Arboles Sesión 3 (50 min)

RpoB es un gen conservado, que permite hacer comparaciones entre organismos. Toma estas secuencias de RpoB y conviértelas en un árbol.
Links de ayuda
Alineador embl muscle
Creador de árboles ¿Qué observaste?

Ejercicio 1 Ubicar una bacteria de interés

Busca en NCBI el rpoB de una bacteria de tu interés y ubícala en el árbol contrastándola contra otras bacterias.

Ejercicio 2 Secuencias misteriosas

Ahora agrega estas secuencia y analiza lo qué observas?

Secuencia_misteriosa_1
MLDTESRWAIAESFFKTRGLVRQHLDSFNDFLRNKLQQVIYEQGEIVTEVPGLKIKLGKIRYEKPSIRET DKGPMREITPMEARLRNLTYSSPIFLSMIPVENNIEGEPIEIYIGDLPIMLKSVADPTSNLPIDKLIEIG EDPKDPGGYFIVNGSEKVIIAQEDLATNRVLVDYGKSGSNITHVAKVTSSAAGYRVQVMIERLKDSTIQI SFATVPGRIPFAIIMRALGFVTDRDIVYAVSLDPQIQNELLPSLEQASSITSAEEALDFIGNRVAIGQKR ENRIQKAEQVIDKYFLPHLGTSPEDRKKKGYYLASAVNKILELYLGRREPDDKDHYANKRVRLAGDLFTS LFRVAFKAFVKDLVYQLEKSKVRGRRLSLTALVRADIITERIRHALATGNWVGGRTGVSQLLDRTNWLSM LSHLRRVVSSLARGQPNFEARDLHGTQWGRMCPFETPEGPNSGLVKNLALLAQVSVGINESVVERVAYEL GVVSVEDVIRRISEQNEDVEKYMSWSKVYLNGRLLGYYEDGKELAKKIRESRRQGKLSDEVNVAYIATDY LNEVHINCDAGRVRRPLIIVNNGTPLVDTEDIKKLKNGEITFDDLVKQGKIEFIDAEEEENAYVALNPQD LTPDHTHLEIWPSAILGIIASIIPYPEHNQSPRNTYQSAMAKQSLGLYASNYQIRTDTRAHLLHYPQMPL VQTRMLGVIGYNDRPAGANAILAIMSYTGYNMEDSIIMNKSSIERGMYRSTFFRLYSTEEVKYPGGQEDK IVTPEAGVKGYKGKDYYRLLEDNGVVSPEVEVKGGDVLIGKVSPPRFLQEFKELSPEQAKRDTSIVTRHG ENGIVDLVLITETLEGNKLVKVRVRDLRIPEIGDKFATRHGQKGVVGILIDQVDMPYTAKGIVPDIILNP HALPSRMTIGQIMEAIGGKYAALSGKPVDATPFLETPKLQEMQKEILKLGHLPDSTEVVYDGRTGQKLKS RILFGIVYYQKLHHMVADKMHARARGPVQILTRQPTEGRAREGGLRFGEMERDCLIGFGTAMLIKDRLLD NSDKAVVYICDQCGYVGWYDRSKNRYVCPVHGDKSVLHPVTVSYAFKLLIQELMSMVISPRLILGEKVNL GGASNE

Secuencia_Misteriosa_2 MGVSKADEVDDGDNIVSSHKEGLEAPVKTAVDKFQLLPSFLKVRGLVKQHIDSFNYFINCEIKKIIHAQG NEKVTSDVDANFYLKYLDIFVGEPCVEQDYIYEPITPQQCRLRDMTYSAPISVDVEYTRGKEVVVRKGKD GKQEGSINIGRMPIMLRSSRCILAGKNEAQLAKVGECPLDPGGYFVVKGTEKVILIQEQLSKNRIIITTD SSGSVAASVTSSTHERKSKTNMVVKHERIYLRHNTFGDDIPIVVVMRAMGMESDQEIVQMVGRDPKYAGI LNPSLQECAALKIYTSHQALEYLGSKVRSRNMFTKQKRTKVDEARDILATVVLAHVPVHQFDFRAKCIYL AVIIRKMLEAMLNREAVDDMDYVGNKRLELAGQLLSLLFEDLFKRMNAELKKSMDATLSKANRSTQFDII KLIRPDTLTNGLEHAISSGNWAVKRFKMDRKGVTQVVSRLSFIAALGHMTRISSQFEKTRKVSGPRALQP SQWGMLCPCDTPEGEACGLVKNLSLMTHVTTDEEEAPLIELCTTLGVEDLSLLSGEELHSPKTYLVFFNG TILGVHRRPNRFAEVLRKLRRAGKIGEFVSVHVNPKHRNIQIASDGGRVCRPLVIADKGVSRVKEHHMKE LKDGFRTFDDFLREGLVEYLDVNEENNSLIALYEGDATPDTTHIEIEPFTILGVCAGLIPYPHHNQSPRN TYQCAMGKQAMGNIAYNQLQRMDTLLYLLVYPQRPLLSTKSIELVGYDKLGAGQNATVAVMSYSGYDIED AIVMNKSSLDRGFGRCIVIKKSVVPMKKYANRTADRIMAPELQSSAKGGVQVVARQQLQDHDGIAAVGEM IRPGDIYVNKQSPIDTRNNVNNPMALPDSAYKRTPQTYKGAAGETAVVDKVLLTSNDENHFVVKCLIRQT RRPEVGDKFSSRHGQKGVCGTIVQQEDFPFSERGICPDLIMNPHGFPSRMTVGKMIELLGGKAGLHNGKF HYGSAFGEPSGHADKVSTISATLVKHGFSYSGKDFIYSGITGSPLQAYIFMGPIYYQKLKHMVLDKMHAR ARGPRVVLTRQPTEGRSREGGLRLGEMERDCLIAYGASMMILERLMISSDQFQIQVCTKCGMIGYYHHKL KICLCSTCKSGDNIATMKLPYACKLLFQELQSMNIVPRLTLAEA

Secuencia_Misteriosa_3 MEALATELGALTPEQAAAPVNTVEEKWRLLPAFLKVKGLVKQHIDSFNYFINVEIKKIMKANEKVTSDAD PMWYLKYLNIYVGTPDVEESFNVTRPVSPHECRLRDMTYSAPITVDIEYTRGSQRIIRNALPIGRMPIML RSSNCVLTGKTPAEFAKLNECPLDPGGYFIVKGVEKVILIQEQLSKNRIIVEADRKGTVGASVTSSTHEK KSRTNMVVKQGRFYLRHNTLSEDIPIAIIFKAMGVESDQEIVQMIGTEEHVMAAFAPSLEECQKAQIFTQ MQALKYIGNKVRRQRMWGGPKKTKMEEARELLASTILTHVLVKEFNFRAKCIYTAVMVRRVILAQGENKV DDRDYYGNKRLELAGQLLSLLFEDLFKKFNSELKKIADQVIPKQRAAQFDVVKHMRQDQITNGMVNAIST GNWSLKRFKMDRQGVTQVLSRLSYISALGMMTRISSQFEKTRKVSGPRSLQPSQWGMLCPSDTPEGEACG LVKNLALMTHITTDMEDGPIIKLASNLGVEDVNLLCGEELSYPNVFLVFLNGNILGVIRDHQKLVNTFRI MRRAGYINEFVSISTNLSDRCVYISSDGGRLCRPYIIVKKQKPAVTNKHMEELAQGYRNFEDFLHEGLVE YLDVNEENDCSIALYEHTINKDTTHLEIEPFTLLGVCAGLIPYPHHNQSPRNTYQCAMGKQAMGTIGYNQ RNRIDTLMYLLAYPQKPMVKTKTIELIDFEKLPAGQNATVAVMSYSGYDIEDALVLNKASLDRGFGRCLV YKNAKCTLKRYTNQTFDKVMGPMLDAATRKPIWRHEILDADGICSPGEKVENKQVLVNKSMPTVTQTPLE GSNVPQQPQYKDVPVTYKGATDSYIEKVMISSNAEDAFLIKMLLRQTRRPEIGDKFSSRHGQKGVCGLIV PQEDMPFCDTGICPDIIMNPHGFPSRMTVGKLIELLAGKAGVLDGRFHYGTAFGGSKVKDVCEDLIRHGY NYLGKDYVTSGITGEPLEAYIYFGPVYYQKLKHMVLDKMHARARGPRAVLTRQPTEGRSRDGGLRLGEME RDCLIGYGASMLLLERLMISSDAFEVDVCGQCGLLGYSGWCHYCKSSCHVSSLRIPYACKLLFQELQSMN IIPRLKLAKYNE

Secuencia_Misteriosa_4 MTDPTLTTVDSTLTTVDSVAVTPTATNTTPVHLLPDLVEIQRASFRWFLGEGLVEELESFSPITDYTGKL ELHFLGKDYRLKAPKYMVDEAKRRDSTYSVQMYVPTRLINKETGDIKEQEVFIGDLPLMTDRGTFIINGA ERVIVNQIVRSPGVYYKAETDKHGRRTYTANLIPNRGAWLKFETDKNDLVWVRIDKTRKLSAQVLLKALG LSDGEIFDSLRHPEYFQKTIEKEGQFSEEEALLELYRKLRPGEPPTVNGGQQLLESRFFDPKRYDLGKVG RHKLNRKLRLNIPESTRVLTPQDIVSAIDYLINLEFDIGNPDDIDHLGNRRVRSVGELLQNQVRVGLNRL ERIIRERMTVSDADSLTPASLVNPKPLVAAIKEFFGSSQLSQFMDQTNPLAELTHKRRISALGPGGLTRE RAGFAVRDIHPSHHGRICPIETPEGPNAGLIGSLATHARVNDFGFIETPFFPVVNGQIVKDKPAVYMTAD EEDDLRVAPGDVPIDSDNNILGESVPVRYRQDFTVTSPKEVDYVAVSPVQIISVATSLIPFLEHDDANRA LMGSNMQRQAVPLLRPERALVGTGLEAQAARDSGMVTISRTDGVVSYVDANWIKVTDLEGQVHSYELQKY QRSNQDTCLNQRPFVFEGTKVVAGQVMADGSATEGGEIALGQNVLITYMPWEGYNYEDAILLSERLVYED VYTSIHIEKFEIEARQTKLGPEEITREIPNVGEDALRQLDETGIIRVGAWVSSGDILVGKVTPKGESDQP PEEKLLRAIFGEKARDVRDNSLRVPNGEKGRVVDVRVFTREQGDELPPGANMVVRVYVAQKRKIQVGDKM AGRHGNKGIISRILPVEDMPYLPDGTPIDIVLNPLGVPSRMNVGQVFEALLGWAGQNLDARFKVTPFDEM YGEEASLETTHGKLQEARNQTGKDWVFNPDNPGKIQLYDGRTGEPFDQEVTVGQSYMLKLVHLVDDKIHA RSTGPYSLVTQQPLGGKAQQGGQRFGEMEVWALEAFGAAYTLQELLTVKSDDMQGRNEALNAIVKGKAIP RPGTPESFKVLMRELQSLCLDIAVHKLETQEDGTSRDSEVDLMADVGNRRTPSRPTYESISREEPAGTAG VAGAAIAPLGSSVETNSPITPLENQPPQPF

¿Sabes a qué tipos de organismos pertenecen ?

Ejercicio 3 Blast en NCBI

🔎 Basic Local alignment search tool BLAST es un alineador múltiple de secuencias que al utilizarlo contra la base de datos de NCBI nos ayuda a encontrar otras parecidas. Hagamos blast del 16s de Streptomyces lividans y anota tus observaciones en el documento colaborativo.
blastn

¿Cómo podrías utilizar blastp? blastp

Ejercicio 4 Secuencia misteriosa

¿Qué obtienes al utilizar blast con la secuencia misteriosa? ¿Qué tipo de blast usaste?
¿Qué aprendes si usas NCBI taxonomy para saber el linaje de tu secuencia?

Saber más

LA investigación de Woese fue publicada en 1977. Aqui puedes consultar su propuesta de los súper reinos

Ejercicio 5 Ecología microbiana

Tenemos en este archivo una muestra de DNA de una poza de 4-Ciénegas en Coahuila. ¿Qué microorganismos viven ahi? ¿Cuál es el más abundante?. 🔎 En el Taller de Metagenómica puedes aprender más de análisis de microbiomas.

Metadatos

Los metadatos son datos sobre los datos usualmente vienen en una tabla de excel, hay una serie de consejos sobre buenas prácticas de toma de metadatos. En cuanto a los datos las buenas prácticas nos dicen que siempre conservemos los datos originales.

Visualizando datos en Microreact

Microreact es una plataforma de visualización de datos especializado en epidemiología genómica. En particular ayuda a explorar árboles filogenéticos y mapas con los lugares dónde ocurrieron las infecciones.

Nosotros utilizaremos esta plataforma para ver los lugares y años donde nacimos todos nosotros!

Ejercicio primera parte

Llena con tus datos la Hoja de cáculo de google drive

Para agregar las coordenadas de tu lugar de nacimiento: 1) Abre Google Maps
2) Busca tu lugar de nacimiento
3) Da click derecho sobre el lugar del que quieres extraer las coordenadas. Debe aparecer un cuadrito en la parte inferior del mapa (Si no aparece utiliza click derecho -> ¿Qué hay aquí?) 4) Pulsa sobre las coordenadas que están abajo del cuadro
5) Copia y pega la latitud y longitud en las columnas de la hoja de cálculo que abriste en el paso

Recuerda que cuando se llena la hoja de cálculo se deben seguir las buenas prácticas de colecta de metadatos.

Ejercicio segunda parte

a) Abre Microreact
b) Inicia sesión utilizando tu cuenta de gmail
c) Da click en Upload
d) Ve a la hoja de cálculo y copia el link que está en ‘File->compartir ->Publish’ o ‘Archivo->Publicar como tsv’
e) Pega el link donde pide un archivo .csv
f) da click en continue (without three)
g) Ingresa el título de tu proyecto de visualización
h) Visualiza tus resultados!
i) Ahora visualiza resultados de SARS CoV 2 en México

Visualización simultánea de árboles y mapas

Ahora regresa a la página principal de microrreact.
Selecciona el proyecto ‘Zika virus in the Americas’, discute con tu compañero de al lado y escriban sus respuestas en el documento colaborativo.
¿En dónde se tuvo el primer registro de este virus?
¿Cuál fue el primer lugar de América en el que se detectó zika?
¿En qué año fue la epidemia que se describe en este artículo?
¿Cuál es el ancestro más cercano a los virus de la epidemia?
¿Cuántos sitios de microencefalia en Brasil reportaron? ¿Cuáles virus tienen el genoma más grande y más chico?