14. Inferencia Bayesiana - MrBayes + FigTree

Luis E. Paternina
Luis E. Paternina
2.7 هزار بار بازدید - 4 سال پیش - En este corto videoclip veremos
En este corto videoclip veremos los parámetros básicos para construir un árbol filogenético en MrBayes, y editar el árbol en FigTree.

MrBayes es un programa bastante complejo, a diferencia de PHYML no permite introducir fácilmente los modelos de substitución nucleotídica. MrBayes por defecto tiene dos corridas de análisis (Run 1 y Run 2), cada corrida contiene 4 cadenas Markovianas que analizan árboles, siempre yendo desde árboles de menor probabilidad de ser reales hasta mejores probabilidades.

Lo anteriormente mencionado significa que MrBayes genera archivos donde se almacenan los árboles analizados (12Primates.nex.run.t y 12Primates.nex.run2.t) por cada corrida, así como archivos que contienen las probabilidades de esos árboles 12Primates.nex.run.p y 12Primates.nex.run2.p), además de estos archivos, al finalizar el análisis se genera un archivo consenso que contiene el árbol bayesiano de mejores probabilidades (12Primates.nex.con.tre). Otros archivos también son generados pero los antes mencionados son los de nuestro mayor interés.

El árbol consenso del análisis (12Primates.nex.con.tre) se abre desde el software FigTree. Este programa permite visualizar y editar árboles de manera similar a Tree Explorer en MEGA aunque presenta algunas diferencias prácticas con este último.

A pesar que al final de nuestro ejemplo se obtiene un árbol final, este resultado no es el óptimo ya que el muestreo del espacio de árboles fue sesgado y mucho espacio de árboles no fue analizados por las dos corridas (videoclip en el minuto 3:35).

Los parámetros usados en nuestro análisis fueron:
1 - Execute 12Primates.nex: este comando le dice al programa que lea un archivo de nombre "12Primates.nex".
2 - lset nst=6 rates=gamma: este comando significa "Likelihood Settings" y lo que hace es decirle al programa que el modelo de substitución es 012345 (modelo GTR, el modelo mas complejo de todos los posibles) y que tiene parámetro Gamma.
3 - mcmc ngen=10000 samplefreq=10: este comando significa que se correran Markov Chain Monte Carlo (Cadenas Markovianas de Monte Carlo) durante 10.000 generaciones (árboles, en el sentido práctico) y que cada 10 árboles analizados se registrará en los archivos de árboles (.t) y probabilidades (.p) el resultado de la corrida... Esto quiere decir que en 10.000 generaciones y Samplefreq de 10, los archivos ".t" y ".p" tienen información de 1000 árboles.
4 - sump burnin=250: esto significa que se va a resumir las probabiliades de los archivos "12Primates.nex.run.p" y "12Primates.nex.run2.p" en una sola probabilidad maximizada, para alcanzar probabilidades maximizadas el programa descarta 250 datos de probabilidades de árboles (burnin) con las peores probabilidades antes de realizar el consenso.
5 - sumt burnin=250: esto significa que se va a resumir los árboles de los archivos "12Primates.nex.run.t" y "12Primates.nex.run2.t" en un solo árbol, este árbol contendrá las probabilidades maximizadas del paso anterior.... Para ello programa descarta los 250 peores árboles (burnin) antes de realizar el consenso.

Al final de todo este proceso MrBayes ilustra de forma gráfica básica una representación del árbol consenso en forma de Cladograma y de Filograma. Los soportes de rama de este método son "Probabilidades Posteriores" el análisis (no confundir con Bootstrap). Este método es computacionalmente muy exigente, y análisis típicos pueden tardar desde unos cuantos minutos hasta meses, todo depende de la complejidad del modelo, del dataset y del computador utilizado.
4 سال پیش در تاریخ 1399/01/07 منتشر شده است.
2,779 بـار بازدید شده
... بیشتر