INTRODUCCIÓN A LA GENÓMICA ESTADÍSTICA
DEC-547
Dr. M. Humberto Reyes Valdés
Otoño de 2003
Tareas
1. El parásito causante de la malaria es P. falciparum. Investigue para este microorganismo información actualizada sobre lo siguiente:
a) Número de cromosomas o grupos de ligamiento
b) Longitud en centimorgans de cada grupo
c) Número de marcadores para cada grupo
d) Promedio de longitudes en centimorgans de los grupos de ligamiento
e) Datos sobre uno de los locus marcadores (elíjalo arbitrariamente)
Esta investigación deberá entregarse en forma concentrada. No quiero que me entreguen puros “printouts” de lo que encuentren en la base de datos.
2. La función de verosimilitud para p en un experimento es
Y su función soporte es:
Encuentre el estimador de p que maximiza S. Hint: use D y Solve en Mathematica
3. Considere la siguiente relación fenotipo-genotipo
Fenotipo | Genotipo |
A1_ | A1 A1, A1 A2, A1 A3 |
A2_ | A2 A2, A2 A3 |
A3 A3 | A3 A3 |
Bajo la suposición de equilibrio de H-W obtenga los MLE de las tres frecuencias alélicas. ¿Difiere su resultado de lo obtenido con el método de los momentos?
4. Para el caso del sistema sanguíneo ABO, vea si se puede obtener un estimador "decente" de las frecuencias alélicas. Si es esta la situación, aplíquelo a los siguientes datos:
A | 119 |
B | 7 |
AB | 3 |
O | 142 |
Si su estimador es realmente "indecente" (quiero decir muy complejo, intratable o absurdo) entonces use el comando Abo del paquete MathGenome (está en mi página). Posteriormente pruebe la hipótesis de equilibrio de H-W a través de una chi cuadrada para bondad de ajuste. Use el comando HwAbo de MathGenome y vea si sus resultados son diferentes
5. Con los datos del problema 4, haga una gráfica tridimensional de la función soporte con respecto a los parámetros pa y pb (las frecuencias alélicas). ¿Coincide el pico de la gráfica con lo obtenido a través del comando Abo de MathGenome?
6. Lleve al cabo una prueba de Neyman-Pearson para evaluar el ajuste al equilibrio de H-W con los datos del problema 4. ¿Coincide con lo obtenido a través del comando HwAbo de MathGenome?
7. Demuestre algebráicamente que la relación entre el coeficiente de correlación para asociación entre dos caracteres cualitativos y la Ji cuadrada para contingencia es . Puede usar Mathematica.
8. Considere dos loci con alelos A y a en el locus 1, y con alelos B y b en el locus 2. Las frecuencias alélicas son como sigue. Población 1, pA = 0.6, pa = 0.4, qB = 0.3, qb = 0.7. Población 2: pA = 0.2, pa = 0.8, qB = 0.9, qb = 0.1. En cada población ambos loci están en equilibrio de ligamiento. Asuma que las dos poblaciones se mezclan en iguales proporciones. ¿Cuál es el desequilibrio de ligamiento, D y D', resultante en la mezcla? Note que la fórmula para D' en este caso es:
Hint: lo que se mezclan son los haplotipos no los alelos
9. Demuestre que , es decir, el valor de chi cuadrada para contingencia sobre del tamaño de muestra (número de haplotipos), es igual a:
10. Considere una línea con el genotipo AABB y otra con el genotipo aabb. Ambas líneas se cruzan y se obtiene la generación F1. A su vez, la F1 se autofecunda para obtener la F2. En la F2 se realiza apareamiento aleatorio para obtener la generación F3 y así sucesivamente. Calcule el desequilibrio de ligamiento predicho para los haplotipos de la F1, F2, ..., F10. Haga una gráfica que muestre la tendencia del desequilibrio de ligamiento a través de esas generaciones. Asuma un coeficiente de recombinación de 0.2 entre ambos loci. Nota: cuando calcule el desequilibrio de ligamiento en la generación Fi, considere los haplotipos que constituyen esa generación, no los gametos a que da lugar para formar la generación Fi+1.
11. Haga una gráfica comparativa de las funciones de Haldane, Kosambi, Pascoe & Morton y Carter & Falconer. Para ello, coloque en el eje de las x distancias mapa de 0 a 300 cM y en el eje de las y la frecuencia de recombinación. Las líneas para cada función aparecerén en la misma gráfica con colores diferentes. Rotule los ejes de la gráfica usando comandos del Mathematica. ¿Qué es lo que nota en esta gráfica a medida que la suposición de coincidencia se incrementa?
12. Derive las funciones de mapeo de Haldane y de Kosambi con respecto a la frecuencia de recombinación. Haga una gráfica comparativa de las dos derivadas evaluadas en recombinaciones de 0 a 0.1 en el eje de las x. a) ¿Cómo debería lucir la gráfica de la derivada si la distancia mapa fuera una función lineal de la frecuencia de recombinación? b) Se dice que para frecuencias de recombinación de 0 a 0.1, esta se aproxima a la distancia mapa. De acuerdo con esta gráfica comparativa, ¿para cual de las dos funciones de mapeo esta aseveración es razonable?
Created by Mathematica (November 2, 2003)