2 de octubre de 2017

Plant Genome Evolution 2017 (II)



Estas son mis notas del segundo día.

Katrin M Dlugosch habla sobre las distribuciones ecológicas de las especies y de lo difícil que es identificar qué caracteres las explican, qué caracteres definen el éxito o el fracaso ecológico. Alega que los cambios ambientales son discretos, por ejemplo al introducir por primera vez una especie fuera de su área de distribución nativa. Estudia un cardo (Centaurea solstitialis) que es una mala hierba de la alfalfa y que fue propagada con ella desde España a América. Actualmente tiene densidades mayores en América muy superiores a las de la península y han observado que las poblaciones invasoras han acumulado, por selección, genes de defensa y metabolismo secundario (http://onlinelibrary.wiley.com/doi/10.1111/mec.13998/full). Son por tanto candidatos a ser genes de adaptación, y también conocidos por ser la contraparte a los genes de crecimiento, dado que la planta debe dedicar recursos a ambas tareas a la vez. Además han observado que cambia la microbiota de la rizosfera en las áreas nativas y las introducidas. Actualmente está estudiando si las especias invasoras tienen mayor plasticidad de expresión génica que las no invasoras, muestreando 7 diferentes familias de plantas y algunas especies poliploides, comparando DE en ambiente nativo vs ambiente invadido.

Blake C Meyers habla de phasiRNA, que son siRNAs secundarios de 21b que funcionan en trans y cis (aunque hay productos secundarios de 22b). Dependen de una copia del gen Dicer (DCL). Muchos de ellos tienen como diana motivos de familias de genes NLRs, con el fin de suprimirlos. En un artículo en Medicado han visto como 5 miRNAs son suficientes para controlar el nivel de expresión de todos los NLRs. Su hipótesis es que previenen la autoactivación de estos genes. De esta manera, la evolución del repertorio de NLRs guía también la diversificación de miRNAs (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5026261). Después habla de cómo un phasiRNA producto de DCL5  provoca esterilidad masculina en arroz con un solo SNP (http://www.plantcell.org/content/25/7/2400).

Andrew DL Nelson habla sobre la predominancia de los lncRNA en los genomas de plantas. Son de al menos 200b y tienen potencial codificante bajo. Presenta el software https://github.com/Evolinc, montado sobre http://www.cyverse.org, para la anotación de estos RNAs (https://www.ncbi.nlm.nih.gov/pubmed/28536600). Menciona que se conservan más en Fabáceas que en Poáceas por ejemplo, pero en general menos que los genes que codifican proteínas. También han mirado cómo les va a los lncRNA tras duplicaciones genómicas, y han observado que en muchos casos se convierten en pseudogenes.

R Van Velzen habla un proyecto de Wageningen sobre nodulación por parte de Rhizobium de raíces de Parasponia andersoni, una especie no leguminosa de Indonesia, y la comparan con plantas de Trema, que no nodulan. Encuentran que las Rosales han perdido la capacidad de nodular porque los genes relevantes se han perdido o convertido en pseudogenes en paralelo (https://www.biorxiv.org/content/early/2017/07/28/169706).

D Roodt explica sus resultados en torno a una duplicación del genoma de las Cicadales y también de Gingko (http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0184454).

Athanasios Zervas nos habla de los genomas de mitocondrias de plantas parasíticas, como el muérdago (Viscum album). Secuenciaron con Illumina las mitocondrias de 38 especies angiospermas y ensamblaron genes mt (no el cromosoma entero) y observan que la tasa de sustituciones por sitio es mucho mayor en el muérdago, pero no en las otras parasíticas. Su resultado más llamativo es que el parasitismo ha aparecido 11 veces en el árbol de las angiospermas. Menciona de pasada que han observado RNA editing del gen cox3 en muérdago.

Steven Kelly (presentado como Mr OrthoFinder) habla de la evolución de la eficiencia fotosintética (FS) y de cómo el coste de hacer nucleótidos, siendo las purinas más caras que las pirimidinas, y los codones con o sin purinas reflejan la cantidad de N en la dieta. Prueban esta hipótesis con bacterias y eucariotas parásitos y construyen un modelo que para estimar la presión de selección sobre la composición de codones de un proteoma (https://github.com/easeward/CodonMuSe, https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-1087-9). Luego se pasa a las plantas y compara cómo diferentes grupos de plantas necesitan diferentes [N] para fotosintetizar. Usando su modelo pueden predecir la eficiencia FS de una planta, a partir de su %GC (las más eficientes tienen más purinas, porque gastan menos en FS).  Como consecuencia, ante el aumento de [CO2] atmosférico y aumento de la tasa de FS, la tasa de cambio de las secuencias de DNA de las plantas se acelera y por tanto la especiación.

P Novikova muestra sus resultados sobre polimorfismos compartidos y únicos entre diferentes especies del género Arabidopsis y concluye que las poblaciones actuales de la tetraploide (¿) A. suecica tienen alelos de al menos 4 fundadores de A. thaliana (http://dx.doi.org/10.1038/ng.3617). Muestra datos que sugieren una coincidencia entre la aparición de las especies poliploides y los periodos glaciales en Europa (escala: miles de años). Muestra las adaptaciones de las diferentes especies poliploides: fotosíntesis (suecica), kamchatica (cold), arenosa (serpentine soils), etc

Ute Kraemer habla de las plantas hiperacumuladoras de metales que viven en suelos con condiciones extremas, como la perenne Arabidopsis halleri muestreada en zonas mineras. De hecho, comprobaron que tolera Zn, Pb y Cd metales en condiciones que matan a A. thaliana. Cuando comparan el complemento génico de A. thaliana y A. halleri encuentran dos tipos de mutaciones asociadas a la hiperacumulación que se traducen en transcripción elevada: i) CNV de genes y ii) polimorfismos en elementos cis (http://dx.doi.org/10.1186/s12864-016-3319-5). Muestra datos de evidencia de selección en gen HMA4 (pi y D), presenta en varias copias conservadas por conversión génica ectópica (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3758752). A continuación estudian la variabilidad fenotípica de casi doscientas poblaciones (K=4-6 aparentemente) de A. halleri en Europa central medida en el laboratorio (http://onlinelibrary.wiley.com/doi/10.1111/nph.14219/full). Cuando hacen GWAS con la [Cd] del suelo de origen encuentran un transportador HMA asociado de manera significativa. Usan GBS para genotipar.
 
G Piganeau hace genómica con picofitoplancton, los eucariotas fotosintéticos de menor tamaño. Muestrea en el golfo de León. LD se estabiliza en 20kb. Muestra haplotipos muy divergentes, que no se pueden alinear, para el cromosoma 19 ensamblado, hipervariable. pero que conservan algunos genes ortólogos. La longitud del chr19 se correlaciona con la resistencia a la infección de dsDNA virus, pero no parece contener CRISPR repeats con trozos de esos virus.

I Mayrose presenta una tubería para identificar cambios de secuencia que explican variación en caracteres discretos específicos. Recuerda que las herbáceas tienen tasas de sustitución más altas que las leñosas (https://www.ncbi.nlm.nih.gov/pubmed/18832643) como manera de introducir métodos existentes de inferencia a partir de topologías de árboles que tienen limtaciones que su nuevo método trata de superar. Para ello necesitas un carácter binario mapeado sobre un árbol de especies y desarrollan su modelo traitRate (https://www.ncbi.nlm.nih.gov/pubmed/28453644). Lo prueba con la transición a parasitismo de las orquídeas y encuentran SNPs en RPS8. Necesita como input un árbol, un FASTA de péptidos y otro con caracteres binarios.

Bob Schmitz habla de metilación de DNA en plantas (5mC), un carácter con variabilidad variable entre linajes. La enzima MET1 mantiene la metilación en sitios mCG, sobre todo en el cuerpo del gen. CMT3 mantiene los sitios mCHG, típicos de heterocromatina, y DRM1/2 los mCHH, de manera dependiente de transcritos. Hay evidencia (mutantes, filogenias) de que CMT3 es participa en la metilación del cuerpo génico, que es máxima en el centro del gen y decae hacia los extremos. Hacen epiRILs para estudiar si se recupera al cruzar mutantes cmt3 con wt, y tras 8 generaciones ven que no, a pesar de que el transcrito se expresa perfectamente. Sí observan algunos genes donde se recupera la metilación, pero es muy lento.

Claudia Kohler habla de los mecanismos epigenéticos de la especiación de plantas poliploides y de la barrera reproductiva con sus parentales, que tiene lugar en el endospermo (triploid block, https://www.ncbi.nlm.nih.gov/pubmed/20089326). Muestra ejemplos de genes paternos que se sobreexpresan solamente en los triploides y que están bajo control del mecanismo de metilación dependiente de RNA (CHH, https://www.ncbi.nlm.nih.gov/pubmed/25217506).  Concluye que la poliploidización es una vía rápida para la especiación, mucho más rápida que la acumulación de mutaciones en especies diploides.



A Vidalis habla sobre epimutantes y la evolución del metiloma en plantas. La metilación es estable entre generaciones. Los epimutantes ganan o pierden su estado de metilación silvestre y hay variabilidad natural en su distribución entre individuos de la misma población  (https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-1127-5).  

WA Ricci estudia sitios cis lejanos en plantas, que en maíz se han descubierto con MNase-seq, desvelando el genoma activo (1% del total, https://www.ncbi.nlm.nih.gov/pubmed/27185945). Explica varios ejemplos en maíz, entre ellos un enhancer en el promotor del gen tb1 que se encuentra 11kb aguas arriba y que se confirma por su patrón de modificación de histonas H3K27. Después muestra que en maíz, usando los patrones de histonas, se pueden identificar regiones accesibles de cromatina dentro, cerca (2kb) y lejos de genes transcripcionalmente activos en proporciones similares.


1-O en Sitges (Plant Genome Evolution 2017)

Hola,
espero que hayáis tenido un mejor domingo que yo.
Llegué ayer a Sitges con la ilusión de visitar de nuevo Catalunya, y un poco de inquietud por lo que pudiera pasar a lo largo del día con motivo del 1-O. Cuando empezó el congreso ya muchos habíamos visto las imágenes de violencia, y según iban pasando las sesiones se me fueron quitando las ganas de ciencia, y eso que la charla de Ed Buckler fue impresionante. Pero es que ayer vimos de frente a dos monstruos que son vecinos nuestros y que no esperan a nadie. De un lado, a los provocadores que se creen dueños de la democracia y no dudan en dividir esta tierra saltándose las reglas que le convienen, y del otro a los que no tienen nada que escuchar, ya se lo saben todo, pero no dudan en sacar las porras. Los que estamos en medio llevamos demasiado tiempo callados, hasta cuándo nos lo podremos permitir? A los que nos gusta este país, con su riqueza de gentes y culturas, no nos representan ni los unos ni los otros, ahora es el momento de hacernos oír.

PD


Ed Buckler repasó la historia de la mejora de plantas hasta el estado actual, que él llama breeding 4.0. Si la versión 1.0 se basaba en la selección fenotípica, la 2.0 en ensayos controlados y la 3.0 en la selección genómica, el paradigma actual es la mejora por diseño de genomas. Defiende el uso de información evolutiva en mejora por aumentar el poder estadístico. En maíz el límite de detección de diferencias es de 5/granos (kernels) por planta, mientras que usando información evolutiva y tamaños efectivos de población grandes es posible llegar a detectar diferencias de 1 grano entre 250 plantas. El resto de la charla podría resumirse en cómo se acumulan o pierden los alelos en las variedades élite respecto a los cultivares antiguos o landraces. Tras analizar maíces de los últimos 10.000 años concluyen que sólo 5% del genoma ha estado bajo selección en ese periodo, y por tanto la mayor parte de la variabilidad genética es neutra. Sin embargo, una parte significativa son mutaciones deletéreas que explican la heterosis del maíz. Éstas se van eliminando a base de recombinación y son menos frecuentes en las variedades élite que en los maíces antiguos. Dado que los alelos deletéreos en regiones centroméricas son eliminadas con muy baja eficiencia, comenta que se están eliminando con la tecnología CRISPR. Para ello deben caracterizarlos desde el punto de vista de su efecto sobre una proteína, con algoritmos como GERP (https://doi.org/10.1038%2fnmeth0410-250) o SIFT (http://sift.jcvi.org), o por su efecto sobre la regulación de un gen vecino. En concreto observan que SNPs en promotores de hasta 5kb que explican % de variación significativos de patrones de expresión, presentes en frecuencias alélicas bajas, que en general tienen un efecto desregulador. Finalmente, menciona un estudio en el contexto del proyecto https://www.panzea.org donde estudian maíces de toda América por asociación genómica tanto con fenotipos observados en campo, en múltiples localizaciones, como con datos biogeográficos (GIS, por ejemplo latitud).

Stefan Rensing, pionero del estudio de Physcomitrella patens, explica como la comparación de segmentos sinténicos entre genomas de plantas terrestres y P. patens ha permitido diseccionar genes de adaptación al medio terrestre. También menciona en su charla como muchos factores de transcripción (TFs) importantes en el desarrollo de las plantas aparecieron muy pronto en las plantas acuáticas, y como su acumulación está estrechamente relacionada con la complejidad. En concreto menciona que el número de TFs en diferentes genomas de plantas terrestres se correlaciona con el número total de tipos celulares (https://www.ncbi.nlm.nih.gov/pubmed/20644220).


James Schnable. El número de genes en el genoma de maíz no para de aumentar a causa de genes accesorios (presencia/ausencia, PAV), lnRNAs y secuencias que se transcriben como helitrones. Podemos permitirnos anotarlos todos? Qué es un gen? Definición pragmática: algo que si lo mutas tiene fenotipo en alguna condición interesante. Dice que estos suelen ser sinténicos al comparar especies (https://genomevolution.org/coge). Cómo se originan los fenotipos? Por cambios en la proteína o en su regulación. Sin embargo, sólo un pequeña parte de los cambios no sinónimos tienen fenotipo. A continuación explica las secuencias no codificantes conservadas entre especies (CNS), que se definen como palabras de al menos 15 bases conservadas, a menudo más que un sitio cis típico. Muestra datos de maíz, sorgo y Setaria italica que sugieren que genes ortólogos sinténicos a menudo no comparten secuencias reguladoras, ni CNS, ni patrones de expresión, al menos en sus experimentos de frío (maíz vs sorgo, posiblemente no la mejor condición experimental para estas especies). Entre los ortólogos que no comparten expresión hay más TFs que los esperados. Su conclusión es que la regulación es un carácter que cambia muy rápido y potencialmente neutral para muchos genes en muchos contextos.

Victor Albert habla sobre plantas carnívoras, que han aparecido varias veces entre las angiospermas. Están ensamblando dos genomas del género Drosera combinando datos Illumina, PacBio y HiC. A pesar de que tienen ensamblajes sin terminar ya han podido comprobar por autoalineamiento que hay varios eventos de duplicación de cromosomas cuando los comparan con otras especies, como Vitis vinifera. Menciona que el hábito carnívoro parece haber evolucionado a partir de una estrategia de defensa frente a insectos herbívoros, y que esto se ve reflejado en un enriquecimiento en genes relacionados y en tándem.

Mike Sanderson habla sobre genómica de cactus columna de Arizona, como los saguaros. Su mensaje es que cuando hacen filogenias génicas encuentran muchos árboles (https://academic.oup.com/sysbio/article/57/3/503/1666092/Hemiplasy-A-New-Term-in-the-Lexicon-of).