Hola,
hoy escribo a mi regreso del X Congreso Nacional de Mejora Genética de Plantas, donde se habló y mucho de herramientas de genómica computacional.
Justo esos días me enteré de la liberación de las primeras versiones de miniprot, un programa de Heng Li, el creador de minimap, del que ya hablamos aquí comparándolo con BLASTN.
Esto me recordó que hace unos años, mientras Carlos Cantalapiedra empezaba a desarrollar BARLEYMAP, nos preguntamos qué programas había disponibles para mapear secuencias de genes, tránscritos y proteínas sobre genomas. Para los dos primeros tipos de secuencias encontramos GMAP, que adoptamos para nuestro nuevo software, pero para el tercero no encontramos ninguno que nos gustara del todo más allá de BLASTX y spaln. Justo para eso es miniprot. Lo he probado con una proteína de cebada:
#installation git clone https://github.com/lh3/miniprot.git cd miniprot/ make # index barley genome ./miniprot -t 8 -d GCA_904849725.1_MorexV3.mpi GCA_904849725.1_MorexV3.fna # example: map protein HORVU3Hr1G095240 ./miniprot --gff GCA_904849725.1_MorexV3.fna HvOs2/HORVU3Hr1G095240.pep.fa
Cómo veis pedí la salida en formato GFF y me la ha devuelto precedida del mismo resultado en formato PAF, que incluye CIGARs y en la columna 10 el número nucleótidos alineados (477 en el ejemplo) y :
##gff-version 3 ##PAF transcript:HORVU3Hr1G095240.2 159 0 159 ... chr3H_LR890098.1 miniprot mRNA 577160564 577200549 ... chr3H_LR890098.1 miniprot CDS 577200365 577200549 ... chr3H_LR890098.1 miniprot CDS 577162212 577162293 ... chr3H_LR890098.1 miniprot CDS 577161755 577161804 ... chr3H_LR890098.1 miniprot CDS 577161575 577161671 ... chr3H_LR890098.1 miniprot CDS 577160567 577160629 ... chr3H_LR890098.1 miniprot stop_codon 577160564 577160566 ...
Lo que coincide con los resultados de BARLEYMAP cuando busco la secuencia de nucleótidos (CDS) correspondiente:
HORVU3Hr1G095240.2 chr3H_LR890098.1 577160564 577200549
El manual está en https://lh3.github.io/miniprot/miniprot.html , si encontráis errores podéis comunicarlos en https://github.com/lh3/miniprot/issues
Hasta pronto,
Bruno