una tarea con la que tropiezas a menudo cuando trabajas en genómica es la de traducir unas coordenadas de una versión del genoma a las coordenadas equivalentes de otra versión.
Ejemplo de mapeo entre dos versiones o ensamblajes del mismo genoma, tomado de http://ensemblgenomes.org/info/data/assembly_mapping. |
En la figura se resume el problema. Es importante darse cuenta de que puede haber elementos en la versión n que estén ausentes en la n+1, o viceversa. Con esa salvedad, podemos traducir coordenadas en Ensembl de manera sencilla usando la interfaz REST: https://rest.ensembl.org/documentation/info/assembly_map
Por ejemplo, para convertir el fragmento 1-10 del cromosoma 1 de cebada de la versión de 2012 (ASM32608v1) a la de 2017 (IBSC_v2), podríamos hacer:
$ wget -q --header='Content-type:application/json' \
'https://rest.ensembl.org/map/hordeum_vulgare/ASM32608v1/1:1..10/IBSC_v2?' -O -
Obtenemos los resultados en formato JSON:
{"mappings":[{"original":{"end":10,"seq_region_name":"1","assembly":"ASM32608v1","start":1,
"strand":1,"coord_system":"chromosome"},"mapped":{"start":268488,"assembly":"IBSC_v2",
"seq_region_name":"chr1H","end":268497,"coord_system":"chromosome","strand":1}}]}
Puedes averiguar los nombres de las diferentes versiones soportadas en la herramienta Tools->AssemblyConverter (por ejemplo en humano, plantas),
hasta pronto,
Bruno