30 de mayo de 2014

posdoc bioinformática/proteómica (Oxford)


Sir William Dunn School of Pathology, South Parks Road, Oxford
The Central Proteomics Facility at the Sir William Dunn School of Pathology, University of Oxford is looking for an enthusiastic team member experienced in computational and statistical methods to provide bioinformatics support to researchers using proteomics (http://www.proteomics.ox.ac.uk).
The successful candidate will work collaboratively with existing bioinformaticians, facility staff and academic researchers. The position will cover two main roles. The first is to advise research scientists on statistically rigorous experimental design and data analysis procedures. The second is to maintain and expand the range of computational and statistical tools the facility uses for the analysis of proteomics data. 
You will have a degree in statistics, computing, bioinformatics or equivalent with considerable demonstrable practical experience. You should have strong communication and organisational skills, experience with analysing high dimensional datasets, statistical programming and experience with at least one scripting language. While it is desirable to have previous experience with proteomics and mass spectrometry data this is not essential as training will be provided.

The post is available as a fixed-term contract for 2 years in the first instance. If you are interested in this role, please apply online. You will be required to upload a CV and supporting statement as part of your online application. 

Interviews will be held during the week commencing 23 June 2014.

http://www.jobs.ac.uk/job/AIU252/postdoctoral-bioinformatician-biostatistician

15 de mayo de 2014

Cuando Blastn no es Blastn


BLAST cambió hace ya algún tiempo a mejor con su versión BLAST+ pero por el camino se olvidó de algún detalle que puede confundir a más de uno.

El antiguo BLAST se ejecutaba con el comando 'blastall':

Blastall
--------

Blastall may be used to perform all five flavors of blast comparison. One
may obtain the blastall options by executing 'blastall -' (note the dash). A
typical use of blastall would be to perform a blastn search (nucl. vs. nucl.) 
of a file called QUERY would be:

blastall -p blastn -d nr -i QUERY -o out.QUERY

The output is placed into the output file out.QUERY and the search is performed
against the 'nr' database.  If a protein vs. protein search is desired,
then 'blastn' should be replaced with 'blastp' etc.

De esta forma un alineamiento de proteínas comenzaría como 'blastall -p blastp' y uno de ácidos nucleicos como 'blastall -p blastn' y si queremos usar MEGABLAST tenemos el comando diferente 'megablast'.

Sin embargo en la 'nueva' versión BLAST+, se separaron el alineamiento de proteínas y el de ácidos nucleicos en dos comandos: 'blastp' y 'blastn' (ver manual). Hasta aquí todo parece lógico y normal, lo que no todo el mundo sabe es que LA OPCIÓN POR DEFECTO DE BLASTN ES MEGABLAST, si ejecutamos 'blastn -help' encontraremos lo siguiente:


 *** General search options
 -task                 'megablast' 'rmblastn' >
   Task to execute
   Default = `megablast'

Y es que no todo el mundo está interesado en la velocidad de búsqueda de alineamientos, muchos de los que todavía usamos Blastn es porque apreciamos su gran sensibilidad para detectar alineamientos. En la actualidad usamos Blast para alinear miles de secuencias en tiempos muy razonables de minutos e incluso segundos. Para ganar velocidad en alineamientos de millones de secuencias existen otras mejores alternativas como Bowtie2.

La CONCLUSIÓN de todo esto, si usamos Blastn y nos interesa la sensibilidad deberemos ejecutarlo como:

 blastn -task blastn

Si lo hacemos sin añadir esta opción estaremos ejecutando MEGABLAST y correremos el peligro de perder una gran sensibilidad y no encontrar los alineamientos que deseamos. Por ejemplo, busquemos homología entre la 2'beta microglobulina humana (NM_004048.2) y la de ratón (NM_009735.3) usando la herramienta online de Blastn con las opciones por defecto ('Highly similar sequences (megablast)'):


Sin embargo si cambiamos la opción de búsqueda a 'Somewhat similar sequences (blastn)':


La diferencia es considerable, ¿no creéis? pasamos de no encontrar similaritud a un alineamiento con E-valor de 1.5E-56!!!!






9 de mayo de 2014

2nd CNB Course on Introduction to Research

Hola,
pego un anuncio de un curso para estudiantes interesados en investigar que se realizará en Madrid del  30 de Junio al 25 de Julio en el Centro Nacional de Biotecnología-CSIC, que me parece puede ser una excelente oportunidad para algunos de los seguidores del blog. Los alumnos elegidos tendrán la oportunidad de interaccionar con investigadores de todas las áreas del centro, y en concreto en el departamento de Biología de Sistemas hay varios grupos con tradición en la formación en biología computacional.




Toda la información en http://tinyurl.com/lnqtmgp.
 
Un saludo,
Bruno