en plena vorágine del coronavirus toca hablar del libro Introduction to Data Science, al que podéis acceder en https://rafalab.github.io/dsbook
El libro lo escriben Rafael Irizarry y más de 20 colaboradores. Rafa fue uno de los fundadores de Bioconductor, por lo que no debería sorprender que su lenguaje preferido para manipular y analizar datos sea R.
El libro se organiza en estas secciones:
- R, incluyendo tidyverse
- Visualización de datos, para mi lo más fuerte de R
- Estadística en R
- Manipulación de datos
- Aprendizaje automático (machine learning)
- Herramientas productivas
El libro se puede descargar en formato PDF o comprar en papel, pero lo más interesante es que todo el texto y el código fuente está disponible en formato R markdown en https://github.com/rafalab/dsbook . De esta manera es posible reproducir todos los análisis del libro dentro de Rstudio.
Rafa está ahora tratando de traducir al español. Puedes ayudar con los términos que se puedan traducir contribuyendo al documento https://github.com/rafalab/dslibro/blob/master/como-se-dice.md
Termino diciendo que podéis estar al tanto de actualizaciones en la cuenta de twitter https://twitter.com/rafalab
Hasta pronto,
Bruno