tag:blogger.com,1999:blog-1320528867223721914.post5510183621309480746..comments2024-03-18T10:00:22.981+01:00Comments on #!/perl/bioinfo: Algunas ideas del uso de CD-HIT-EST 4.6 y USEARCH 5.2.32brunocontrerashttp://www.blogger.com/profile/06780659979139333360noreply@blogger.comBlogger4125tag:blogger.com,1999:blog-1320528867223721914.post-13374089958720327432012-11-04T17:21:07.015+01:002012-11-04T17:21:07.015+01:00Parece que no tengo activado algún sistema de alar...Parece que no tengo activado algún sistema de alarmas. En fin, ya lo siento. En cualquier caso, por si alguien más pasa por aquí y tiene la misma duda...<br />David,<br />creo que recordar que selecciono los clusters con más de un miembro porque me interesaba ver qué secuencias estaban siendo agrupadas. Los clusters de un miembro son por tanto los que tienen secuencias que han resultado ser independientes. Si te interesa quedarte con todo el conjunto nuevo de secuencias, tanto las independientes, como los nuevos clusters, efectivamente seleccionarías también los clusters de un miembro.<br /><br />SaludosCarlos P Cantalapiedrahttps://www.blogger.com/profile/12040277608623734435noreply@blogger.comtag:blogger.com,1999:blog-1320528867223721914.post-273927003446473992012-07-26T09:18:20.961+02:002012-07-26T09:18:20.961+02:00Carlos, por qué descartarías los clusters que sólo...Carlos, por qué descartarías los clusters que sólo tienen un único miembro? acaso son menos informativos o menos fiables?<br /><br />DavidAnonymousnoreply@blogger.comtag:blogger.com,1999:blog-1320528867223721914.post-27550580025644658592012-07-10T12:23:42.725+02:002012-07-10T12:23:42.725+02:00Gracias Alvaro,
me vendrá bien ese script, seguro....Gracias Alvaro,<br />me vendrá bien ese script, seguro. Yo por ahora sólo tengo para filtrar/extraer en base a cabeceras.CPCantalapiedrahttp://bioinfoperl.blogspot.comnoreply@blogger.comtag:blogger.com,1999:blog-1320528867223721914.post-77434113045834455192012-07-09T19:30:39.114+02:002012-07-09T19:30:39.114+02:00Veo que el problema está en las Ns, ahora sí que m...Veo que el problema está en las Ns, ahora sí que me creo que CDHIT falle. Se me olvidó comentarte en el lab que quizás por ello yo usaba un script de Perl casero para filtrar redundancias en genomas:<br />http://bioinfoperl.blogspot.com.es/2010/07/eliminar-secuencias-redundantes-y.htmlAnonymoushttps://www.blogger.com/profile/01111762212594457636noreply@blogger.com