Archive | Publicaciones RSS feed for this section

La (¿deseable?) ciencia hacker

30 Jun

Si ya desde un inicio escribo: “ética hacker”, y si escribir poesía es poner juntas dos palabras que antes no se conocían, entonces es posible que, sin proponérselo, esta columna comience en forma de poema.

(Sólo que este poema ya es antiguo, lo inició el periodista Steven Levy y tiene ya casi 20 años.)

Computer hackerPorque pensar en un hacker es, a bote pronto, pensar en un criminal informático, un saltador de leyes, un virus de sistemas. Pero esa es una acepción parcial. En realidad las connotaciones de lo hacker son ambiguas, y su valor depende de la acepción que se escoja. Porque un hacker es también un apasionado de su oficio, del conocimiento y de la libertad, esas grandes palabras. Por eso, cuando se habla de ética hacker se habla de una actitud ante la vida y ante el trabajo que reúne tres características fundamentales:

– Que no hay separación clara entre ocio y trabajo. Que el dinero obtenido es fruto, pero no objetivo último.

– Que dicha actividad se ejerce en una comunidad. Que el reconocimiento se basa en el valor que aporta a dicha comunidad.

– Que precisa de libertad, de un camino libre de trabas.

Y no, es obvio que no todos los ámbitos son del todo susceptibles a esta forma de vida. Una utopía debe alejarse de la realidad, pero no olvidarla. Por eso es necesario buscarle un nicho, un lugar de experimentación. Y no sólo por obvio un buen nicho es la ciencia, ése en el que los experimentos tienen lugar. De ahí la llamada ciencia hacker. Porque si hacemos el paralelismo con los puntos anteriores:

– El científico es, ante todo, vocacional. Se mueve principalmente por la curiosidad. Quizás en última instancia por la reputación, pero raramente por el dinero.

– Su reconocimiento depende de los otros científicos, del valor aportado por sus publicaciones en esa misma, y experta, comunidad.

– Toda iniciativa científica se apoya en una ciencia anterior, y ese conocimiento debe estar disponible.

Y éste último es uno de los diversos pilares de la ciencia hacker. Porque el conocimiento y las publicaciones existen, pero muchas veces hay que pagar por ellas. Por eso hay quien aboga por una ciencia de acceso abierto que pueda fluir libre. Por eso ya han surgido numerosas revistas bajo esta política y por eso el gobierno americano ha obligado a que todas las investigaciones financiadas con dinero público sean publicadas en abierto. Porque, entre otras cosas, no tiene sentido que el Estado haya de pagar dos veces: para generar conocimiento y para poder acceder a él.

¿No?

*

ENCODE, o la transparencia del código.

10 Sep

Hace unos días se publicaron, simultáneamente y en varias revistas, multitud de datos sobre el proyecto internacional de secuenciación del ADN ENCODE. Los trabajos los fimaban más de 400 científicos que han trabajado -en mayor o menor medida- de forma conjunta. Entre las conclusiones que han obtenido es que gran parte de lo que se consideraba ADN basura no es tal. Y que variaciones en muchas de estas regiones antes denostadas parecen relacionarse con la aparición de multitud de enfermedades. Los datos, sus interpretaciones y la concepción de estos estudios tienen diversas aristas, que pretendemos tratar próximamente. Ahora, por lo pronto, nos interesa rescatar la parte final de un texto de Ed Yong, que ha trabajado este tema con gran dedicación y que habla sobre la comunicación y el uso futuro de todos estos datos:

(versión traducida)

¿Cómo van a buscarle sentido los científicos a todo esto?

ENCODE es enorme. Los resultados de esta fase se han publicado en 30 artículos principales en Nature, Genome Biology y Genome Research junto con una serie de artículos secundarios en Science, Cell y otras revistas. Y todo está disponible de forma gratuita.

Las páginas de las revistas en papel son un pobre repositorio para tal cantidad de datos, así que el equipo ENCODE ha diseñado un nuevo modelo de publicación. En el portal de ENCODE los lectores pueden seleccionar entre 13 temas de interés, y seguir sus “hilos” a lo largo de los diferentes artículos. Di por ejemplo que quieres saber sobre las secuencias “potenciadoras”. El hilo te llevará a los párrafos más relevantes de entre los 30 artículos de las tres revistas. “Para evitar que la gente tenga que filtrar previamente los 30 artículos y seleccionar los que realmente quiere leer,  nosotros le facilitamos ese hilo“, dice Birney.

Y sí, hay una app para eso.

La transparencia también es un asunto importante. “Con estos proyectos científicos tan exhaustivos, tiene que haber una gran confianza en que el análisis de los datos se ha hecho correctamente”, dice Birney. Pero no tienes simplemente que confiar. Al menos la mitad de las figuras de ENCODE son interactivas, y los datos que están detrás de ellas pueden ser descargados. El equipo ha diseñado también una “máquina virtual” – un archivo descargable con casi todos los datos y los códigos que se han usado en los análisis. Piensa en ello como en la sección de Métodos más completa jamás hecha. Con la máquina virtual “puedes reproducir paso por paso lo que hicimos para llegar a la figura”, dice Birney. “Creo que eso debería ser el estándar para el futuro”.

(versión original)

How will scientists actually make sense of all of this?

ENCODE is vast. The results of this second phase have been published in 30 central papers in Nature, Genome Biology and Genome Research, along with a slew of secondary articles in Science, Cell and others. And all of it is freely available to the public.

The pages of printed journals are a poor repository for such a vast trove of data, so the ENCODE team have devised a new publishing model. In the ENCODE portal site, readers can pick one of 13 topics of interest, and follow them in special “threads” that link all the papers. Say you want to know about enhancer sequences. The enhancer thread pulls out all the relevant paragraphs from the 30 papers across the three journals. “Rather than people having to skim read all 30 papers, and working out which ones they want to read, we pull out that thread for you,” says Birney.

And yes, there’s an app for that.

Transparency is a big issue too. “With these really intensive science projects, there has to be a huge amount of trust that data analysts have done things correctly,” says Birney. But you don’t have to trust. At least half the ENCODE figures are interactive, and the data behind them can be downloaded. The team have also built a “Virtual Machine” – a downloadable package of the almost-raw data and all the code in the ENCODE analyses. Think of it as the most complete Methods section ever. With the virtual machine, “you can absolutely replay step by step what we did to get to the figure,” says Birney. “I think it should be the standard for the future.”

¿Acceso abierto en la UE?

22 Jul

La ciencia hacker acaba de saber, gracias a un post de Synaptica, que, por lo que parece, la Union Europea va a seguir los pasos de el NIH, de las universidades americanas y de el NHS de el Reino Unido para hacer que la investigación financiada con fondos públicos pase a ser de acceso libre. Al menos así reza este comunicado de prensa… Además justo hoy se publica un artículo interesante al respecto en The Economist. Osea, parece que algo se mueve.

Ya veremos a ver cuánto tardan en llegar los lobbies del copyright a Bruselas, dónde encuentran siempre recogimiento y comprensión, pero si se lleva a cabo una decidida politica de Open Access para toda la UE volveré a creer en la política que no esté al servicio más que de sus ciudadanos.

Firma por la ciencia de acceso abierto

23 May

Una petición cortita…Hace un par de días que la propuesta de que toda la ciencia financiada públicamente ha de ser abierta por ley fue lanzada en la web de la Casa Blanca. Aunque no seas ciudadano americano puedes votar para que se lleve a cabo. Ni que decir tiene que lo siguiente debería ser dirigirnos a nuestros propios gobernantes. Pero si los referentes mueven ficha mejor que mejor…
Aquí el enlace.

El prestigio de los científicos

14 Abr

Es probable que, en ocasiones, salgamos de lo estrictamente científico o de lo estrictamente hacker para aportar ideas no del todo maduradas acerca del proceso de hackerización de la ciencia. Hoy, me temo, será uno de esos días. Espero sepan disculparme y que puedan aguantar hasta el final del post para ver si al final ha tenido sentido el descarrile. Tambien me disculparé porque los ejemplos sean muy “biomédicos”, pero ese es mi contexto.

Para empezar voy a poner una frase de @jlori que he leido hoy, en un artículo de El Mundo,  al respecto de gente cualquiera que se ha hecho famosa en twitter:

“La popularidad de una cuenta en Twitter”, agrega, “en el caso de autores que no tenían una marca o reputación previa, está directamente relacionada con el valor que aporta a sus comunidades de referencia. Ese valor puede originarse en la calidad de la información, la agudeza de las opiniones, el dominio de la ironía o del humor, la capacidad de provocación o la originalidad de los contenidos“.

Y vamos a resumir esto de otra forma: si tienes la posibilidad de ser evaluado por cualquier “consumidor” porque las herramientas te lo permiten, tu reputación dependerá de la capacidad que tengas para aportar valor añadido a la red que te ha permitido difundir tu “producto”. Que cada quien cambie consumidor y producto como quiera. Esto, que ahora es una perogrullada, no lo es tanto en cuanto a qué tenemos que hacer para ser reputados, prestigiosos. Siguiendo con el ejemplo del humor, la capacidad de ser prestigioso de Martes y Trece dependía, en parte, de su capacidad pero mucho tambien de como estuvieran posicionados respecto a los gestores de contenidos de TVE. Dependía de las rentas. Cuanto mas distribuida es una red, cuanto menos filtros predeterminados tiene, mayores son las probabilidades de que la reputación en dicha red dependa sólo de lo que se aporta a la red exclusivamente, ya que la posición previa, si os fijáis en el gráfico, es igual para todos. O , al menos, tiende a ser lo mas igualitaria posible:

Y esto vale para el cine, para los medios de comunicación, para la economia… y para la ciencia.

En la ciencia, otra perogrullada, el prestigio es fundamental. No porque eso lleve a ganar más dinero, o no de forma sustancial, sino porque casi exclusivamente de ello depende tu “factor de impacto” y, por tanto, la financiación de tus nuevos proyectos. Por tanto, cogiendo la frase de @jlori por los cuernos, el prestigio de un investigador cualquiera en la ciencia depende de:

1. Que exista una herramienta, sin más filtros que los legales, que le permita llegar a todos aquellos rincones en los que su “producto” puede ser interesante.

2. Que produzca contenidos considerados relevantes por su comunidad (sea la comunidad de gente interesada en mecánica cuántica o en la célula B).

Y yo añadiré una terecera cosa que, en el ejemplo del humor en twitter no importa, pero en la ciencia si:

3. Que la relevancia de los contenidos sea mesurable de una forma objetiva y que todo el proceso sea verificable y contextualizable.

Ahora desarrollaremos un poco los 3 puntos, pero antes lean cuáles son las profesiones mas valoradas en España. Con las particularidades de cada cultura, coinciden bastante bien con las de otros paises más reputados. Y con las de paises no tan reputados. Es indudable que influye la percepción que se tenga de lo que la profesión aporta a la sociedad. Es indudable que enfermeras o médicos salen en los primeros puestos por el tipo de labor y en el contexto que la desempeñan. Pero ¿por qué los científicos y no los periodistas? Ambos buscan la verdad para mejorar la sociedad. Yo diría que la búsqueda de la verdad de los periodistas es, incluso más relevante para la sociedad que la de los científicos. Sin embargo, no salen muy bien parados…¿Acaso no hay vanidad, lucha por poder, peleas, intereses, etc en la ciencia también?.Piensen el por qué, yo me inclino por algo que tiene que ver con el tercer punto.

Siguiendo con la ciencia, que es lo que nos ocupa, hemos de reconocer que los 3 supuestos que hemos planteado como necesarios para adquirir reputación en el mundo científico y para que esa reputación se corresponda con el valor de la aportación a la red se cumplen bastante bien. Pero hay camino de mejora:

1. La primera condición para lograr que un investigador se convierta en prestigioso es que exista la posibilidad de que todo el mundo pueda acceder en igualdad de condiciones a herramientas que permitan la divulgación de sus resultados. Eso en la ciencia se conseguía mediante las revistas científicas. Las revistas científicas tienen una doble función aseguran la divulgación y determinan la reputación de lo publicado. Antes de internet la reputación de un científico (salvo las grandes figuras) solía estar restringida a su propio campo. A aquellos que, por su propia formación y por estar suscritos a las mismas revistas o sociedades científicas, hacían de interlocutores científicos del investigador en cuestion. Luego llegó internet y la generalización del uso de PubMed y, aunque todavía no podemos acceder a todo de todos, por lo menos podemos acceder a los abstracts de todo y a una gran parte de los contenidos completos. En la ciencia que viene, en la ciencia hacker, podremos acceder a todo gratis. No me cabe la menor duda. Osea que, al primera condición, si bien no se cumple del todo, se cumple en gran parte y experiencias como arXiv, Mendeley o PLoS nos sugieren que pronto podremos acceder a todo. Sin restricciones. No hace falta recordar que la herramienta que posibilita eso es internet. No cualquier internet. Una internet libre y neutral. Este punto lo explica mejor Peter Binfield, editor de PLoS:

2. La relevancia de los contenidos se puede medir de muchas formas. La más común es el factor de impacto de la revista en la que se publica. Digamos que ha servido bastante bien para detectar buenas publicaciones y para generar reputación allí donde era merecida pero es un sistema francamente mejorable. Tiene dos problemas fundamentales: que se acepte tu artículo en una revista depende del valor del artículo, en buena medida, pero, a veces, tambien de lo amigo que seas del revisor que te toca, de una llamadita por aquí al editor, del país del que proceda un hallazgo (digamos que, a priori, es mas creible un paper de EEUU que uno de la India)… Es decir, tiene un punto de subjetividad. Lo cual es desastroso para generar una red estrictamente meritocrática. El segundo punto controvertido es que, aunque en una revista buena, generalmente, hay buenos artículos, a veces, conseguir impacto es más importante que la propia veracidad del artículo. A veces, que algo sea controvertido es beneficioso en si mismo, aunque no sea del todo veraz o el proceso tenga lagunas. Desde la vida basada en el arsénico hasta las vacunas y el autismo. Como decían en un editorial del Annals of Neurology: “extraordinary claims need extraordinary evidence”. Y a veces la “extraordinary evidence” se sacrifica en pro del impacto. O, a veces, la amistad con el editor, permite colar articulos malos en revistas muy buenas. Y, por tanto, un investigador con un artículo muy malo puede beneficiarse enormemente en las convocatorias de becas por estar en una revista buena mientras que en un sistema en el que se premie exclusivamente el valor del hallazgo y no el de la revista en que está publicado, nunca saldría beneficiado. Quien tiene que dar relevancia al hallazgo es la comunidad (me refiero a la comunidad real en la que ese hallazgo puede ser relevante). Y esa relevancia no (sólo) debe establecerse a priori (peer-review pre-publicacion) sino tambien a posteriori (peer-review post-publicacion, citaciones, comentarios en blogs, descargas…). Y esto último es importante, ya que un hallazgo puede parecer muy relevante pero, a veces, sólo tu “peer” más cercano en la red, sólo el que se dedica a algo muy parecido a lo tuyo, tiene la capacidad intelectual y material de rebatirte con experimentos o argumentos. Por eso ha de poder comentar a posteriori sin la intercesión de ningún editor que le seleccione a priori. Y esto enlaza con el tercer punto.

3. Algo fundamental para que un hallazgo sea relevante es lo fiable que sea el hallazgo. En una red distribuida cualquiera la relevancia en la propia red de un individuo depende de su reputación y su reputación depende del valor que añada lo conseguido a su comunidad (cientifica o no) y, muy importante, de lo verificable que sea ese logro y del contexto en que se consigue. En el caso de un programador de software libre (paradigma de hacker) su verificación depende de que la línea de código que cree funcione o no y de la utilidad de esa línea de código. Eso le dará reputación. En el caso de un científico: su “impacto” depende de la relevancia de las conclusiones a las que llegue en sus estudios, conclusiones que deben atenerse estrictamente a sus resultados y éstos a los métodos con los que se han obtenido. Eso le dará la reputación. Y algo mas. Depende tambien de que sus conflictos de intereses estén meridianamente claros. Las conclusiones de un estudio sobre un fármaco pueden tener mucho impacto por ser científicamente muy relevantes y metodológicamente intachables aunque el científico esté patrocinado por la compañia que produce el fármaco. Pero las conclusiones de un estudio sobre un fármaco pueden no ser tan relevantes en la red si son científicamente muy relevantes pero metodológicamente discutibles y el científico está patrocinado por la compañia en cuestión. Si eso no se aporta se está ocultando una parte muy importante de la verdad, la verdad del contexto.

Si esos conflictos suceden en la ciencia y se ha considerado necesario su clarificación estricta por cada científico para el conocimiento de la verdad, a pesar de trabajar en un campo en el que la trazabilidad y verificación de los resultados es una rutina,  qué no debería de suceder en el periodismo… Y vuelvo a lo de las profesiones mas valoradas: periodismo y ciencia buscan la verdad en ambitos relevantes para la gente. El periodismo investiga verdades incluso más relevantes. Pero la diferencia entre ambas que hace que una sea reputada (y aporte, a criterio de los ciudadanos, valor añadido a la red) y la otra no, no es el acceso a herramientas que permitan la difusión libre, ni la relevancia de los hallazgos. La diferencia es la trazabilidad, veracidad y la revelación de los conflictos de intereses. Y esto se lo pueden aplicar los economistas, los historiadores, los sociólogos, los políticos y todos aquellos que aspiren a hacer “ciencia”. No vale sólo con poner la palabra en el nombre.

Minientrada

La primavera cientifica

10 Abr

Uno de los aspectos fundamentales en la transición hacia la ciencia hacker es la apertura completa de los trabajos de investigación. En estos momentos en que publicar y alcanzar una distribución global es tan fácil como escribir en este blog, las editoriales científicas han perdido el sentido. No queda mucho para que veamos que toda la ciencia que se publique sea abierta, pues las partes implicadas generadoras de la información salen ganando: las instituciones (financiadoras) se ahorrarian un buen pico y los científicos (ejecutores) podrían acceder a todo lo que quisieran. Hablaremos largo y tendido al respecto, pero de momento, un bocado de la mano de este buen reportaje en The Guardian y el editorial que lo acompaña.

Y aprovechando el mensaje, una llamada a la presión a nuestros propios gobiernos. Si el NIH, la Wellcome Trust o el Max Planck ya exigen la publicación en abierto de los estudios financiados con su dinero, con mas razón el FIS, que somos más pobres que ellos.

A %d blogueros les gusta esto: