Computational Journalism: ¿Periodismo o Informática?

Hoy me he decidido a escribir esta entrada a raíz de un artículo homónimo aparecido recientemente en la revista Comunications de la ACM (Association for Computer Machinery) que nos ‘retuiteaba’ nuestro querido Howard Rheingold. Esta publicación es toda una institución para el gremio de la informática, la electrónica y las comunicaciones en EE.UU. y en el mundo; de manera que, teniendo en cuenta que pertenezco al gremio, no es de extrañar que me llamara la atención, sobre todo si leemos su subtítulo: “How computer scientists can empower journalists, democracy’s watchdogs, in the production of news in the public interest“.

Acostumbrados a hablar del “Periodismo de Datos” ‘Data-Driven Journalism’, este concepto de ‘Computational Journalism‘ -que podríamos traducir como “periodismo informático”-, quiere ir más allá de la simple explotación de los filones informativos que podemos encontrar en la Red, sistematizando los procesos que relacionan las comunidades y grupos sociales con la información que las condiciona y que generan. En el artículo de marras lo expresan en esos términos (la negrita es mía):

Researchers and journalists are exploring new methods, sources, and ways of linking communities to the information they need to govern themselves. A new field is emerging to promote the process: computational journalism. Broadly defined, it can involve changing how stories are discovered, presented, aggregated, monetized, and archived. Computation can advance journalism by drawing on innovations in topic detection, video analysis, personalization, aggregation, visualization, and sensemaking“.

El texto, condicionado por la rigurosidad científica de la publicación en la que aparece, ofrece una contextualización histórica de los medios sociales a que estamos acostumbrados aquí, dando algunas claves y casos de estudio relacionados con el reinado de las máquinas fotocopiadoras en los años 1960 y la explosión de las bases de datos relacionales en las décadas posteriores de 1970 y 1980, destacando el caso de Elliot Jaspin, del Providence Journal  que fundara el National Institute for Computer-Assisted Reporting, una parte de la comunidad de Investigative Reporters and Editors promocionando y popularizando el “periodismo de bases de datos“.

Esta disciplina del periodismo informático, que apenas comienza a desarrollarse, aparece como un espacio de oportunidades para la innovación, tanto tecnológica como de procesos y de negocio. Los autores del artículo de marras parten de las conclusiones obtenidas en un taller de una semana que organizaba en 2009 el Centro de Estudios Avanzados en Ciencias del Comportamiento de Stanford y que se publicaban bajo el título de “Accountability Through Algorithm: Developing the Field of Computational Journalism. Report from Developing the Field of Computational Journalism“.

A partir de ese trabajo, se identifican cinco áreas, cuyo desarrollo definirá este nuevo periodismo y que pueden aportar al lector una guía para entenderlo:

  1. La combinación de información de diversas fuentes digitales, que ha dado lugar a la evolución de los estándares de sindicación, la consolidación de sistemas de etiquetado semántico o la aparición de fenómenos como el de ‘crowdsourcing‘ y el de filtraje cooperativo de contenidos (‘content curation‘).
  2. La extracción de información y el reconocimiento de “entidades”, que se ha desarrollado de la mano de la ingeniería lingüística y el procesamiento del lenguaje natural (NLP, Natural Language Processing).
  3. La exploración documental y la redundancia, que ha impulsado la investigación en el ámbito de las ciencias de la documentación y de la información, como la biblioteconomía.
  4. La indexación de los contenidos audiovisuales, verdadero desafío en plena era de los contenidos audiovisuales generados por el usuario.
  5. El minado de datos a partir de informes y formularios oficiales/gubernamentales, el área menos desarrollada técnicamente y que impacta en procesos que exigen aún un trabajo de digitalización y estructuración de grandes cantidades de documentos para su posterior minado y explotación.

Tan importante como estructurar esas oportunidades para la innovación es poder implementar nuevos modelos organizativos y de negocio que saquen partido de este nuevo escenario apalancando la potencialidad de las infotecnologías en cada una de esas áreas; y aunque en el artículo no se preocupan de profundizar en esa línea, si nos señala algunos casos de estudio que ya florecen en un terreno abonado para la innovación: Jigsaw, CMU Sphinx, DocumentCloud, una iniciativa de The New York Times y ProPublica, Talking Points Memo, el proyecto de ‘crowdsourcing’ MPS Expenses lanzado por The Guardian, un pionero en el periodismo de datos, o la iniciativa de participación ciudadana de Public Insight Network, lanzada desde American Public Media.

Al lector interesado en el tema quizás le pueda ayudar más el enfoque de Nick Diakopoulos (School of Communication and Information, Rutgers University) que, en un reciente artículo “A Functional Roadmap for Innovation in Computational Journalism“, ofrece una perspectiva del proceso periodístico señalando los ámbitos en que la innovación tecnológica puede ayudar a la labor periodística: recolección de información, organización y puesta en valor, comunicación y presentación, diseminación y realimentación de la respuesta del público objetivo. En su visión, el ámbito del Computational Journalism incluiría áreas de conocimiento directamente relacionadas con la recuperación de información, la inteligencia artificial, la ingeniería lingüística, los sistemas recomendadores, las ciencias de la Web, de la documentación y la información (biblioteconomía); incluyendo lo que se ha conocido tradicionalmente como ‘Computer-Assisted-Reporting‘ o el periodismo de datos (‘Data-Driven Journalism‘).

Mientras llegan a las facultades universitarias españolas iniciativas como las de Columbia University Graduate School of Journalism, la Northwestern University’s Medill School of Journalism o el pionero Georgia Institute of Technology, seguiremos promoviendo desde aquí el desarrollo del fenómeno del periodismo ciudadano, compartiendo experiencias y ofreciendo nuestro conocimiento instrumental y del medio.

Imagen | Mapa de palabras creado con Wordle