¡Más datos, es la guerra!

No digo nada nuevo si afirmo que el papel de los datos es cada vez más relevante para los profesionales de la información. Cada vez hay más conjuntos de datos disponibles y accesibles a través de la Red. El “periodismo de datos” (o ‘data journalism‘) se ha popularizado considerablemente en los últimos dos años, siendo el británico The Guardian uno de sus más fieles defensores y promotores, usando como tribuna destacada su Datablog, bajo el lema “los hechos son sagrados” (Facts are Sacred).

Dentro de esa disciplina periodística ha cobrado gran importancia la “visualización” de datos; somos todos testigos cada día de la popularidad que han alcanzado las “infografías” en la presentación, sobre todo, de datos estadísticos en la prensa. Pero, el hecho cierto es que, tras la explosión de fenómenos como el de Open Data que afecta, sobre todo, a las fuentes y los conjuntos de datos gestionados por las Administraciones Públicas, es cada vez más importante saber tratar esos datos que, generalmente, se publican de forma masiva y en formatos poco “amigables” para su tratamiento automático con herramientas ofimáticas genéricas.

Tanto es así, que cada vez aparecen más servicios y herramientas en la Web que pueden ser de ayuda a cualquier persona que asuma una labor informativa y tenga que enfrentarse a alguno de esos conjuntos de datos. Tasneem Raja, editora digital de Mother Jones y anterior colaboradora de The Bay Citizen, ofrecía hace poco, en un encuentro que tenía lugar en San Francisco bajo el título de Riding the Data Wave: Tools to Make Open Data Relevant algunas ideas básicas y comentaba un puñado de herramientas que pueden resultar de utilidad a cualquier periodista ciudadano que se enfrente a la árida tarea de bucear en los datos que publican las administraciones locales, regionales o nacionales.

Google Refine. Se trata de un proyecto alojado en Google Code que ha evolucionado a partir de Freebase Gridworks, una herramienta de software libre para el tratamiento de los datos publicados en la comunidad de ‘Open Data‘ del mismo nombre. Se trata de una herramienta muy potente para filtrar, limpiar, ordenar, … refinar conjuntos de datos e incluso cambiarlos de formato y/o combinarlos (enriquecerlos) con otros datos de sitios como Freebase. Hay disponibles descargas gratuitas para plataformas Windows, Apple y Linux.

Tablesorter. Se trata de un plugin jQuery (un añadido para tu navegador) que te permite transformar tablas HTML normales en tablas “ordenables”, tal como muestra su autor en un ejemplo. Se trata de una herramienta sencilla y potente para el geek habituado a trabajar con documentos HTML en crudo; pero quizás un poco árida para la persona no iniciada.

Mr. Data Converter. Es una aplicación visual, ofrecida como un servicio vía web que te permite convertir el formato de los datos, del habitual Excel (o de un CSV -datos separados por comas- estándar) a la mayoría de los formatos estándar más utilizados en la Web (XML, JSON, HTML, etc.).

Geocommons. Se trata de una comunidad pública de usuarios de GeoIQ, una herramienta para el análisis de flujos de datos geolocalizados en tiempo real. En su sitio web te ofrecen la posibilidad de subir conjuntos de datos geográficos estándar de cualquier sistema de información geográfica (GIS), -generalmente publicados en formato vectorial, como ‘shapefile‘-, para su visualización sobre los populares Google Earth o Google Maps, que utilizan el formato KML. Para desarrolladores, también ofrecen la posibilidad de utilizar la API REST de GeoIQ.

Hay muchas más herramientas que nos pueden ayudar a convertir datos en información; y esta en historias que valgan la pena ser contadas… Podéis probar también con Google Fusion Tables, Many Eyes -el experimento de visualización de IBM-, Google Charts o Timetric que te permiten publicar todo tipo de diagramas en tu propio sitio web, sin programar.

Imagen | Flickr de Steven Vance