Cada persona produeix un seguit d’informació en format de dades, tant descomunal, que la majoria no s’imaginen ni que existeix. Aquesta informació es produeix al dia a dia de cadascú; quan paguem amb targeta de crèdit, quan naveguem per internet o utilitzem xarxes socials, quan pugem a un avió, quan fem servir un GPS, quan ens fan una recepta mèdica, quan paguem la hipoteca, etc. Totes aquestes dades, pel seu volum, la seva naturalesa diversa i la velocitat en què han de ser processades, traspassen la capacitat dels sistemes informàtics convencionals i s’ha hagut de buscar una forma “alternativa” d’emmagatzematge.

El Big Data “és el terme que afronta la feina de guardar, classificar, analitzar i compartir aquest cúmul massiu d’informació. (…) Gestionar un volum de dades descomunal a la major velocitat possible considerant la seva extraordinària varietat”. Aquest emmagatzematge és el que, alhora, fa créixer la informació i les dades. Per exemple, una ruta alternativa a la que proposa el GPS, permet valorar noves rutes a l’empresa que proveeix el seu software ja que l’alternativa queda emmagatzemada al Big Data.

“Si tots els bits i bytes de dades de l’últim any fossin guardats en CD’s, es generaria una gran torre des de la Terra fins a la Lluna i tornar”.

Aplicar el “Big Data” al periodisme és parlar de periodisme de dades i, en termes generals, es pot definir de les següents maneres:

Segons Flores i Salinas, el periodisme de dades “consiste en usar herramientas estadísticas y de visualización para contar mejor las viejas historias y descubrir nuevas historias que contar”.

“Periodisme de dades és l’especialitat o pràctica del periodisme que utilitza com a matèria primera i fonamental les dades (i no altres fonts d’informació), per tal de crear productes informatius diversos, com ara: articles amb dades, infografies o visualitzacions interactives amb dades i conjunts de dades en obert”.

El periodisme de dades començà amb el periodisme assistit per ordinador que va fer servir per primera vegada la cadena de televisió CBS l’any 1952 per predir els resultats de les eleccions presidencials.

Bill Dedman, l’any 1989, va analitzar els préstecs concedits per les entitats de crèdit d’Atlanta i va demostrar, mitjançant un reportatge a un diari, que als afroamericans se’ls exigia tenir el doble d’ingressos que als blancs per rebre diners a canvi d’interessos, i va crear un gran impacte per la qualitat del reportatge.

Progressivament, els periodistes han buscat analitzar dades públiques utilitzant mètodes científics i tecnologia. L’última, a mesura que avança, facilita l’anàlisi de grans quantitats de dades i aporta eines que serveixen tant per obtenir-ne com per extreure’n.

El periòdic britànic “The Guardian” és pioner en la utilització de grans quantitats de dades per efectuar-ne peçes informatives. Simon Rogers, que inicià la seva carrera en aquest diari, prengué protagonisme proclamant-se un dels gurus de la tendència més actual coneguda com: “data journalism”.

Més endavant, mitjans com “The New York Times” (Estats Units), “Le Monde” (França), o “La Nacion” (Argentina), s’han sumat a la corrent.

 Big Data i periodisme

“El periodisme de dades es basa en els conceptes de Big Data i Open Data, i la relació d’aquestes matèries amb els mitjans de comunicació”.

El periodisme de dades ofereix un tipus d’informació sincera; que no enganya si no és que està manipulada. Per entendre el concepte es proposa el següent exemple: “imagina’t que disposes de les xifres d’atur d’aquest any, les xifres de la pujada de preus, les xifres de la baixada de salaris i les xifres dels beneficis de les empreses més importants del país. Quina conclusió extreus de les dades?”; el poder de les dades és el fet que poden explicar-te tot el que necessites saber per informar. S’han de trobar, saber-les interpretar i comunicar-les en un context que permeti que la població entengui què representa aquesta xifra a la seva vida corrent (informació convenientment tractada).

El periodisme de dades es presenta en aquests moments per als periodistes com una gran oportunitat per injectar qualitat a la professió, perduda en la majoria de mitjans a causa de l’acceleració de la informació i de la retallada de personal a les redaccions per la crisi econòmica.

Les fases del periodisme de dades

Fonts d’informació i dades

Per començar, s’ha de buscar una font d’informació fiable; hi ha administracions públiques i organismes que realitzen estudis periòdics, per exemple. Tot i així, l’accés a dades oficials és molt complicat i se solen fer públiques dades antigues que pràcticament ja no incumbeixen a ningú. Igualment, les dades, tal com s’indica a la presentació del terme “Big Data”, són a tot arreu (codis de barres, targetes de crèdit,…) però sobretot a internet. Per tant, el ciutadà pot accedir a dades. El fet de capturar-les i analitzar-les és la part complicada.

La informació s’ha d’organitzar per poder-hi recórrer fàcil i ràpidament.

Un exemple són les dades obertes de la Generalitat de Catalunya (dades públiques):

Extracció i anàlisi de les dades

Hi ha extractors de dades útils per treballar amb grans quantitats.

El més important durant l’extracció i l’anàlisi de dades és trobar les més rellevants i contextualitzar-les/situar-les socialment per saber què signifiquen i construir històries amb fonaments.

Paul Bradshaw, professor de la Universitat de Birmingham i impulsor de la piràmide invertida del periodisme de dades, defineix les fases del procés de producció:

  • Recopilació de dades
  • Neteja: filtrar les dades que són fiables de les que no, les que ens són útils de les que no, etc.
  • Contextualització: conèixer la dada de morts per accident de cotxe pot ser interessant, però es converteix en rellevant quan es contextualitza amb les lleis de tràfic, per exemple. Es poden trobar causes probables i relacions entre unes dades i unes altres.
  • Combinació: utilitzar totes les dades necessàries per fonamentar la història.

Informar sobre dades

Decidir com s’explicarà la informació recopilada. Com més elements, millor, ja que faciliten la comprensió del contingut. Cal “humanitzar” les dades, dona’ls-hi significat social.

Sempre s’ha de mencionar la font d’on s’han extret les dades.

Un exemple d’eina que pot servir per bolcar dades i convertir-les en gràfics de forma ràpida és el “Google Fusion Table” (http://support.google.com/fusiontables/answer/2571232?hl=en)

Exemple d’informació sobre dades:

Relació amb la comunicació audiovisual

La consultora “GfK” realitzà un informe en el que s’exposa l’opinió dels responsables estratègics de 14 grups de mitjans de comunicació sobre com s’utilitzen les dades a la indústria de la comunicació audiovisual i què poden comportar, aquestes dades, al sector.

Philip O’Ferrall, vicepresident sènior de Viacom, afirmà que “fa sis mesos ens limitàvem a conceptes bàsics: audiències, tràfic en web o repercussió de les xarxes socials. Ara, comptem amb un equip d’intel·ligència de negocis dirigit per un doctor en matemàtiques. Cada estadística que manegem ens permet incrementar valor”.

El “Big Data”, però, va més enllà de l’ús de dades pures; es pretén conèixer el públic, entendre com i quan la gent està utilitzant els serveis i a través de quins dispositius. Per tant, per les emissores comercials que fins ara han tingut poca interacció amb el seu públic, aquest és un gran canvi.

A més, “tots els models de negoci de dades encara estan a l’etapa de pensar en ‘les nostres’ dades, més que en un ecosistema de dades. Al final, serà necessari treballar amb diferents fonts de dades perquè el ‘Big Data’ sigui eficaç”, reconeix Niko Waesche, capdavanter de la industria de mitjans i “entertainment” a GfK.

Aquest estudi, doncs, posa de manifest que el “Big Data” aportarà més eficiència en:

  • La “targetització” del públic.
  • Les vendes publicitàries.
  • La millora de la permanència.
  • La millora de l’eficiència de continguts i serveis.
  • Comptar amb més eines a l’hora de prendre decisions en quant a continguts, compres i vendes.

Conclusions

El terme “Big Data” està, actualment, completament estès a la societat tot i que és efímer, no és visible. Les tecnologies i les dades personals s’han globalitzat, el “Big Data” és qui s’encarrega que aquesta informació estigui ben recopilada, organitzada i pugui utilitzar-se.

L’ús del “Big Data” és important perquè els canvis tecnològics no sobrepassin la societat; la generació d’informació virtual (que és abundant) i l’emmagatzematge d’aquesta se sincronitzen.

Segons la meva opinió, el periodisme de dades s’enriqueix fent ús d’aquest “servei”; s’imposa per sobre del periodisme convencional perquè l’ús de dades facilita la lectura de la informació que transmet. La societat, progressivament però també ràpidament, s’adapta als canvis tecnològics que, en general, ofereixen un estil de vida més còmode. Per tant, si a aquests canvis s’hi suma que la informació que ofereix un diari, per exemple, és fàcil d’interpretar i més ràpida de comprendre, la persona la preferirà. Si a més a més, aquest diari és digital i es pot consultar mitjançant internet, o a través de les xarxes socials, és encara més còmode.

Per tant, oferint facilitat de lectura, actualment, penso que es capten més lectors i que se’ls facilita l’accés a la informació cosa que és positiva per la societat; una societat ben informada és una societat rica. Però no tan sols és aquest l’aspecte a favor del periodisme de dades; s’hi afegeix el fet de verificar, a partir de dades, que la informació que s’està transmetent és certa. Cosa que dóna una garantia al lector/usuari i permet generar informacions més acurades i completes al periodista.

Webgrafia