Què és el Big Data?

El terme Big Data (dades massives) fa referència al conjunt de dades, els procediments d’aquestes dades i les aplicacions informàtiques, que s’allunyen de les tradicionals, a què han de ser processades, perquè ultrapassen la capacitat dels sistemes informàtics habituals.

El 2012 es considera el primer any on la capacitat d’emmagatzematge digital va superar l’analògica. Big Data és el volum d’informació que es mou o s’analitza a alta velocitat i que es troba guardat en el cloud computing.

Els diferents tipus de dades Big Data  es classifiquen en tres grups, dins els quals trobem divisions:

(Figura 1): Esquema classificació diferents tipus de dades Big Data. Font: Netmind.es

Les restriccions al maneig de dades

Tot i que no tota la informació és accessible, mai ha sigut tan fàcil utilitzar i compartir dades com avui dia.   Espanya, però, va ser l’últim país en aprovar una llei de transparència i en un rànquing, elaborat per dues organitzacions sense ànim de lucre, es troba en el lloc 64 de 99 lleis de transparència existents al món.

Les dades  “no pertanyen a ningú”, però els conjunts de dades poden estar restringits d’una manera semblant als casos de copyright, com a obra creativa.

L’editor d’una base de dades pot eliminar qualsevol tipus de restricció publicant la seva base sota una llicència pública o una dedicatòria al domini públic. D’aquesta manera,  té la possibilitat de realitzar noves visualitzacions o aplicacions, i es pot crear un vincle entre editor-públic, com és el cas de The Guardian amb el seu grup de visualització de dades en Flickr.

Existeixen tres classes de llicències obertes:

Domini públic: Màxima permissivitat. No hi ha condicions imposades.

Permissives o només d’atribució: L’única condició que s’imposa és la de reconèixer l’autoria.

Copyleft, recíproques o de compartir per igual: Requereixen ser compartides amb la mateixa llicència, encara que es publiquin modificades.

Obtenció de les dades

Per començar en el món del Big Data, els experts en el camp recomanen utilitzar fonts de dades totalment gratuïtes, ja que així no s’ha d’invertir temps a crear un Dataset propi. Per exemple, pot ser interessant analitzar dades que trobem a Facebook.  A través de Facebook Graph API se’ns permet accedir a la informació sobre el que comparteixen els usuaris a la xarxa social, que pot ser útil per analitzar el comportament d’aquests.

Les administracions públiques i organismes realitzen periòdicament estudis. Com és el cas del portal estadístic del Ministeri de Sanitat, que recentment ha actualitzat les dades sobre serveis hospitalaris.

Video explicatiu Open Data:

El Periodisme de dades

Les empreses analitzen Big Data per prendre millors decisions i establir moviments de negocis estratègics. Però, més enllà dels propòsits comercials de les empreses, la comunicació també ha incorporat Big Data en l’àmbit periodístic. Els mitjans de comunicació han considerat que és una oportunitat d’aportar dades a les històries per publicar narratives pròpies com a valor afegit i fet diferenciador.

Gràcies al Periodisme de dades, la informació que es troba al Big Data es pot transformar en formats mitjançant els quals es pot dur a terme la investigació periodística i, posteriorment, facilitar la seva comprensió al públic.

Periodisme de dades en perspectiva

Utilitzar dades per millorar les notícies i presentar-les de manera més estructurada és una pràctica que té història.

(Figura 2): Esquema història del Periodisme de dades

Beneficis d’utilitzar dades al periodisme

La tasca del periodista ja no és ser el primer a informar, sinó explicar el que significa realment el fet. El periodisme de dades ha generat valuosos serveis al públic.

(Figura 3): Esquema beneficis del Periodisme de dades

 Periodistes dedicats especialment a les dades

Per arribar a aquests beneficis, els periodistes han d’evitar una mala interpretació de les estadístiques i han de controlar la fiabilitat de les dades recopilades. Per aquest motiu, moltes redaccions, la majoria de l’EEUU, han incorporat un perfil de treballador diferent que coopera amb el periodista tradicional. Es tracta d’un professional, anomenat científic de dades, que té coneixement en Data Science.

(Figura 4): Equip de Periodisme de Dades. Font: TejiendoRedes

Propublica, a la seva secció de dades, de visualització i d’infografia, anomenada News Application, treballa amb tres o quatre programadors purs, considerats periodistes que utilitzen eines que no són les tradicionals, i dissenyadors que s’encarreguen de la visualització de les dades.

A Espanya, a dia d’avui, són poques les redaccions que tenen un equip especialitzat en dades. Per això, Civio i el grup de Periodisme de Dades, impulsats per l’èxit de la resta d’agrupacions  en altres parts del món, intenten promoure l’exercici de les dades al nostre país.

Interpretació de les dades

Aquesta presentació amb diapositives necessita JavaScript.

Presentació de les dades 

PIRÀMIDE INVERTIDA 

(Figura 5): Piràmide invertida Periodisme de Dades. Font: TejiendoRedes

Paul Bradshaw, professor de la Universitat de Birmingham, és l’impulsor de la piràmide invertida del Periodisme de dades que defineix les fases del procés de producció fins a arribar a la presentació de les dades. La piràmide invertida mostra com s’avança des d’una gran quantitat d’informació, que passa per diferents etapes, fins a arribar al punt de comunicar els resultats a l’audiència de la forma més entenedora possible.

És important pensar la forma amb la qual s’explicarà la informació perquè d’una bona presentació de les dades depèn que els ciutadans entenguin que representen les xifres i, sobretot, com afecten la seva vida, perquè l’objectiu és humanitzar les dades, donar-los un significat social.

El periodista ha de tenir en compte que no existeix un mateix tipus de lector i que el disseny ha de pensar en tots ells. Per tant, el gràfic amb què es presenti la informació ha de ser fàcil de comprendre, però també suficientment complex per la gent que vol anar més enllà.

La clau resideix en escollir la representació que volem donar a les nostres dades segons la conclusió que volem mostrar o l’objectiu, que pot ser:

  • Veure una informació familiar d’una manera nova
  • Mostrar el canvi al llarg del temps
  • Comparar valors
  • Mostrar connexions i fluxos 

  • Mostrar jerarquies

 

PRESENTACIÓ DEL TEMA (PREZI)

WEBGRAFIA

Crucianelli, Sandra. ( 8 de juny, 2013). ¿Qué es el periodismo de datos?. Consultat des de l’adreça URL: http://www.cuadernosdeperiodistas.com/que-es-el-periodismo-de-datos/

Data Centric. ( 23 de maig, 2017). ¿Qué es el Data Visualization o cómo interpretar grandes cantidades de datos?. Consultat des de l’adreça URL: http://www.datacentric.es/blog/geomarketing/data- visualization-analisis-datos/

Fallas, Hassel. ( 2 de novembre, 2017). Ventajas de usar datos en periodismo, según los alumnos del Máster en Investigación, Datos y Visualización de El Mundo. Consultat des de l’adreça URL: http://hasselfallas.com/2017/11/02/ventajas-de-usar-datos-en-periodismo- segun-los-alumnos-del-master-en-investigacion-datos-y-visualizacion-de-el- mundo/

Fernández, Paola. ( 15 de maig, 2015). ¿Qué es el periodismo de datos?. Consultat des de l’adreça URL: http://www.eldiario.es/norte/magazine/periodismo-datos_0_384611704.html

Interactivos.lanacion. Manual de Periodismo de Datos. Consultat des de l’adreça URL: http://interactivos.lanacion.com.ar/manual-data/

Mañé Vernia, Sonia. ( 4 de maig, 2017). El Big Data y el periodismo de datos; aprendiendo a comunicar números. Consultat des de l’adreça URL: http://www.iebschool.com/blog/big-data-y-el-periodismo-de- datos-big-data/

Monnetds. ( 8 d’agost, 2017). Cinco maneras de crear historias contadas por datos. Consultat des de l’adreça URL: http://www.monnetds.com/blog/analytics/cinco-maneras-de-crear-historias- contadas-por-datos/

Noguerol, Ana. ( 29 de febrer, 2012). Derechos “sui generis” sobre las bases de datos en Propiedad intelectual. Consultat des de l’adreça URL: http://www.eoi.es/wiki/index.php/Derechos_%22sui_generis%22_sobre_las_ba ses_de_datos_en_Propiedad_intelectual

Prieto, Gonzalo. ( 8 d’octubre, 2014). La llegada del ‘big data’ a la comunicación: el periodismo de datos. Consultat des de l’adreça URL: http://www.gonzaloprieto.es/2014/10/08/la-llegada-del-big- data-a-la-comunicacion-el-periodismo-de-datos/