Resumen
En el presente artículo se analiza el uso de datos masivos de titularidad pública (Open Data) con fines comunicativos y de negocio por parte de las organizaciones. Los objetivos son identificar las estrategias comunicativas que se están desarrollando en este sentido, el marco regulador en que tienen lugar y su impacto en la generación de valor. Para ello se ha profundizado en dos casos significativos en el uso de Open Data: la Biblioteca Nacional de España y el Portal de Datos Abiertos de la Junta de Castilla y León. Se ha observado que la riqueza que aporta el uso de datos está en relación con el tipo de filtrado que se realiza, si bien se constata que predominan elementos como la personalización e interacción con los usuarios para la generación de valor.
Abstract
This article analyzes the use of publicly-owned massive data (Open Data) for communicative and business purposes by organizations. The objectives are to identify the communicative strategies that are being developed in this regard, the regulatory framework in which they take place and their impact on the generation of value. To this end, two significant cases of Open Data use have been investigated: the National Library of Spain and the Open Data Portal of the Junta de Castilla y León. It has been observed that the richness provided by the use of data is in relation to the type of filtering carried out, although it is found that elements such as personalization and interaction with users predominate for the generation of value.
Introducción
España es uno de los países que está encabezando el avance institucional hacia el uso de los Datos Abiertos como sistema de participación y rentabilidad económica de los mismos, tal y como se refleja en el informe del European Data Portal, Analytical Report 13 (2019), que sitúa a España, junto a Irlanda y Francia, como referente en el uso de buenas prácticas del Open Data. Los parámetros analizados en el estudio son el marco político, el portal, la calidad y el impacto de los mismos.
La postura adoptada por España en este sentido es importante teniendo en cuenta como señalan Smolan y Erwitt (2012) que estamos ante la época con más capacidad de datos almacenados. Datos todos ellos que se están integrando en la rutina social diaria de manera que, tal y como se indica en Mosco (2014:4) implican cuestiones «económicas (¿quién paga por ello?), políticas (¿quién lo controla?), sociales (¿cómo se gestiona la privacidad?), medioambientales (¿cuál es el impacto sobre el terreno y el uso energético?) y culturales (¿qué valores implican?)».
En dicha reutilización del Open Data es necesario tener presente que se trata de datos de titularidad pública, cuya utilización ha de estar enmarcada en un marco regulador que atienda a los principios de igualdad y privacidad. Ha de haber por tanto un equilibrio entre la privacidad y el uso, teniendo en cuenta el impacto económico producido a partir de la reutilización de dichos datos.
Además, Burrows y Savage (2014), explican que los usuarios aportan los datos con voluntariedad y mediante la aceptación de una serie de premisas interpuestas a priori. Hecho que refleja que una de las partes acepta una serie de condiciones a cambio de servicios; de manera que dicha interrelación no debe producirse en una sola dirección, sino que existe una reciprocidad directa en la satisfacción de intereses.
En el uso de datos masivos, tal y como indican Mayer Schönberger y Cukier (2013:17) «el cambio de escala ha conducido a un cambio de estado. El cambio cuantitativo ha llevado a un cambio cualitativo». Dicho cambio cualitativo toma como base el análisis del comportamiento social combinado con modelos predictivos.
Para Kitchin (2014:262) la captura de datos en bruto debe producirse en torno a poblaciones enteras de sistemas, y la clasificación de los mismos debe llegar al máximo detalle a través de campos comunes que permitan flexibilidad y escalabilidad en el uso.
Dichas conexiones necesitan de un almacenaje, procesamiento y distribución de los datos, así como de las aplicaciones y servicios para individuos y empresas que están implicados en lo que se conoce como computación de la Nube (Mosco, 2014:17). Por tanto, la gestión de los datos masivos en la Nube es el principio de todo este nuevo universo, permitiendo abordar respuestas personalizadas en función de las características de los datos.
Ello se traduce en un interés vital de las organizaciones en formar parte de esta estructura, y así poder conformar relaciones con los usuarios para anticiparse a las necesidades. Téngase en cuenta, como indican Chakravorti y Chaturvedi (2017:16) que las cuatro variables fundamentales del desarrollo digital son las condiciones de soporte, el entorno institucional, el
cambio y la innovación y las condiciones de demanda.
Evidentemente, en este entorno se abre la puerta a la automatización de la anticipación
(Lyon, 2014:6), predicción, micro-segmentación y prescripción. Contexto en el que es necesario plantear un marco legal que establezca un protocolo definido en los usos.
Un factor clave es el avance en el procesamiento de los datos, permitiendo manejarlos de forma escalable y flexible. Téngase en cuenta que, tal y como señala Siegel (2013), la predicción se alimenta del recurso natural más potente: la información. Para ello se utilizan estadísticas junto con algoritmos de minería de datos. El objetivo es identificar patrones y construir modelos para llegar a predecir.
Tal y como señala Bertolucci (2013) la palabra clave es dataficación, en tanto que el corazón de muchas estructuras empresariales es la infraestructura en torno a la información.