Los datos masivos (Big Data) suponen un cambio tan importante para las empresas que puede resultar abrumador. El proyecto BigDataEurope se asocia con las empresas interesadas para proporcionarles una serie integrada de herramientas para manipular, publicar y utilizar recursos de datos a gran escala.
Si miramos la larguísima lista de proyectos financiados en el marco de Horizonte 2020 y el amplio abanico de temas tratados, sería fácil olvidar que el mayor programa de investigación e innovación de la UE hasta la fecha tiene por objetivo principal abordar siete grandes preocupaciones sociales: salud y bienestar; alimentación, agricultura y bioeconomía; energía; transporte; cambio climático; libertad y seguridad; y el lugar de Europa en un mundo cambiante.
Lo que resulta todavía más fácil de olvidar es que todos estos temas, aparentemente muy diferentes, y los sectores de actividad relacionados comparten una característica en común: el modo en que se beneficiarían de la innovación digital y, más específicamente, de los datos masivos.
Para garantizar que salgan beneficiados, el proyecto BigDataEurope (Integrating Big Data, Software and Communities for Addressing Europe's Societal Challenges) formó siete comunidades e intentó comprender mejor qué necesitarían de los datos masivos. El resultado es una plataforma capaz de obtener datos de diversas fuentes, que se pueden adaptar a medida para aplicaciones innovadoras objetivo asociadas con los siete desafíos de Horizonte 2020.
¿Qué lagunas se proponen cubrir con este proyecto y por qué es importante hacerlo?
Es ampliamente sabido que el análisis de los datos (masivos) influye profundamente en nuestra economía y en la sociedad en su conjunto. No obstante, es importante que las tecnologías correspondientes no solo estén disponibles para un puñado de empresas, sino que también puedan ser utilizadas extensamente por iniciativas y empresas más pequeñas, así como por el mundo académico y de la investigación.
BigDataEurope cubrió esta laguna primero ofreciendo una plataforma para desarrollar aplicaciones de datos masivos y, a continuación, debatiendo los requisitos y las aplicaciones piloto con comunidades que representan los desafíos sociales identificados por el programa marco Horizonte 2020.
¿Qué hace que su enfoque sea innovador?
Diversos eventos organizados con los grupos interesados provocaron que nos diésemos cuenta de que, además de volumen y velocidad, otro aspecto clave que debe abordarse en aplicaciones sociales es la variedad de datos.
Para atender este requisito, diseñamos y produjimos una capa de descripción de datos semántica para los datos masivos. Esta capa emplea gráficos de conocimientos y vocabulario, y permite a las comunidades desarrollar una comprensión común de sus datos, a la vez que interconecta e integra estos datos a escala técnica.
¿Cuáles fueron las principales dificultades a la hora de reunir todos estos grupos interesados y fuentes de datos? ¿Cómo las superaron?
Un desafío clave fueron las diferentes terminologías, culturas y prácticas de los grupos interesados, que también dieron lugar a requisitos y puntos de vista muy diversos. Mientras que, por ejemplo, los datos abiertos ya desempeñan un papel clave en las aplicaciones móviles, la anonimización, privacidad y seguridad de los datos son de crucial importancia en situaciones relacionadas con la atención sanitaria.
Afrontamos este desafío evitando desarrollar una plataforma genérica y, en su lugar, integrando componentes que desempeñan una función muy específica, por ejemplo el tratamiento de datos de transmisión o la anonimización. En consecuencia, el usuario puede combinar e integrar los componentes de gestión de datos más adecuados para cualquier hipótesis de aplicación concreta de la plataforma BigDataEurope.
¿Cuáles son las ventajas de integrar todos estos datos? ¿Puede proporcionarnos un ejemplo real?
El proyecto produjo siete demostradores que reflejaban el valor de los datos integrados para los diferentes retos de la sociedad. Incluían, por ejemplo, la previsión de atascos y del tráfico en las carreteras basándose en datos de sensores actuales e históricos, en combinación con información de redes sociales.
Otro ejemplo es la agricultura de precisión, destinada a proporcionar a plantas como las vides unos nutrientes, fertilización e irrigación óptimos en función de los datos de investigaciones y de clima.
Los resultados del proyecto, ¿estuvieron a la altura de sus expectativas iniciales? ¿De qué manera?
En general, la necesidad de tratar con una variedad de datos era algo con lo que ya contábamos y que se confirmó en las reuniones con las comunidades y partes interesadas. Gracias al enfoque de integración semántica aplicado en la plataforma, logramos dar un paso hacia delante, pero todavía tenemos mucho por andar para llegar a esa visión de un análisis e integración sin discontinuidades de grandes cantidades de datos con el mínimo esfuerzo. Además, en el futuro se deberá prestar más atención para tener en cuenta la privacidad de los datos y la soberanía de los proveedores de datos.
¿Cómo pueden las partes interesadas comenzar a utilizar su plataforma?
La plataforma, la documentación y las aplicaciones piloto son totalmente de código libre y están disponibles para su reutilización. Además, hay varios socios del consorcio BigDataEurope (incluyendo, por ejemplo, Fraunhofer) que están listos para proporcionar asistencia y soporte.
¿Cuáles son sus planes para después del proyecto?
Los miembros del consorcio están investigando el tema de la gestión de datos masivos en sus propios ámbitos. Por ejemplo, ya hay varios proyectos Horizonte 2020 de reciente lanzamiento que siguen manteniendo partes de la plataforma BigDataEurope y están ahondando en su aplicación en los sectores de la asistencia sanitaria y las ciencias de vida.