Socio: ENSMA
Autores: Ladjel Bellatreche, Carlos Ordonez, Dominique Méry, Matteo Golfarelli, El Hassan Abdelwahed
Accede a la publicación aquí.
En la era de la «Ciencia de datos y el análisis avanzado», estamos presenciando una carrera por desarrollar sistemas inteligentes basados en datos en varios dominios, como negocios, finanzas, atención médica, medio ambiente, ciberseguridad, etc. debido a la explosión de los datos emitidos por varios proveedores Este desarrollo contribuye a conseguir valor añadido para las empresas y los ciudadanos. Se requieren dos ingredientes complementarios para garantizar sistemas valiosos: datos y modelos. La dimensión de datos se relaciona principalmente con la ciencia de datos que unifica el aprendizaje automático, las estadísticas, la minería de datos, las bases de datos y los sistemas distribuidos. El logro de este valor puede pasar por el aumento de los datos de entrada mediante recursos como Knowledge Graphs. El éxito de las técnicas anteriores depende en gran medida de la calidad de los datos de entrada y de la consideración de otras propiedades no funcionales relacionadas con aspectos legales, éticos y económicos. Por otro lado, el modelado juega un papel crucial en la ciencia de datos, ya que cubre todos los pasos del flujo de trabajo de la ciencia de datos. En cuanto a la procedencia de los datos y su calidad, los modelos contribuyen a proporcionar soluciones independientes del proveedor. A nivel algorítmico, los modelos ayudan a explicar el funcionamiento interno de los métodos/algoritmos utilizados a los diseñadores de sistemas, usuarios, reguladores y ciudadanos para lograr confianza y responsabilidad. Por lo tanto, el éxito de la ciencia de datos depende de nuestra habilidad para usarlo de manera inteligente y, al mismo tiempo, explotar las capacidades de modelado y datos.