Partenaire: ENSMA
Auteurs: Ladjel Bellatreche, Carlos Ordonez, Dominique Méry, Matteo Golfarelli, El Hassan Abdelwahed
Accès aux publications ici.
À l’ère de la « science des données et de l’analyse avancée », nous assistons à une course au développement de systèmes intelligents axés sur les données dans divers domaines tels que les affaires, la finance, la santé, l’environnement, la cybersécurité, etc. en raison de l’explosion des données émises par divers fournisseurs. Ce développement contribue à obtenir une valeur ajoutée pour les entreprises et les citoyens. Deux ingrédients complémentaires sont nécessaires pour garantir la valeur des systèmes : les données et les modèles. La dimension des données est principalement liée à la science des données qui unifie l’apprentissage automatique, les statistiques, l’exploration de données, les bases de données et les systèmes distribués. L’atteinte de cette valeur peut passer par l’augmentation des données d’entrée par des ressources telles que les Knowledge Graphs. Le succès des techniques ci-dessus dépend fortement de la qualité des données d’entrée et de la prise en compte d’autres propriétés non fonctionnelles liées aux aspects juridiques, éthiques et économiques. D’autre part, la modélisation joue un rôle crucial dans la science des données car elle couvre toutes les étapes du flux de travail de la science des données. En ce qui concerne la provenance des données et leur qualité, les modèles contribuent à fournir des solutions indépendantes des fournisseurs. Au niveau algorithmique, les modèles aident à expliquer le fonctionnement interne des méthodes/algorithmes utilisés aux concepteurs de systèmes, aux utilisateurs, aux régulateurs et aux citoyens afin d’instaurer la confiance et la responsabilité. Par conséquent, le succès de la science des données dépend de notre capacité à l’utiliser de manière intelligente et à exploiter simultanément les données et les capacités de modélisation.