XPLOR: le reporting nouvelle génération

Les techniques d’analyse multidimensionnelle sont actuellement bien maitrisées pour toutes les données quantitatives disponibles sur les systèmes d’information des entreprises ou des administrations à condition que le SGBD s’y prête, que le schéma de la base soit adapté et que les données soient de la qualité (homogènes, à jour, complètes, granularisées, compatibles,…). Il est toujours possible d’extraire les données utiles vers une base construite sur mesure pour la fouille multidimensionnelle, en réalisant, au passage, toutes les corrections nécessaires à leur exploitation. Par contre, pour les données textuelles issues de l’ensemble des sources électroniques ce type d’analyse est difficile à mettre en place : les données sources n’ont pas les mêmes formats ou sont même non structurées, elles sont réparties, hétérogènes et la multitude des cas rencontrés ne permet pas de trouver une structure universelle ou les regrouper. Afin de pouvoir standardiser la fouille multidimensionnelle sur les données textuelles de toutes provenances, des premiers travaux de recherche sur cette thématique ont lieu au sein de l’équipe Exploration et Visualisation d’Information (EVI) de l’Institut de Recherche en Informatique de Toulouse (IRIT) [Dousset, 2001][Ghalamallah, 2009], qui propose une structure unifiée permettant de stocker toutes les relations inter items rencontrées dans les documents analysés. Cette technique permet de construire des cubes croissants deux variables quelconques et le temps. Un premier outil Xplor a ainsi été proposé en 2001 pour mettre en ligne ce type de structure en mode client serveur, afin de réaliser une fouille personnalisée via divers outils de restitution graphique des résultats. Toutes les données textuelles sont alors dans une même structure et bénéficient donc d’outils communs d’investigation interactive.
L’un de nos objectifs est de proposer un Système d’Information d’Intelligence Economique qui permet aux utilisateurs potentiels d’obtenir une analyse synthétique, en facilitant l’interprétation des résultats et la navigation entre les différents indicateurs d’analyse. Cela permet de mettre en évidence les éléments stratégiques d’un bon reporting.
Il est possible avec un tel modèle de pousser plus loin l’analyse en traduisant de façon dynamique l’évolution du relationnelle dans les réseaux des inventeurs, les réseaux des chercheurs, les réseaux sémantiques, les alliances, les fusions, les acquisitions, les concurrence, etc. par le biais de l’analogie espace/temps.

tetralogie