Quels sont les avantages de virtualiser les données ?
La complexité des SI actuels, la diversité et la dispersion des données de l’entreprise rend de plus en plus difficile le travail d’intégration et de gouvernance nécessaire pour traiter les données de l’entreprise et les valoriser. Plutôt que jongler avec cette complexité, la data virtualisation apporte une couche d’abstraction qui rend les utilisateurs indépendants du format, de la localisation, des technologies et des protocoles de stockage et d’accès aux données. Plutôt que dupliquer ou répliquer les données, comme le font d’autres solutions du marché, notre plateforme fournit un accès à la demande et en temps réel aux données, sans les sortir de leurs stockages d’origine. Les avantages sont nombreux. Sans duplication ni réplication, les utilisateurs accèdent à la donnée temps réel, et pas à une donnée datée. Les besoins en infrastructures nécessaires pour intégrer en point à point de multiples sources et formats de données sont réduits, ainsi que les charges de travail nécessaires pour gérer un nombre d’objets physiques désormais inutiles. L’abstraction des données confère à notre solution des propriétés d’agilité aujourd’hui très appréciées des clients. Tout est plus simple, plus rapide, on peut diviser par 10 les temps de mise à disposition de jeux de données.
Etes-vous en train de réinventer le Data Mesh ?
Disons plutôt que nous apportons une solution technologique capable de mettre en œuvre une approche Data Mesh. Dans ce mode, chaque département est responsable de ses données, de leur qualité, et des traitements permettant de fournir à la demande des calculs sur ces données.
Nous apportons une notion de d’abstraction des formats de données, nous pouvons créer des produits de données croisant des myriades de sources hybrides et les exposer sous forme de contrat, quelle que soit l’origine des données. En guise de raccourci, on pourrait dire que Denodo met en œuvre des notions de Data Mesh en y apportant la modélisation sémantique, de la gouvernance, les politiques de sécurité et du traitement massif en parallèle pour livrer la donner en temps réel dans un format standardisé (SQL, API ou Data market place)
Que proposez-vous en matière de gouvernance et de sécurité ?
La sécurité est plus que jamais indispensable, quel que soit le secteur d’activité des clients. Ce qu’ils attendent c’est de pouvoir masquer certaines données, voire même certains champs des données, aux utilisateurs n’étant pas habilités à y accéder. Avec des notions d’Attribute Based Control (ABAC), il est tout à fait possible de le faire, de créer par exemple une règle de masquage que l’on pourra déployer automatiquement sur la plateforme, sans avoir besoin d’appliquer quoi que ce soit au niveau de la couche de stockage physique des données. Il en est de même pour le chiffrement. La plateforme peut s’intégrer avec des solutions tierces pouvant même chiffrer des données par étiquetage (ABE, pour Attribute Based Encryption). A titre d’exemple, seul un collaborateur RH disposera des clés de déchiffrement des champs RH contenus dans un dossier de salarié, alors que tous les autres collaborateurs ne verront que les champs non masqués. Et évidemment, tous les accès aux données sont tracés de façon centralisée par notre plateforme. On sait donc qui a accédé à quoi, et à quel moment.
Quelle utilisation faites-vous de l’Intelligence Artificielle ?
Au sein même de notre plateforme, l’IA est utilisée pour analyser son utilisation, voir quels data products sont les plus consommés et par qui, ce qui permet de proposer des recommandations de produits de données aux utilisateurs qui ont besoin d’accéder à telle et telle donnée. Nous faisons également de l’analyse de performance des requêtes, ce qui permet par exemple aux administrateurs d’éviter une requête longue alors qu’un agrégat récent de données apporte un niveau de réponse suffisant, ne nécessitant pas de relancer un calcul complexe. Avec l’arrivée de l’intelligence artificielle générative, on peut imaginer qu’un jour les utilisateurs exprimeront leur besoin en langage naturel, et que la plateforme construira immédiatement la requête SQL répondant à leur attente.