La fragmentation de l’écosystème des données nuit à la fiabilité de l’IA

Les entreprises misent beaucoup sur l’IA. Les attentes sont simples : des décisions plus rapides, des connaissances plus pointues et des performances évolutives. Mais il y a un goulot d’étranglement, et il est plus important que la plupart des gens ne le pensent. Il ne s’agit pas de l’algorithme. Ce n’est pas la puissance de calcul. Il s’agit des données fragmentées. Les entreprises définissent les termes clés, qui sont à la base de la logique commerciale, différemment d’un système à l’autre. Pour une équipe, un client est une personne qui a acheté quelque chose au cours des 90 derniers jours. Pour une autre, toute personne ayant cliqué sur un e-mail marketing est un client. Si vous intégrez ces deux systèmes dans un seul modèle d’IA, vous ne simplifiez pas la complexité, vous la multipliez.

Christian Kleinerman, vice-président directeur des produits chez Snowflake, le dit directement : « Le plus grand obstacle auquel nos clients sont confrontés lorsqu’il s’agit du retour sur investissement de l’IA n’est pas un concurrent, c’est la fragmentation des données. » Lorsque votre IA ne sait pas à quelle définition se fier, ses résultats perdent en précision et en pertinence. Cela nuit à la confiance dans ce qui devrait être l’un de vos avantages stratégiques les plus puissants.

Les entreprises confrontées à ce problème consacrent des heures, voire des semaines, à réconcilier des définitions de données contradictoires avant même de pouvoir commencer à déployer des modèles. Cela retarde les déploiements, augmente les coûts et fait perdre un temps précieux aux ingénieurs. Pire encore, cela freine l’élan. Si votre équipe dirigeante investit massivement dans l’IA et que vous vous disputez encore sur la signification d’un « abonné résilié », vous ne travaillez pas à plein régime.

Ce n’est pas pour rien que Snowflake a franchi le cap du milliard de dollars de chiffre d’affaires trimestriel en mai. Les fonctions d’IA ont stimulé la demande, et plus de 6 100 clients utilisent ses fonctions d’IA chaque semaine. Mais même Snowflake affirme que le véritable obstacle est le chaos sémantique. Si l’on veut que l’IA prenne de l’ampleur, il faut d’abord aligner les définitions des données.

L’initiative d’échange sémantique ouvert (OSI) unifie les définitions des données commerciales

Plus d’une douzaine d’acteurs technologiques sérieux se sont associés pour résoudre ce problème. Il ne s’agit pas simplement de créer un nouveau produit, mais de corriger un défaut fondamental. Snowflake, Salesforce, Tableau, BlackRock, dbt Labs et d’autres ont lancé l’initiative Open Semantic Interchange (OSI). L’objectif est clair : créer le premier langage universel et neutre pour la sémantique des données d’entreprise.

Pourquoi ? Parce qu’il n’existe aucune norme. La plupart des outils de données utilisent un code propriétaire, des interprétations de la logique d’entreprise qui ne sont pas reliées entre elles. C’est pourquoi les modèles d’intelligence artificielle se cassent la figure lorsque les définitions changent d’une plateforme à l’autre. L’OSI vise à résoudre ce problème grâce à un modèle unique et ouvert que toutes les plateformes peuvent adopter. Il ne s’agit pas de propriété. Il s’agit d’un accord. Un accord sur la signification des données.

Southard Jones, directeur général de Tableau, l’explique simplement : « L’avenir de l’IA dépend de la confiance, et la confiance commence par des données cohérentes et fiables. » Tableau met à disposition ses dizaines d’années d’expérience dans la définition de la logique métier pour aider à faire avancer le plan OSI. Il ne s’agit pas de construire des murs. Ils connectent les systèmes de la bonne manière.

La plateforme Aladdin de BlackRock, qui fonctionne à partir de données intégrées sur les marchés mondiaux, s’intéresse déjà à l’OSI pour ses applications financières. « Nous sommes ravis de participer à l’Open Semantic Interchange », a déclaré Diwakar Goel, responsable mondial d’Aladdin Data, « afin de contribuer à l’établissement d’une spécification commune et neutre qui rationalisera l’échange de données et accélérera l’adoption de l’IA. »

Il s’agit d’une infrastructure de base pour les opérations numériques. En agissant maintenant, les décideurs peuvent améliorer le temps de visibilité, réduire les corrections manuelles et rendre leur pile d’IA fiable à l’échelle. L’IA n’est efficace que lorsque les définitions des données sont alignées. Cet alignement commence ici.

La norme ouverte et neutre de l’OSI accélère l’évolutivité de l’IA

La plupart des normes de métadonnées ont été conçues pour une autre époque. Elles n’ont pas été conçues pour prendre en charge le contexte de l’IA, l’utilisation en temps réel ou la logique propre à l’entreprise. C’est pourquoi elles n’ont pas été à la hauteur. Les agents d’IA d’aujourd’hui ont besoin de clarté, et pas seulement de structure. Ils ont besoin de définitions standard qui comprennent comment les entreprises décrivent les clients, le chiffre d’affaires, le taux de désabonnement et des centaines d’autres termes, de manière native et sans retraduction.

C’est ce que l’OSI est en train de résoudre. Il n’est pas conçu pour les plateformes, mais pour les résultats. À la base, OSI prend en charge les modèles analytiques basés sur SQL, mais il inclut également des instructions spécifiques à l’IA telles que les synonymes et les métadonnées personnalisées. Cela signifie que les agents d’IA peuvent enfin travailler à partir d’une source unifiée de vérité et appliquer une logique cohérente à travers les outils, les équipes et les environnements. Cela élimine toute ambiguïté et accélère le déploiement.

Christian Kleinerman, de Snowflake, a souligné ce que l’OSI a de différent : il est le premier à répondre aux besoins spécifiques de l’IA tout en s’inscrivant dans des modèles de mise à l’échelle tels que SQL. Il s’agit d’une avancée indéniable, car elle apporte clarté et efficacité opérationnelle à un espace qui a été fragmenté et surchargé par des définitions inadaptées.

François Lopitaux, vice-président directeur de la gestion des produits chez ThoughtSpot, a expliqué clairement l’impact : « Aujourd’hui, les modèles d’IA sont souvent contraints de déduire des relations à partir de métadonnées brutes, ce qui peut conduire à des interprétations erronées et à des résultats inexacts. » OSI met fin à ces conjectures. En codifiant le véritable contexte commercial dans une norme cohérente, il donne aux systèmes d’IA une base sur laquelle ils peuvent compter.

Pour les chefs d’entreprise, il s’agit d’une question de contrôle et d’échelle. Passer d’une sémantique propriétaire à une spécification ouverte et neutre ne réduit pas les performances, mais améliore l’agilité. Les modèles d’IA s’exécutent plus rapidement, le provisionnement devient plus fluide et les pipelines de décision se stabilisent. L’OSI permet aux entreprises de construire des infrastructures d’IA durables sans être bloquées par des définitions de métadonnées obsolètes.

La compatibilité immédiate avec les outils d’analyse existants améliore la productivité.

L’un des points forts d’OSI est la rapidité de mise en œuvre. OSI a été conçu pour fonctionner avec des définitions YAML, qui sont déjà largement utilisées par les piles analytiques modernes. Cela permet une compatibilité instantanée avec des outils tels que la couche sémantique de dbt, permettant aux équipes d’adopter le standard immédiatement sans avoir à refaire les modèles fondamentaux ou les processus de travail.

Il s’agit là d’une victoire importante pour les équipes d’ingénierie et de données. Vous ne partez pas de zéro. Vous étendez ce qui a déjà été construit.

Ryan Segar, Chief Product Officer chez dbt Labs, l’a bien résumé : « Les ingénieurs en données et en analyse pourront désormais travailler avec la certitude que leur travail pourra être exploité dans l’ensemble de l’écosystème des données. Les reprises et le double travail appartiendront au passé ». Cette déclaration met le doigt sur ce qui compte le plus : la rapidité, l’efficacité et la réutilisation.

Pour les entreprises qui gèrent des dizaines de tableaux de bord, de pipelines de données et d’applications métier, il s’agit là d’un véritable gain de productivité. En permettant aux couches sémantiques de communiquer entre les outils et les plateformes, l’OSI réduit les temps de cycle et élimine les goulets d’étranglement. Il protège également les investissements antérieurs, ce qui évite les changements d’outils et les recyclages inutiles.

C’est sur ce point que les dirigeants doivent se concentrer : L’OSI n’est pas seulement une meilleure approche technique, elle réduit les frictions dans l’ensemble du modèle opérationnel. Elle est prête à dynamiser les flux de travail dès aujourd’hui, et non dans deux trimestres. C’est important lorsque le temps est un avantage concurrentiel. Déployez plus rapidement, réutilisez davantage et supprimez les redondances de votre pipeline d’IA en utilisant une infrastructure déjà en place.

La normalisation des données déplace la concurrence vers l’innovation à valeur ajoutée

Dans les technologies d’entreprise, la différenciation vient traditionnellement de la manière dont les plateformes structurent et définissent les données. C’est en train de changer. L’OSI supprime cette couche en tant que variable concurrentielle et met l’accent sur ce qui doit l’être : l’innovation produit, la performance de l’IA et l’expérience de l’utilisateur. Lorsque la sémantique des données est normalisée sur toutes les plateformes, l’avantage stratégique se déplace vers celui qui peut en faire plus, et non vers celui qui contrôle la définition.

C’est une bonne chose pour les entreprises. Les fournisseurs n’ont plus besoin d’investir des ressources dans l’interprétation de données propriétaires. Au lieu de cela, ils sont libres de canaliser leurs efforts vers la création d’agents d’IA hautement compétents, d’expériences d’analyse plus intelligentes et d’une meilleure automatisation des flux de travail. Cela place la barre plus haut pour les résultats à valeur ajoutée, et pas seulement pour la capacité de l’infrastructure.

Southard Jones, Chief Product Officer chez Tableau, l’a bien expliqué : « La normalisation n’est pas un facteur de banalisation, c’est un catalyseur : « La normalisation n’est pas un facteur de banalisation, c’est un catalyseur… Notre objectif est d’être l’appareil le plus intelligent, le plus intuitif et le plus puissant que vous puissiez connecter à vos données. » Cela renforce un changement plus large : la capacité à produire un impact plus rapidement devient maintenant le véritable facteur de différenciation.

François Lopitaux, de ThoughtSpot, s’est fait l’écho du même sentiment, soulignant que même dans le cadre d’une norme commune, les fournisseurs se distingueront par leur expérience utilisateur et la rapidité avec laquelle ils peuvent fournir des informations à grande échelle.

Pour les responsables de haut niveau, cette évolution est importante. Lorsque les normes arrivent à maturité, le coût du passage d’une technologie à l’autre diminue, mais les possibilités d’obtenir de meilleurs résultats augmentent. C’est donc l’innovation, et non le verrouillage technique, qui constitue votre principal levier de croissance. Lorsque vos équipes travaillent sur la base de définitions de données alignées, leurs résultats deviennent plus clairs, plus rapides et plus exploitables dans l’ensemble de vos opérations.

La gouvernance collaborative et la demande croissante des entreprises favorisent l’adoption de l’OSI

La rapidité et l’intérêt suscités par l’OSI ne sont pas le fruit du hasard. Les grandes entreprises réclament des solutions, et les sociétés à l’origine de l’OSI répondent par un modèle de gouvernance fondé sur le partage des responsabilités. Aucun acteur ne contrôle la norme. Chaque entreprise est responsable de la maintenance de ses intégrations et de l’adaptation de sa plateforme à la spécification.

C’est une décision intelligente. Elle instaure la confiance dans l’ensemble de l’écosystème et évite les obstacles typiques liés à la domination d’une norme par une seule entreprise. Pour les entreprises qui investissent massivement dans l’IA, cette neutralité n’est pas négociable. Elle vous permet d’adopter l’OSI sans avoir à restructurer ou à abandonner le contrôle de votre logique de modèle.

Christian Kleinerman, vice-président exécutif de Snowflake, l’a dit simplement : « L’intérêt de l’OSI est qu’elle n’est pas contrôlée par un seul fournisseur ». En maintenant cette position, l’OSI encourage l’innovation tout en gardant le champ libre, ce qui incite davantage d’entreprises à la rejoindre et à y contribuer, renforçant ainsi la spécification.

Ryan Segar, de dbt Labs, ajoute : « Lorsque la sémantique est disponible partout, de n’importe où, l’endroit où elle « vit » devient moins pertinent. Construite n’importe où, exploitée n’importe où ». Il s’agit là d’une réalité opérationnelle à laquelle la plupart des chefs d’entreprise devraient prêter attention. Les équipes chargées des données peuvent désormais travailler de manière plus souple et plus collaborative à tous les niveaux.

Diwakar Goel, de BlackRock, a confirmé que l’OSI était déjà positionné dans Aladdin, sa plateforme de gestion des investissements de bout en bout, pour unifier les données des marchés publics et privés. Ce n’est pas de la théorie, c’est une utilité immédiate au niveau de l’entreprise.

Pour les dirigeants, il s’agit d’un signal clair que l’OSI n’est pas une option, mais qu’elle est en train de devenir fondamentale. Les entreprises qui soutiennent l’OSI font le pari que ce sont des normes partagées, et non un contrôle isolé, qui permettront de libérer toute la valeur de l’IA. En s’alignant sur cette dynamique, votre organisation se prépare à un avenir plus agile et plus évolutif en matière d’IA.

Faits marquants

  • Résolvez le problème de la fragmentation sémantique pour débloquer le retour sur investissement de l’IA : Les définitions commerciales incohérentes entre les systèmes limitent considérablement la fiabilité et l’évolutivité de l’IA. Les dirigeants devraient donner la priorité à l’unification de la sémantique des données afin de réduire les inefficacités et de renforcer la confiance dans les résultats de l’IA.
  • Aligner les écosystèmes sur des normes de données ouvertes : Snowflake, Tableau, BlackRock et d’autres ont lancé l’OSI pour normaliser la sémantique des données commerciales. Les dirigeants devraient soutenir l’alignement à l’échelle de l’industrie pour améliorer la qualité des résultats de l’IA et réduire les frais de préparation des données.
  • Passer de modèles propriétaires à des structures ouvertes, prêtes pour l’IA : Les métadonnées traditionnelles n’ont pas le contexte requis par les outils modernes d’intelligence artificielle. Les organisations devraient adopter le modèle sémantique ouvert de l’OSI, basé sur SQL, afin d’améliorer la précision et d’éliminer les remaniements coûteux.
  • Priorité à l’intégration immédiate avec les outils existants : La structure YAML d’OSI fonctionne avec les outils d’analyse actuels tels que dbt Labs. Les dirigeants peuvent améliorer la productivité et accélérer la mise en œuvre de l’IA sans avoir à démanteler l’infrastructure existante.
  • Concentrez la concurrence sur la capacité, et non sur le contrôle : Les définitions de données normalisées déplacent l’innovation vers l’expérience de l’utilisateur, l’intelligence de l’IA et la création de valeur. Les dirigeants devraient concentrer leurs ressources sur la construction de produits différenciés, et non sur la protection d’une logique propriétaire.
  • Soutenir une gouvernance neutre et collaborative pour favoriser l’adoption : L’OSI est gouverné collectivement, ce qui permet une flexibilité et une neutralité entre les plateformes. Les organisations devraient s’engager très tôt pour influencer l’orientation, accélérer le déploiement et assurer la pérennité de leurs stratégies d’IA.

Alexander Procter

novembre 12, 2025

13 Min