Une architecture de données unifiée de haute qualité est essentielle au succès de l’IA
Si votre entreprise prend l’IA au sérieux, votre infrastructure de données doit évoluer. Pas de raccourcis. Des résultats de qualité découlent d’intrants de qualité et, dans le domaine de l’IA, cela signifie qu’il faut construire une base solide d’architecture de données unifiée. Vous devez organiser les données, les structurer et veiller à ce que chaque élément soit utilisable dans l’ensemble de votre entreprise. Pour ce faire, vous pouvez utiliser des systèmes tels que les lacs de données, les entrepôts de données ou, mieux encore, les entrepôts de données, qui combinent à la fois structure et flexibilité.
C’est une question de contrôle. Lorsque vous savez de quelles données vous disposez, d’où elles proviennent et comment elles sont traitées, alors, et seulement alors, vous pouvez faire confiance à vos modèles d’IA pour obtenir des résultats qui comptent. Nous voyons des entreprises comme Skyworks Solutions adopter exactement cette approche. Leur DSI, Satya Jayadev, ne perd pas de temps. Il qualifie leur entrepôt de données alimenté par Databricks de « fondation d’un gratte-ciel ». C’est parce qu’il traite des quantités massives de données, des pétaoctets collectés à partir d’usines et d’autres systèmes, tout en les organisant avec des niveaux de qualité clairs comme le bronze, l’argent et l’or. Cette structure permet à l’IA de travailler sans bruit ni confusion.
Ce niveau d’infrastructure n’est plus optionnel, il est obligatoire pour quiconque veut être compétitif dans le domaine de l’IA, de l’automatisation à l’analyse prédictive en passant par les modèles génératifs. Alimenter un système d’IA avec de mauvaises données peut conduire à des erreurs, à des problèmes de conformité et à de graves atteintes à la réputation. Mais lorsque vous y parvenez, la valeur ajoutée est exponentielle.
Selon l’enquête Office of the CDO d’IDC, les entreprises qui mettent en place une gouvernance structurée sont les suivantes gouvernance structurée structurée autour de leurs données sont plus avancées dans l’exécution de l’IA. Elles ont une productivité plus élevée, une meilleure prise de décision et des résultats plus solides. C’est là que vous voulez être.
Des pratiques matures en matière de données offrent un avantage concurrentiel dans le déploiement de l’IA
La plupart des entreprises collectent des données. Moins nombreuses sont celles qui les gèrent correctement. Et très peu l’utilisent de manière stratégique. C’est là toute la différence. La mise en œuvre d’une IA qui fonctionne réellement, non seulement dans le cadre d’expériences mais aussi en production, commence par la maturité des données. Il ne s’agit pas d’un non-sens technique. Il s’agit simplement d’une affaire intelligente.
Regardez les entreprises les plus performantes qui utilisent l’IA aujourd’hui. Elles ont toutes un point commun : une approche sérieuse de la manière dont elles traitent et gouvernent les données. traitement et la gestion des données. Nous parlons ici de catalogage, de métadonnées et de cohérence entre les systèmes. Lorsque vos équipes savent où se trouvent les données, ce qu’elles signifient et si elles sont dignes de confiance, vous éliminez le doute. À partir de là, l’IA peut réellement améliorer la fidélisation des clients, les marges bénéficiaires et l’efficacité opérationnelle.
Stewart Bond d’IDC l’explique clairement : « Les organisations accordent la priorité à la qualité des données afin de stimuler la productivité des travailleurs de l’information et d’améliorer la précision et la pertinence des résultats générés par l’IA. En d’autres termes, nettoyez vos données et votre IA produira des résultats exploitables. Cela signifie moins d’erreurs, des informations plus rapides et une automatisation plus fiable.
Selon l’enquête d’IDC, les entreprises ayant atteint la maturité en matière de données étaient cinq fois plus susceptibles de disposer d’outils d’IA générative en production. Elles ont également fait état de gains importants auxquels les dirigeants tiennent, à savoir des bénéfices plus élevés, une meilleure fidélisation de la clientèle et un chiffre d’affaires plus important.
Tout dirigeant désireux d’acquérir un réel avantage à l’ère de l’IA doit examiner attentivement ses pratiques en matière de données. Auditez-les. Les améliorer. Les institutionnaliser.
L’IA générative améliore la qualité des données et l’efficacité opérationnelle
La plupart des entreprises pensent encore que l’IA générative se limite à la génération de texte ou aux chatbots. Elles passent à côté de la véritable opportunité. L’une des applications les plus importantes de l’IA générative se trouve en coulisses, améliorant la qualité de vos données en temps réel. La technologie est actuellement utilisée par des entreprises telles que Gallo et Servier Pharmaceuticals pour identifier les incohérences, corriger les erreurs de classification et combler les lacunes dans les ensembles de données qui, autrement, dégraderaient la précision de leurs systèmes.
Robert Barrios, DSI de Gallo, utilise AWS Bedrock pour former des modèles linguistiques privés de grande taille. Ces modèles analysent de vastes ensembles de données, repèrent les termes ou les catégories qui s’écartent des normes établies et procèdent à des corrections automatiques. Par exemple, si un enregistrement de données comprend un descripteur de produit ou un attribut de client non standard, l’intelligence artificielle intervient et le normalise. Ces systèmes comprennent les conventions de dénomination internes et apportent des améliorations de précision sans exposer les données sensibles à l’internet public.
Mark Yunger, responsable des technologies de l’information chez Servier Pharmaceuticals, évoque un cas d’utilisation similaire. Servier exploite une version privée de ChatGPT sur Microsoft Azure pour maintenir le contrôle sur les documents internes tout en accélérant la création de contenu. Au lieu que les employés passent du temps à générer manuellement des documents de conformité ou des communications, l’IA rédige des sorties à haute probabilité basées sur des données propriétaires sécurisées. Les avantages sont évidents : des délais plus courts, moins d’erreurs et une sécurité renforcée.
Vous n’avez pas besoin d’y réfléchir à deux fois. L’IA générative permet de nettoyer, de structurer et de mettre à l’échelle vos données plus rapidement que les équipes humaines ne pourraient jamais le faire. Lorsqu’elle est mise en œuvre à l’aide d’une infrastructure privée, elle prend également en charge la conformité et la confidentialité des données, deux domaines qui feront rapidement dérailler vos plans d’IA s’ils ne sont pas contrôlés. Si vous êtes un décideur, commencez à tester l’IA générative là où elle crée le plus d’effet de levier : à l’intérieur de vos systèmes, en améliorant ce sur quoi votre entreprise s’appuie déjà.
La gouvernance complète des données et la collaboration interfonctionnelle favorisent le succès de l’IA
L’IA n’évolue pas si votre gouvernance n’évolue pas avec elle. C’est la simple vérité. Il s’agit de l’efficacité avec laquelle vos données sont définies, sécurisées et appliquées au sein de votre organisation. Sans règles, définitions et propriété claires, vos données ne sont pas fiables, ce qui se traduit par des résultats médiocres en matière d’IA.
Satya Jayadev, de Skyworks Solutions, le dit directement : « L’IA n’est pas une technologie de l’information traditionnelle, mais un outil de transformation auquel tout le monde veut avoir accès. Cette demande crée une pression. Pour la devancer, vous avez besoin d’une stratégie de gouvernance qui ne limite pas l’innovation mais maintient l’alignement de toutes les équipes en leur donnant un accès de confiance aux données dans un cadre partagé.
Mark Yunger, de Servier Pharmaceuticals, a suivi la même voie. Son équipe a passé 18 mois à élaborer une taxonomie et une structure de dénomination pour unifier la façon dont les données sont utilisées par les équipes de produits, de R&D et de relations publiques. Il ne s’agissait pas seulement d’un travail de back-office, cela a permis à l’entreprise de déployer l’IA avec plus de confiance, en sachant que les entrées de données étaient comprises de manière cohérente dans l’ensemble de l’entreprise. Il mentionne également le plus grand défi : le talent. Il n’est pas facile de trouver des professionnels ayant la bonne combinaison d’expérience en matière de gouvernance et de capacités techniques. Mais sans cette combinaison, les projets de données sont bloqués ou n’évoluent jamais.
Chez AES, Alejandro Reyes, Chief Digital Officer, est très clair sur l’équilibre à trouver : Vous devez appliquer la gouvernance sans ralentir la façon dont les gens travaillent. C’est désormais un point non négociable pour toute entreprise qui construit des plateformes d’IA à grande échelle. AES utilise des outils comme Atlan et Qualytics au sein de sa plateforme CEDAR pour s’assurer que les données opérationnelles sont fiables dans les domaines de l’ingénierie, de la finance et au-delà. Elle utilise l’IA dans des environnements de production réels, avec des contrôles stricts et sans goulots d’étranglement.
La coordination interfonctionnelle est essentielle. Les systèmes d’IA ne sont performants que lorsque les équipes commerciales et informatiques sont synchronisées. La gouvernance est le pont qui permet aux deux parties d’augmenter l’impact sans risquer de compromettre la sécurité, la précision ou la conformité. Si vous êtes dans la suite C, assurez-vous que votre modèle de gouvernance est centralisé, transparent et activement maintenu. C’est la base dont l’IA a besoin pour apporter une réelle valeur ajoutée.
Des plateformes de données sur mesure permettent de mettre en place des stratégies d’IA spécifiques à chaque secteur.
Les stratégies d’IA ne sont pas uniformes. Ce qui fonctionne pour une entreprise de boissons ne répondra pas aux exigences d’un fournisseur d’énergie ou d’une entreprise pharmaceutique. Les exigences propres à chaque secteur, notamment la pression réglementaire, la complexité opérationnelle et la rapidité de compréhension, requièrent des plateformes de données sur mesure. Ces plateformes doivent intégrer dès le départ une logique spécifique au domaine, des considérations relatives à la protection de la vie privée et une évolutivité fonctionnelle.
Chez AES, une entreprise axée sur l’énergie durable, cette approche s’est matérialisée par une plateforme de données sur mesure appelée CEDAR, fonctionnant sur Google Cloud Platform. Alejandro Reyes, Chief Digital Officer, explique comment cette plateforme unifie les données opérationnelles de tous les sites d’énergie propre dans un format standardisé. En utilisant Atlan pour le catalogage des données et Qualytics pour les contrôles de qualité, CEDAR fournit des données propres et fiables pour les applications d’IA dans tous les départements, qu’il s’agisse de prévoir l’approvisionnement en énergie, de s’aligner sur la demande du marché ou de projeter les revenus. CEDAR alimente Farseer, l’outil d’IA d’AES qui a été récompensé par le prix 2024 CIO 100 pour son impact commercial dans le monde réel.
Les entreprises pharmaceutiques sont confrontées à un défi différent. Servier Pharmaceuticals, connu pour développer des traitements contre le cancer, opère dans un espace étroitement réglementé. Mark Yunger, responsable de l’informatique, savait que l’entreprise ne pouvait pas se permettre d’avoir des problèmes de confidentialité des données ou une mauvaise gouvernance. Pour résoudre ce problème, Servier a créé une taxonomie unifiée dans un environnement BigQuery lakehouse et a construit une implémentation privée sécurisée de ChatGPT sur Microsoft Azure. Cela garantit la conformité avec des lois telles que la loi européenne sur l’IA, en particulier lorsqu’il s’agit de protéger les données des essais sur les patients ou d’éviter la violation des brevets d’autres entreprises.
Pour Robert Barrios, DSI de Gallo, l’objectif était d’exploiter les données structurées et non structurées. L’environnement IA de Gallo comprend un entrepôt SAP S/4HANA structuré avec des marts de données répartis par fonction métier et un lakehouse flexible basé sur Redshift pour le traitement riche en métadonnées des données non-SAP. Cette configuration hybride prend en charge des stratégies de marketing, d’approvisionnement et de finance de précision adaptées au secteur des biens de consommation, tout en utilisant leurs propres LLM internes avec AWS Bedrock pour garder le contrôle sur leur couche de données.
C’est là que la stratégie du niveau C est importante. L’IA ne sera pas efficace sans un système de données qui comprend l’entreprise qu’elle est censée servir. Les modèles de données doivent s’appuyer sur la connaissance du secteur, et les choix de plateforme doivent refléter le profil de risque de l’entreprise et son besoin d’évolutivité. Les dirigeants doivent jouer un rôle direct en s’assurant que leurs plateformes de données sont conçues pour répondre à la complexité de leur secteur, non seulement sur le plan technique, mais aussi sur le plan opérationnel, concurrentiel et juridique. C’est là que la valeur réelle est créée.
Principaux enseignements pour les dirigeants
- Construisez une architecture de données unifiée : Les DSI qui obtiennent un impact réel sur l’IA investissent dans des plateformes de données centralisées, généralement des » lakehouses « , qui prennent en charge des données d’entrée évolutives et de haute qualité. Les dirigeants devraient normaliser les environnements de données dans l’ensemble de l’organisation afin de réduire les risques et de favoriser l’efficacité de l’IA.
- Donnez la priorité à la maturité des données pour libérer la valeur de l’IA : Les entreprises dotées d’une gouvernance des données et de contrôles de qualité matures ont cinq fois plus de chances de déployer avec succès l’IA générative. Les dirigeants devraient accélérer la gestion, le catalogage et la gouvernance des métadonnées afin d’obtenir un avantage mesurable en termes de profit, de rétention et d’efficacité.
- Utilisez l’IA générative pour renforcer la qualité des données internes : Les meilleures entreprises utilisent des modèles génératifs internes pour combler les lacunes dans les données, corriger les incohérences et générer de la documentation interne en toute sécurité. Les dirigeants devraient déployer des outils d’IA privés pour automatiser l’affinage des données sans compromettre les informations exclusives.
- Faites en sorte que la gouvernance soit transversale et évolutive : Le succès de l’IA dépend d’une gouvernance des données à la fois solide et flexible qui permet un accès coordonné sans perturber les flux de travail. Les décideurs doivent aligner les équipes commerciales et informatiques sur des modèles de gouvernance transparents pour soutenir l’innovation et la conformité réglementaire.
- Adapter les plateformes de données aux besoins de l’industrie : Les plateformes de données sectorielles, adaptées aux exigences réglementaires et opérationnelles, permettent d’obtenir de réels résultats commerciaux dans les secteurs de l’énergie, de la pharmacie et des biens de consommation. Les dirigeants devraient investir dans des fondations de données spécialement conçues pour leur secteur afin de développer l’IA en toute confiance et de manière efficace.