En donnant la possibilité de mettre en réseau des données au sein d’un écosystème d’acteurs, la Blockchain permet de massifier l’accès aux données de manière sécurisée et d’accélérer la courbe d’apprentissage machine pour les systèmes d’Intelligence Artificielle (IA). En perspective : la démocratisation des algorithmes d’IA et la possibilité pour des consortiums d’entreprises d’élever leur puissance de calcul au niveau d’un Facebook ou d’un Google.
Intelligence artificielle, un besoin massif de données
L’intelligence artificielle (IA) pourrait transformer le monde plus qu’aucun autre progrès technique depuis la Révolution industrielle et réinventer fondamentalement la façon dont les entreprises opèrent et se développent.
Pour être efficaces, de nombreux algorithmes d’intelligence artificielle, et en particulier de Machine Learning, nécessitent de gros volumes de données dont la valeur dépend de leur qualité. Le Big Data, dont la vocation est de rassembler, organiser, processer et analyser de gros volumes de données, est donc une composante essentielle des solutions d’intelligence artificielle qui sont aujourd’hui déployées dans les organisations. C’est en ce sens que la « data » est souvent présentée comme l’or noir du 21ème siècle car elle est le carburant indispensable des modèles d’IA qui visent principalement à opérer de la classification ou de la prédiction.
De fait, les deux principaux défis auxquels sont confrontées les organisations qui veulent mettre en place une solution d’intelligence artificielle sont l’accès aux données et la qualité de ces données pour l’entraînement des modèles d’IA. Ce manque de données de qualité fait que certaines solutions d’intelligence artificielle ne disposent pas d’un dataset d’entraînement suffisant et sont par conséquent peu ou pas performantes. Cela constitue également un frein au déploiement de l’intelligence artificielle, créant par ailleurs des disparités entre entreprises – selon leur taille et leurs moyens – seules certaines grandes entreprises pouvant généralement se permettre d’investir un capital et des ressources compétentes pour construire en interne des modèles et des algorithmes d’apprentissage automatique.
Pour autant, si quelques grandes entreprises ont les moyens de constituer de larges bases de données et d’investir dans le développement de systèmes d’intelligence artificielle, cela représente un investissement financier non négligeable, plus difficile encore à assumer en temps de crise. Par ailleurs, leur capacité à constituer ces jeux de données s’arrête à leur périmètre d’activité et aux cas opérationnels qu’elles rencontrent au quotidien. Rarement une seule entreprise est en mesure d’apporter une réponse globale à un problème donné, de solutionner de bout en bout la problématique à laquelle le modèle d’IA prétend répondre, qui plus est dans une économie de plus en plus interconnectée et systémique. La limite à collecter un jeu de données suffisamment large et représentatif des différents cas de gestion se traduit par l’introduction de biais dans les modèles d’IA et fausse de ce fait toute prise de décision.
Dans ce contexte, comment constituer et qualifier de gros volumes de données, suffisamment représentatifs, et inciter les détenteurs de données à les partager ? Comment accélérer l’entraînement des modèles d’IA et réduire le coût financier induit ?
La Blockchain apporte peut-être la réponse à ces questions…
La Blockchain, vecteur d’accélération et de fiabilisation de l’IA
Outre le fait d’être l’un des « buzz words » du moment, la Blockchain est une technologie qui permet de stocker et de transmettre des informations de manière transparente, sécurisée et sans organe central de contrôle. Elle ressemble à une grande base de données qui contient l’historique de tous les échanges réalisés et dont les utilisateurs contribuent au système en apportant de la puissance de calcul et/ou de la capacité de stockage.
Certains des composants essentiels de la Blockchain sont le « token » et le « smart contract ». Le « token » est un actif numérique émis et échangeable sur une blockchain qui peut être vendu et acheté à tout moment, en particulier sur des plateformes d’échange à un prix fixé en temps réel par l’offre et la demande. Les « smart contracts » sont des programmes informatiques irrévocables déployés sur une blockchain qui exécutent un ensemble d’instructions prédéfinies et permettent de sécuriser un accord entre deux ou plusieurs parties, d’automatiser les paiements, d’éliminer les risques d’impayés, de diminuer drastiquement les coûts intermédiaires dans l’élaboration, le suivi et la passation d’un contrat.
Compte tenu de ces éléments, pour répondre au problème essentiel d’accès à des données de qualité pour entraîner un modèle d’IA, il est tout à fait possible d’imaginer un smart contract qui proposerait à un détenteur de données de partager ses données au sein d’un éco-système via une blockchain. En effet, nombreux sont les détenteurs de données qui refusent de vendre leurs data à des intermédiaires ou à des plateformes mais qui ne seraient pas opposés au fait de les partager avec d’autres organisations à condition que ce partage de données se fasse de manière sécurisée et moyennant une juste rémunération liée à l’usage et à la qualité de leurs données, ce que permettent tout à fait la Blockchain et ses « smart contracts » en garantissant que chacun des contributeurs d’une blockchain soit rémunéré en fonction de son apport réel, dans un cadre contractuel sécurisé.
Les détenteurs de données dont les données seraient validées seraient rémunérés automatiquement en tokens. Les contrôleurs qui vérifient que les données sont valides et de qualité seraient eux aussi rémunérés en tokens. Les organisations qui désirent utiliser ces données pour entrainer leurs algorithmes d’intelligence artificielle payeraient en tokens pour chaque utilisation, alimentant ainsi le système. Avec un effet drastique sur la capacité de ces organisations à accélérer le déploiement de leurs systèmes d’IA.
Avec la technologie Blockchain, il serait également possible de gérer les questions de confidentialité des transactions et des données partagées, notamment dans des contextes très concurrentiels. A travers le chiffrement des données qui ne peuvent dès lors être décodées que par l’organisation disposant de la « clé privée » correspondante ou encore la mise en place de « canaux d’échange » dans une blockchain telle qu’Hyperledger, la Blockchain rend possible le partage de données en préservant la confidentialité des transactions et des données.
Cette formidable nouvelle économie reposant sur le « data sharing » trouve déjà des applications concrètes auprès de plusieurs start-ups à l’instar de la start-up française « iExec » qui a développé une plateforme Blockchain décentralisée de partage de « dataset » et de puissance de calcul.
En facilitant ainsi la constitution de bases de données volumineuses et de qualité, la Blockchain peut contribuer à accélérer l’entrainement d‘algorithmes d’intelligence artificielle et à améliorer leur performance. Ensemble, l’IA et la Blockchain peuvent permettre aux organisations de dépasser leurs limites actuelles et d’accéder à des quantités importantes de données et par extension de valeur. Ensemble, l’IA et la Blockchain peuvent permettre aux entreprises d’élever leur puissance de calcul en associant leurs assets respectifs et collectivement de s’ériger au niveau d’un Google ou d’un Facebook !
Article rédigé par Fazil BOUCHERIT (Manager en charge de l’offre Blockchain) & Jean-Luc MARINI (Directeur du Lab IA d’Axys Consultants), pour ActuIA