2023 restera dans les esprits comme la première année de l'Intelligence artificielle générative (IAG) qui a secoué le paysage de la tech dominé par les sept géants (magnificient seven) ; Microsoft, Alphabet, Meta, Apple, Amazon, Tesla et Nvidia.
Les gouvernements ont également accéléré leurs interventions pour tenter d'établir des règlementations pour l'IA et l'IAG par pays ou par région comme c'est le cas en Europe.
2023 préfigure-t-elle 2024 pour la tech ?
2023 fut en effet une année difficile pour les startups notamment dans la Silicon Valley qui reste l'indicateur de santé et de la dynamique de la tech numérique mondiale.
La valeur des transactions de capital-risque aux États-Unis en 2023 est tombée à des niveaux jamais vus depuis 2019. Au cours des douze derniers mois, les investisseurs ont investi dans les startups d’intelligence artificielle, mais le reste du secteur s’est effondré.
Selon le cabinet PitchBook, "les sociétés de capital-risque (VCs) ont investi 170,6 milliards de dollars aux États-Unis en 2023, sur environ 15 000 transactions. L'investissement par transaction est en baisse d’environ 30 % par rapport à 2022.
Les levées de fonds par les VCs ont également chuté l’année dernière de près des deux tiers par rapport à 2022, et de près de la moitié à l’échelle mondiale. Les fonds de capital-risque américains ont levé 66,9 milliards de dollars en 2023, et les fonds mondiaux ont levé 160,9 milliards de dollars."
Concernant les introductions en bourse dans la Tech, 2023 a été une meilleure année que 2022. Mais on peut s'attendre à un marché toujours mitigé en 2024, en raison de l’incertitude persistante sur l'état de l’économie mondiale.
De nombreuses startups vont revoir à la basse leur valorisation en vue de lever des fonds si elles y parviennent. Beaucoup de startups disparaitront car les liquidités manqueront et les fondateurs ne pourront pas obtenir davantage de financement ou des prêts en raison de taux d'intérêts encore élevés et de la frilosité des investisseurs du fait d'une reprise mondiale qui tarde à venir avec les dépenses des entreprises. Des plus grosses entreprises pourront acquérir ces startups au bord de la faillite pour notamment récupérer des talents, des produits, technologies et éventuellement des clients.
Mais certaines start-ups trouveront des cas d’utilisation intéressants pour l’IAG dans des domaines verticaux et spécifiques, en exploitant le plus souvent des LLMs en open source pour éviter les couts importants de l'utilisation de solutions propriétaires.
Le climat général dans la tech n'est pas bon au début de 2024 car en 2023 selon le Wall Street Journal, "Le secteur des technologies de l’information (TI) n’a augmenté que de 700 emplois par rapport à 2023, un ralentissement drastique par rapport aux 267 000 emplois créés en 2022, même si l’IA et ChatGPT ont suscité un énorme intérêt de la part des entreprises.
La cybersécurité, l’IA et les sciences des données font partie des segments responsables de la création d’emplois dans le secteur des TI en 2022 et 2023, tandis que les rôles de gestion des applications d’entreprise telles que les systèmes de paie et de ressources humaines sont remplacés par des logiciels dans le cloud."
Cependant, les emplois dans le domaine de l’IA et de ses compétences connexes représentaient environ 11 % de toutes les offres d’emploi dans le secteur de la technologie au cours des derniers mois, L’embauche dans le secteur des fabrications de technologies, en particulier dans les semi-conducteurs, a également augmenté d’environ 1 600 emplois le mois dernier, selon WSJ/CompTIA. L’industrie des puces, qui était dans un marasme prolongé, s’est largement redressée en raison de facteurs tels que la demande d’IA. Les choses se présentent bien en 2024 pour les semi-conducteurs surtout liés à l'A.
L' IAG a sauvé la tech en 2023 : le fera-t-elle en 2024 ?
Des sommes très importantes, de l'ordre de 27 milliards de dollars, ont été investies dans l'IAG. Mais essentiellement en provenance de géants de la tech et beaucoup moins des sociétés de capital-risque (VCs) et d'autres investisseurs ce qui est inédit dans le secteur.
De nouvelles sociétés "IA pure play" ou "IA first" sont apparues dans plusieurs pays comme OpenAI bien sûr mais aussi Hugging Face, Anthropic, Inflection AI, Mistral AI et Stability AI.
Les BigTech Microsoft, Alphabet, Meta, Apple, Amazon, Adobe, Oracle ont toutes développé ou acquis des systèmes de GenIA en 2023. Pour le moment seuls Meta et Apple n'ont pas d'offres commerciales d'IAG utilisant leurs cloud. Meta poursuit plutôt la promotion de ses LLMs auprès des développeurs en les distribuant en mode logiciel libre ce qui contribue à baisser le ticket d'entrée.
Nvidia, principal fabricant de puces IA, est passé en peu de temps dans le groupe de tête des sociétés américaines avec 1 220 milliards de dollars de capitalisation boursière. C'est le vrai gagnant dans la vague IAG actuelle en générant d'énormes revenus de ses puces. Nvidia a une approche œcuménique et travaille avec tout le monde et investit dans de nombreuses entreprises d'IAG comme dans Mistral et dans des concurrents d'OpenAI comme Adept, Cohere et Hugging Face. Evidemment cela donne à ces sociétés un accès privilégié aux puces IA de Nvidia qui sont en très forte demande.
Face à la puissance de Nvidia dans les puces IA, les Big Tech ont développé leurs propres puces IA pour optimiser leurs propres systèmes et pour diversifier leurs sources d'approvisionnement actuellement concentrées sur Nvidia. Les sociétés historiques du silicium, Intel, AMD, ARM, Qualcomm ont toutes annoncé leurs propres puces IA à la fin 2023. Et plusieurs startups comme Cerebras, SambaNova et Graphcore se sont lancées dans la conception de puces IA originales.
Par ailleurs, l'arrivée de RISC-V (qui se prononce “risk five”) qui désigne des normes de conception de puces en mode ouvert (open standard) est susceptible d'encourager la production de puces IA moins chères et moins consommatrices d'énergie. Il y a un engouement certain pour RISC-V.
On observe aussi la participation des BigTech dans différentes activités hors de leurs activités principales et tours de tables. Par exemple, Amazon et Google sont investisseurs dans ANTHROP\C respectivement avec 4 md$ et 2 md$. Ces deux sociétés sont par ailleurs concurrentes dans le cloud et dans l'IAG.
Les opérateurs de cloud ont une approche œcuménique pragmatique de l'IAG en exploitant non seulement leurs propres technologies d'IA, de LLMs et de puces mais aussi celles d'autres entreprises.
Intel a même créé une société Articul8 AI pour apporter des solutions d’IA générative aux entreprises, une incursion originale au-delà de son métier principal.
Les développements autour de l'IAG : l'arrivée des Gadgets IA
On n'est pas loin de voir apparaitre des appareils avec une étiquette "AI Inside".
On le verra sur des PCs "Native IA" ou "IA First" grâce aux nouvelles puces IA développées par les entreprises de semi-conducteurs, et à des logiciels d'IA optimisés pour fonctionner en local ou en mode hybride entre l'appareil et le cloud. Et bien sûr des smartphones IA vont faire leur apparition en 2024.
Comme l'a annoncé Cristiano Amon de Qualcomm, "l'IAG évolue très très vite dans les appareils mobiles… Il sera plus précis et apprendra votre comportement, ce que vous voulez et ce que vous ne voulez pas… Ce n’était pas possible de le faire dans le passé parce qu’il y avait des difficultés à interpréter votre langue. Il était également difficile d’obtenir le contexte et il fallait programmer chaque mouvement. Vous n’avez plus besoin de programmer [maintenant avec l'IA dans votre mobile]"
De la même manière, des appareils domestiques incorporeront de l'IA ; par exemple les téléviseurs, notamment pour optimiser le son et l'image, ce que les consommateurs ne pensent pas à régler eux-mêmes en fonction des programmes regardés.
Coté électronique grand publique Samsung par exemple annonce des aspirateurs, des réfrigérateurs et des plaques de cuissons qui incorporent de l'IA. Et évidemment, des robots domestiques auront naturellement leur IA à bord, comme LG les décrit, capables de comprendre le contexte et les intentions des utilisateurs.
Qui gagnera de l'argent avec l'IAG en 2024 ?
Les fournisseurs de puces et de solutions pour les infrastructures de cloud continueront d'être les bénéficiaires majoritaires des dépenses de tech autour de l'IA. Mais on devrait voir apparaitre des usages liés à de nouvelles applications rendues possibles par la prolifération de grands modèles de langages (LMMS) plus petits, personnalisables (chatbots) et plus économiques à exploiter que les modèles géants des hyperscalers du cloud.
Comme le rappelait John Thornhill du Financial Times, lors de l’électrification massive de l’économie à la fin du 19e siècle, les entreprises ont tiré profit de la production et de la distribution d’électricité. Mais les fortunes sérieuses ont été faites plus tard en utilisant l’électricité pour transformer les méthodes de fabrication de produits, comme l’acier, ou en inventant des produits et des services entièrement nouveaux, comme les appareils ménagers. "
Donc le potentiel pour de nouveaux acteurs IA et les historiques de l'IT de développer de nouveaux services est important et permettra d'apprécier la véritable adoption de l'IAG dans l'économie au-delà de la période d'enthousiasme et de fascination accompagnée par des investissements massifs dans le domaine de l'IAG. Le passage de la phase d'expérimentations à celle du deploiement dans les entreprises devrait se produire en 2024.
Le rôle d'Apple pourrait booster l'adoption de l'IAG via notamment ses smartphones. En effet les analystes s’attendent à ce qu’Apple cherche à traiter des applications d’IA dans les appareils, sans avoir à se connecter au cloud. Pour y parvenir il sera essentiel d’utiliser des petits modèles de langage spécialisés et efficaces en utilisation des mémoires de l'appareil. Apple conçoit ses propres processeurs et peut donc optimiser ses modèles de façon très fine. Selon l'analyste Daniel Ives , "Il est possible qu'Apple dévoile un App Store IA conçu par les développeurs en 2024". À ce stade on entendra dire : "il y a une AP IA pour ça ! " par analogie avec les Appstores actuels.
On peut s'attendre à ce que d'autres Appstores d'IA voient le jour, promus par d'autres entreprises.
De son coté, OpenAI l'inventeur de chatGpt devrait lancer en janvier 2024 son Appstore GPT, où les créateurs de GPT personnalisés par des tiers et développés avec le nouvel outil GPT Builder d’OpenAI peuvent vendre leurs créations.
L'IAG et les moteurs de recherche
Avec l'apparition de ChatGPT, l'analyse était que les activités de moteurs de recherche sur internet seraient grandement impactées car on voyait l'IAG se substituer aux moteurs de recherche pour apporter des réponses complètes et rédigées en clair plutôt qu'une série de liens vers des sites.
C'était notamment ce qu'espérait Microsoft pour booster son moteur Bing en prenant des parts de marché à Google. Un an après ce n'est pas le cas.
Même si le temps peut donner raison partiellement au moins à cette analyse, une société d'IA "pure play", Perplexity AI, a levé 100 millions de dollars pour s’attaquer à Google et Microsoft Bing avec une approche de recherche native de l’IA. Elle est valorisée à 500 millions de $. Perplexity AI reçoit des appels de 10 milliards de personnes par mois. Ils ont des actionnaires prestigieux dont Nvidia, Jeff Bezos, NEA et Bessemer ventures. Perplexity a lancé son moteur de recherche il y a un an. Ils ont plus d’un million d'utilisateurs sur mobiles. Le chemin risque d'être long pour atteindre une part de marché significative sauf à se diriger vers des recherches très sophistiquées sur des sujets étroits. Ce qui peut intéresser notamment les entreprises pour exploiter leurs fonds informationnels.
L'émergence de startups d'orchestration d'IAG en 2024
Choisir le bon modèle d'IA, intégrer plusieurs LLMs dans un seul service et déployer des applications à faible coût sont les défis auxquels font face les projets actuels.
"Les projets d’orchestration d’IA générative open source créeront plusieurs startups licornes en phase de démarrage." En 2024, les startups d’orchestration de l’IA peuvent connaitre une croissance rapide. Elles aident les développeurs à intégrer et gérer divers modèles d’IA générative. Ces entreprises offrent une approche multi-modèles de plus en plus adoptée par les entreprises, couvrant tout, de l'optimisation des modèles au déploiement d'applications et à l'accélération matérielle. Les startups d’orchestration permettent l'accès à plusieurs modèles et la redirection des tâches. Il y a déjà des startups d’orchestration ; par exemple Pinecone et Essential AI.
Adoption de l'IAG par les entreprises aux USA
L'analyse des résultats d'une enquête portant sur 3 000 clients par la société O’Reilly révèle que les deux tiers (67 %) des personnes interrogées déclarent que leur entreprise utilise l’IAG. C’est un taux d’adoption énorme, étant donné que ChatGPT a un peu plus d’un an au moment de l'enquête fin 2023. "Un an après l’arrivée des premiers serveurs Web, combien d’entreprises avaient des sites Web ou apprenaient à les créer ? Certainement pas les deux tiers d’entre eux." Une autre surprise : 26 % [des organisations] travaillent avec l’IA depuis moins d’un an. Mais 18 % d’entre eux ont déjà des applications en production.
Les problèmes du copyright de l'IAG peuvent être résolus en 2024
Ce sera soit par la modification des technologies soit par des accords commerciaux avec les ayants droits ou les deux.
Dans le passé tous les exemples de technologies de création et communication d'informations numériques ont dû affronter l'hostilité des ayant droits et faire face à des actions en justice demandant des réparations et l'interdiction de continuer à utiliser les technologies sans modification. On peut se rappeler en France les conflits entre la presse quotidienne avec France Telecom à l'époque du Minitel notamment autour de l'annuaire électronique et de ses pages jaunes numériques et l'utilisation des photos des œuvres des musées nationaux. En général cela se termine par des arrangements financiers avec les ayants droits ou les organismes qui les représentent par le biais de contrats commerciaux ad hoc.
Dans le cas de l'IAG, il y a déjà plusieurs solutions techniques d'insertions de filigranes numériques permettant de tracer l'origine des informations générées par un IAG.
Par ailleurs, Microsoft, Adobe, Alphabet et OpenAI se sont engagés à payer les frais de justice dans certains cas contre les poursuites de leurs clients en matière de propriété intellectuelle grâce à des "boucliers anti droits d'auteurs."
Reste que les développeurs de grand modèles de langage (LLMs) et autres systèmes d'IA pour la vidéo, le son et l'image vont avoir besoin de plus en plus d'information de qualité y compris spécifiques à des secteurs et disciplines. Une très grande partie de ces sources ne sont pas accessibles aux opérateurs de cloud IAG car elles sont détenues par des entreprises et des institutions. Il faudra donc contractualiser l'accès à ces données.
Par ailleurs le recours à des IA pour générer artificiellement des informations d'entrainement des LLMs présente le risque de dégénérescence et de pollution des sources existantes avec des informations erronées. Le recours à des vérificateurs humains capable de filtrer et de taguer proprement les informations n'est pas prêt de disparaitre.
Accélération de l'IAG en 2024 ?
On peut s'attendre à une prolifération de startups et de solutions innovantes d'IAG pour s'attaquer aux problèmes et limitations existants mais surtout de développer de nouveaux outils et de nouvelles approches. Parmi les avancées on peut citer des solutions qui permettent d’analyser les données en temps réel plutôt que de se limiter aux informations utilisées pour entrainer les LLMs qui datent actuellement de plusieurs mois.
La technologie RAG (retrieval augmented generation ou génération d'augmentation de récupération) quant à elle permet à une IA de "prendre connaissance" d'un contenu qui ne faisait pas partie des données d'entrainement du modèle.
Selon Microsoft, "pour une solution d’entreprise, l’architecture RAG signifie que vous pouvez limiter l’IA générative à votre contenu d’entreprise provenant de documents vectoriels, d’images, d’audio et de vidéos."
Les tendances sont la réduction de la taille des modèles IA et la possibilité de les utiliser directement sur des PC et des mobiles. La disponibilité croissante de modèles en open source permettra aux entreprises de mitiger leurs risques en utilisant leurs données propres sur leurs propres systèmes et optimisées pour leur besoin spécifique. Enfin l'arrivée des modèles multimodaux (texte, voix, images, audio et vidéo) augmentera substantiellement le potentiel de créativité
Les zones d'ombre et de risques
L'application des règlementations décidées par les organismes gouvernementaux peut s'avérer ardue car l'innovation dans le domaine avance très vite et peut buter inutilement sur des obstacles de principes déconnectés de la réalité de la dynamique de marché. On peut s'attendre à des révisions de ces règlementations avec l'équivalent de décrets d'application qui préciseront les modalités de prise en compte des textes. Il est vrai que règlementer préventivement une technologie qui est naissante et encore peu déployée est assez atypique dans le monde de la règlementation.
Une autre préoccupation sérieuse est l'impact de l'IAG sur la fabrication et la circulation d'informations sur les réseaux. Le risque endémique de désinformation par ces technologies est mis en avant par les catastrophistes de l'IAG. Sans diminuer l'importance de ce risque on peut se souvenir que cette question surgit régulièrement depuis l'origine de la numérisation des informations et de leur transmission sur tous les réseaux et que des solutions ou compromis ont été trouvées pour contenir les problemes voire les éliminer.
2024 est aussi l'année des élections présidentielles américaines. La question qui circule est de savoir si l'IA affectera ou pas les scrutins et si oui de quelles façons. Evidemment c'est une cible de choix pour les faussaires et manipulateurs de l'information. On peut se dire que ce sera un test en vraie grandeur des solutions qui seront surement mises au point pour contrarier voire éradiquer les sources de désinformation.
Conclusion
Les développements de l'IAG et les investissements correspondants continueront à un rythme soutenu en 2024 sur la lancée de 2023 de par l'engouement des investisseurs, des entrepreneurs, des Etats et des entreprises à l'affut de solutions permettant d'améliorer leur efficacité, d'enrichir leurs offres et la relation avec leurs clients et de dénicher de nouveaux domaines d'innovation rentable.
Pourtant, en plus du manque de fiabilité des systèmes d'IAG et des aberrations comme les hallucinations qui rebutent les entreprises, de nouveaux problèmes et obstacles se concrétisent, réglementation, droits d'auteurs… Mais la croissance importante du nombre de startups dans le domaine va générer de nouvelles solutions et procédés en même temps que le marché révèlera des nouveaux cas d'usages inédits particulièrement fertiles.
Même avec ses imperfections, l'IAG peut toujours être un outil de productivité précieux, accélérant l’industrialisation de l’efficacité.
On ne reviendra pas en arrière. C'est la marche de l'histoire.
-o-o-
15 janvier 2024
Georges Nahon est analyste, auteur et conférencier dans le domaine des technologies numériques et de l'innovation. Il était précédemment le directeur général d'Orange Labs à San Francisco pendant quinze ans.
Autres articles sur le même thème
Quoi de neuf dans la Silicon Valley ?
Intelligence artificielle : les grands modèles de langage approchent de leurs limites
par Georges Nahon
Mag #20
Lire l'article
Quoi de neuf dans la Silicon Valley ?
Trump 2.0 et la tech américaine
par Georges Nahon
Mag #19
Lire l'article
Quoi de neuf dans la Silicon Valley ?
Du financement aux innovations, l'IA continue de dominer le secteur du numérique
Mag #18
Lire l'article
Quoi de neuf dans la Silicon Valley ?
Les sceptiques de l'IA ont dominé les médias pendant l'été technologique 2024 Bulle ou pas Bulle ? Et quel ROI ?