Un premier semestre 2024 en surchauffe pour l'IA générative présage un S2 effervescent

Le premier semestre 2024 s'achève avec une profusion d'annonces de nouveaux produits et services basés sur l'IA générative (IAG), marquée notamment par l'entrée d'Apple sur ce marché en plein essor.

Cependant, une certaine méfiance a émergé parmi les analystes, les médias, les investisseurs et les scientifiques. Cette perception négative s'explique en partie par les sommes colossales investies en très peu de temps dans cette technologie, sans que les perspectives de revenus justifiant ces investissements soient clairement identifiables. De plus, les IA génératives peuvent actuellement produire des inexactitudes ou des erreurs difficiles, voire impossibles, à anticiper ou à détecter avec les technologies actuelles, ce qui inquiète les clients professionnels.

Etat du marché à la fin du premier semestre 2024

Lancé initialement en novembre 2022 par OpenAI avec ChatGPT, le marché de l'IAG reste largement dominé par les géants de la technologie comme Amazon, Microsoft, Google, Nvidia et Meta, tant en termes de produits que d'investissements. Certaines entreprises très ambitieuses comme xAI d'Elon Musk, avec son produit Grok, n'ont pas encore percé. Toutefois, en mai, xAI a levé 6 milliards de dollars, atteignant une valorisation de 24 milliards de dollars
Le 5 juin, Nvidia, leader des puces IA, a surpassé Apple en capitalisation boursière, devenant la deuxième plus grande entreprise cotée en bourse avec une valorisation de plus de 3000 milliards de dollars.

Bien que Microsoft et Google aient annoncé des résultats en croissance pour le premier trimestre 2024, notamment grâce à l'IAG (Microsoft a rapporté une croissance de 7% de son cloud Azure due à l'IA au premier trimestre 2024 contre 3% au troisième trimestre 2023), Nvidia est la seule entreprise profitant massivement de l'adoption croissante de l'IAG. Nvidia a enregistré un chiffre d'affaires en hausse de 262%, avec une augmentation spectaculaire de 427% dans ses activités de datacenters liées à l'IA. Pour soutenir sa R&D et ses services cloud, Nvidia prévoit de dépenser 8,8 milliards de dollars en puissance de calcul auprès d'Amazon, Google, Microsoft et Oracle dans les années à venir, contre une prévision de 3,3 milliards de dollars en janvier. Des concurrents comme AMD et Intel ont également annoncé de nouvelles puces spécialisées pour l'IA, mais Nvidia conserve une avance significative.

Arrivée très attendue des PCs IA et des smartphones IA

Selon le Financial Times et la société d’études de marché Counterpoint, les "smartphones IA" représenteront 43% des ventes mondiales de smartphones d’ici 2027, avec 1 milliard d’appareils en circulation. En 2024, les smartphones IA devraient constituer 11% des ventes totales de smartphones. Google a déjà lancé son smartphone IA Pixel 8, et Samsung son S24, basé sur l'IA Gemini de Google. IDC prévoit une croissance annuelle de 4,8% en 2024 pour les ventes de smartphones IA Android, mais seulement de 0,7% pour Apple.

Les PC IA, capables de traiter les données plus rapidement que les PC traditionnels et de gérer de nombreuses tâches d’IA localement, sans recourir aux clouds IA, suscitent également un grand intérêt. Le cabinet d’études Canalys estime que les ventes de PC IA dépasseront les 100 millions d'unités en 2025, représentant 40% de tous les PC livrés. Ces PC sont équipés de processeurs spécialisés pour l'IA, appelés unités de traitement neuronal (NPU), capables d’exécuter environ 30 000 milliards d’opérations par seconde. Des marques comme Dell, HP, Samsung, Lenovo, Asus, Qualcomm, Microsoft/Surface et Acer ont annoncé la sortie de leurs modèles de PC IA.

Apple, souvent jugée en retard sur l'IA par rapport aux autres géants de la tech, a annoncé le 10 juin 2024 son service d'IA et d'IAG, "Apple Intelligence". Ce service combine plusieurs modèles d’IA, y compris celui d'Apple et ChatGPT, pour offrir des fonctionnalités personnalisées, privées et sécurisées sur Mac, iPhone et iPad. Craig Federighi d’Apple a mis en avant la confidentialité de ce service, précisant qu'il utilise des données personnelles sans les collecter, grâce à une exécution sur les appareils et sur des clouds privés, dont celui d'Apple. Intégré à iOS 18, iPadOS 18 et macOS Sequoia, "Apple Intelligence" utilise la puce IA d'Apple pour comprendre et générer du langage et des images, effectuer des tâches dans plusieurs applications et utiliser le contexte personnel pour rationaliser les activités quotidiennes."

Doutes et Interrogations

Malgré les avancées réelles dans les innovations et les performances de l'IA générative (IAG) depuis novembre 2022, il semble que la précipitation ait souvent présidé à la sortie rapide des nouveaux produits et à leur qualité discutable. "Les géants de l’IA continuent de faire des démonstrations plus rapidement qu’ils ne peuvent livrer les produits correspondants," déclare un journaliste de FastCompany.

En seulement sept jours en mai 2024, OpenAI a dévoilé son mode vocal ChatGPT avec le nouveau ChatGPT4-o, et Google a fait une avalanche d’annonces sur l’IA lors de sa conférence I/O, où le terme IA a été mentionné 121 fois dans le discours d'ouverture. Microsoft a également annoncé une série de nouveaux produits d'IAG, proclamant le début d'une nouvelle ère de l'IA.

Certains de ces produits ont connu des déboires : la démonstration d'OpenAI de son ChatGPT4-o avec interaction vocale est suspectée d'avoir été une simple "démo" et non une véritable fonctionnalité, car elle n'était pas disponible pour les utilisateurs. Google a dû gérer des réponses farfelues fournies par son assistant de recherche Overview, qui a conseillé de "manger des pierres et de mettre de la colle sur la pizza." Google a rapidement corrigé cette fonctionnalité, révélant ainsi les limites fondamentales de l'IAG, qui ne comprend pas réellement le monde ni les contextes, et qui est alimentée par un internet regorgeant d'informations non vérifiées qui peuvent être stupides, médiocres, non pertinentes et souvent absurdes.

Microsoft a également fait face à une réaction négative imprévue à son nouveau produit Windows Recall (Rappel), un outil d’IA conçu pour se souvenir de toutes les activités sur un PC Windows et permettre de "rappeler et revoir" rapidement ce que l'on a fait. Utilisant l’IA pour trier et indexer toutes les activités, cet outil permet une recherche sémantique en langage naturel. Cependant, de nombreux utilisateurs y ont vu un outil de surveillance inacceptable, obligeant Microsoft à rendre cette fonctionnalité optionnelle.

Certains attribuent cette précipitation à une influence négative de la culture de certaines startups de la Silicon Valley, où l'approche "fake it until you make it" (faire semblant que ça marche jusqu'à y parvenir) est parfois privilégiée, évoquant le désastre de Theranos. Cette comparaison paraît néanmoins exagérée.

La réaction actuelle à cette profusion d'annonces oscille entre scepticisme et admiration. Les promoteurs de l'IAG peuvent sembler trop idéalistes et radicaux, notamment lorsqu'ils dépeignent un avenir dominé par une Intelligence Artificielle Générale (IAG ou AGI en anglais) au moins égale aux compétences humaines et largement supérieure à ce dont nous disposons aujourd'hui. Des questions émergent sur la rationalité des surinvestissements, la viabilité économique de ces nouveaux produits et leur adoption réelle par les entreprises et les institutions.

La multiplicité des offres peut également créer de la confusion parmi les décideurs, qui pourraient préférer attendre de voir quelles solutions s'imposeront comme viables et durables après les premières phases d'expérimentations lancées en 2023. Certains estiment que l'attention accordée au grand public est excessive, même si elle constitue une formidable caisse de résonance instantanée pour les entreprises d'IAG et leurs produits, ce qui reste moins pertinent pour les professionnels.

Questions d'Éthique et de Sécurité de l'IAG

Des lanceurs d'alerte ont signalé des changements d'attitude des entreprises d'IAG, qui privilégient désormais la course aux nouveautés brillantes plutôt qu'un travail de fond axé sur l'éthique et la sécurité. Certains voient dans cette approche l'ombre du modèle économique préféré de la Silicon Valley : "demander pardon plutôt que la permission", c'est-à-dire avancer sans attendre un cadre réglementaire pour prendre le marché, et se conformer éventuellement aux règles une fois qu'elles seront établies.

Après avoir quelque peu négligé les aspects éthiques, les géants de l'IAG ont pris des mesures plus responsables. Par exemple, chez OpenAI, l'équipe dédiée à l'éthique avait été dissoute, entraînant le départ de plusieurs spécialistes. Cependant, en mai 2024, un "comité de sûreté et de sécurité" a été créé, dirigé par des membres du conseil d'administration.

Un Défi de la GenAI : L'Interprétabilité

L'une des préoccupations technologiques majeures est la question de l'"interprétabilité" de l'IA. Le fonctionnement interne des réseaux neuronaux utilisés par l'IAG est encore mal compris, rendant difficile la correction des dysfonctionnements ou des anomalies. En effet, on ne comprend pas le fonctionnement interne des réseaux neuronaux utilisés par l'IA et la GenIA.

Même avec des algorithmes complexes pour créer et entraîner ces systèmes, la rétro-ingénierie reste un défi. Jusqu'à présent. En effet, des avancées ont été réalisées. Un groupe d'ingénieurs d'OpenAI a publié des travaux sur les "sparse autoencodeurs", une technologie prometteuse "qui, nous l’espérons, sont interprétables par l’homme". Parmi les auteurs, Ilya Sutskever, cofondateur d'OpenAI, et Jan Leike, deux figures influentes de la tech, ont quitté OpenAI au deuxième trimestre.

Par ailleurs, la société Anthropic a récemment extrait des millions de caractéristiques compréhensibles de son modèle Claude 3 Sonnet pour progresser dans le rétro-ingénierie.

Réduction des Hallucinations et Autres Imperfections de l'IAG

Google affirme avoir fait des progrès significatifs en développant une "fenêtre contextuelle" plus large dans ses derniers modèles Gemini, permettant au système de mieux comprendre les situations complexes. D'autres recherches, notamment au MIT, visent à améliorer la compréhension du comportement humain dans les interactions avec l'IA. "Les humains ont tendance à se comporter de manière sous-optimale lorsqu'ils prennent des décisions. Cette irrationalité est particulièrement difficile à modéliser. Comprendre le comportement humain et en déduire ses objectifs pourrait rendre un assistant IA beaucoup plus utile."

Une nouvelle technique, le "Shaping model behavior", peut être utilisée pour prédire les actions des agents humains ou des agents IA se comportant de manière sous-optimale tout en poursuivant des objectifs inconnus. OpenAI a récemment publié des travaux sur ce sujet sous le nom de "Model Spec".

Le Besoin Croissant de Données de Qualité (Légalement Utilisées)

Le coût énorme de la création, de la mise au point et de l'exploitation des grands modèles de langage (LLMs) de l'IAG a révélé l'importance cruciale des données d'apprentissage. "Il est possible qu’un petit LLM avec des données soigneusement conçues soit plus performant qu’un grand modèle," déclarait Kyle Lo de l'Allen Institute for AI.

Au cours du premier semestre 2024, de nombreux contrats onéreux ont été signés entre opérateurs de LLMs, comme OpenAI, et des médias détenteurs de droits sur les textes. Par ailleurs, des travailleurs mal payés dans des pays du tiers monde sont souvent utilisés pour labelliser les images, corriger les textes ou filtrer les contenus inacceptables, afin d'enrichir les jeux de données.

L'Impact de l'IAG sur les Moteurs de Recherche sur Internet

L'intégration de l'IA générative (IAG) en 2023 a transformé les recherches en ligne en conversations interactives de type chatbot. Certains prédisaient une redistribution des parts de marché et l'émergence de nouveaux acteurs. Cependant, les chatbots IAG comme ChatGPT, limités par leur incapacité à accéder aux informations en temps réel, n'ont pas bouleversé l'écosystème des moteurs de recherche.

Pour pallier cette limitation, Google et Bing ont intégré l'IA à leurs moteurs, offrant des échanges conversationnels et des réponses actualisées. Des moteurs comme You.com et Perplexity AI proposent également des interfaces similaires, nativement basées sur l'IA.

Malgré ces innovations, la prédiction d'une augmentation significative de la part de marché de Bing ne s'est pas réalisée. En 2023, Bing a connu une augmentation de 40 millions d'utilisateurs actifs quotidiens, grace à l'IA et Copilot, mais a terminé l'année avec seulement 3,37 % du marché mondial de la recherche. En mai 2024, Google détenait 93,11 % du marché, contre 3,72 % pour Bing. Le PDG de Microsoft a même exprimé des doutes sur la capacité de l'IA de Bing à concurrencer Google.

Évolution des Fonctionnalités de Recherche avec Google Overview

Google a rapidement fait évoluer les fonctionnalités de son moteur de recherche avec Overview, qui génère périodiquement des résumés conversationnels en haut des pages de résultats. Pour certains annonceurs, cette fonctionnalité peut poser des problèmes commerciaux, car elle réduit l'importance des liens (URLs), diminuant potentiellement le trafic vers les sites Web d'environ 25 % selon le CIO de Raptive. Overview extrait des informations de nombreux sites, ce qui pourrait affecter leurs revenus.

Cependant, Google affirme qu'Overview incite les utilisateurs à effectuer davantage de recherches. Liz Reid de Google a déclaré à l'Associated Press que les utilisateurs posent des questions plus complexes et effectuent davantage de clics, même avec une vue d'ensemble fournie par l'IA. Google prévoit également de connecter les publicités à Overview, avec un déploiement prévu pour environ un milliard de personnes d'ici la fin de l'année.

La recherche sur internet devient plus complexe, selon John Wihbey, professeur à l'Université Northwestern."Les utilisateurs posent des questions tout en s’attendant à des réponses plus complexes, par exemple sur la gestion de la santé, les activités professionnelles et la famille. "Il y a une pression pour rendre l’IA plus agentique [capable de se comporter comme un agent intelligent], ce qui signifie que l’IA a le rôle d’aider les gens à résoudre des problèmes complexes et à anticiper les besoins des utilisateurs."

Perspectives Optimistes mais Prudentes pour la GenIA en 2024 et 2025

Dans ce contexte d'exubérance et de méfiance, il y a des signes de regain d'optimisme dans le capital-risque (VC), quelque peu marginalisé par les gros investisseurs BigTech en raison des coûts élevés d'entrée dans l'IAG. "Dans l’ensemble, ceux qui investissent dans les fonds de capital-risque (Limited Partners ou LPs) sont plus optimistes quant à la levée de fonds et au marché des introductions en bourse qu’ils ne l’étaient il y a un an", selon une note d'analyste de Pitchbook pour le 1er semestre 2024.

Les LPs s'attendent à des valorisations d'actifs plus attrayantes et à une normalisation des demandes de levées de fonds des startups devenues plus raisonnables
Bien que l’IA reste un domaine d’intérêt majeur, les investisseurs s'inquiètent du risque de surinvestissement dans l'IA. Les taux d'intérêt influencent le marché, tout comme la patience des fondateurs concernant les valorisations. Pour justifier les investissements, il faut que des revenus substantiels soient générés et que les entreprises s'engagent davantage dans l'IA.

Comme dans toutes les périodes d'euphorie technologique, de nombreuses startups vont émerger et beaucoup seront submergées et échoueront.
Toutefois, avec la grande vague actuelle d'innovations, "la marée qui monte soulève tous les bateaux".

Georges Nahon. le 11 juin 2024
Analyste des tendances de la tech numérique vues de la Silicon Valley. Auteur et conférencier.

Sources:
The Financial times, The Information, Sequoia Capital, The Wall Street Journal, Ben Evans, Scott Galloway, Kyle Lo, the Allen Institute for AI, Fortune, Fast Company, ZDnet, Windows Central, Pitchbook, Associated Press, Reuters, Northeastern Global News, Northwestern University, The New York Times, MIT News, relations professionnelles.