De 1 à 100 : la course à la commercialisation de l’IA dans l’économie de l’attention

Depuis des années, une expression familière circule dans le monde de la technologie : les États-Unis excellent dans l’innovation de « 0 à 1 », tandis que la Chine se spécialise dans l’innovation de « 1 à 100 ». L’expression n’a jamais été conçue comme une loi rigide, mais plutôt comme le reflet d’une phase historique particulière. Il est apparu lors du boom de l’Internet mobile, lorsque les avancées fondamentales – systèmes d’exploitation, architectures de base, premières plates-formes – ont été largement menées par les États-Unis, tandis que la Chine a démontré une capacité remarquable à traduire ces innovations en une adoption massive par le biais du commerce électronique, des paiements mobiles et des écosystèmes de contenu abrégé.

Pourtant, ce modèle « 0 à 1/1 à 100 » n’est pas universel : il est historiquement contingent. La question de savoir si cela s’applique à l’intelligence artificielle reste ouverte. S’il existe un seul fil conducteur reliant l’ère de l’Internet mobile à l’ère de l’IA, ce n’est pas simplement la capacité d’évolutivité, mais la concurrence pour une ressource bien plus fondamentale : l’attention. En ce sens, le passage de « 1 à 100 » ne consiste plus seulement à déployer une technologie à grande échelle ; il s’agit d’intégrer cette technologie dans le comportement quotidien en captant, stabilisant et monétisant l’attention humaine.

Dans le paysage actuel de l’IA, la phase « 0 à 1 » montre toujours une nette avance des États-Unis. Les modèles fondamentaux, les architectures de pointe et les capacités de pointe continuent d’y être concentrés. Dans le même temps, la phase « 1 pour 100 » – l’adoption massive – reste incomplète. Même aujourd’hui, de nombreux outils d’IA, en particulier les agents d’IA, sont encore principalement utilisés par des développeurs et des utilisateurs techniquement formés. La population en général n’a pas encore pleinement intégré l’IA dans ses routines quotidiennes.

Toutefois, les premiers signaux sont déjà visibles. En Chine, l’augmentation rapide de l’utilisation des grands modèles – mesurée par la consommation de jetons – a été moins motivée par la capacité supérieure des modèles que par les stratégies de tarification. L’accès gratuit ou à un coût extrêmement bas a propulsé les volumes d’utilisation au premier plan mondial, dépassant les modèles largement considérés comme plus avancés. Il ne s’agit pas là d’une preuve de domination technologique, mais d’une logique d’échelle différente : réduire le coût de l’interaction pour accroître la captation de l’attention. Des facteurs structurels, tels que des coûts énergétiques relativement inférieurs et des avantages en matière d’infrastructure, permettent d’étendre cette approche à grande échelle.

Au niveau de l’application, la tendance devient encore plus claire. En Chine, certains produits d’IA largement utilisés ne sont pas ceux dotés des capacités les plus puissantes, mais ceux qui minimisent les frictions et maximisent l’engagement. Ils intègrent plusieurs fonctions (texte, voix, image et vidéo) dans une seule interface, permettant aux utilisateurs d’interagir instantanément sans presque aucune courbe d’apprentissage. Leurs réponses peuvent être imparfaites, voire souvent incorrectes, dans des tâches complexes, mais ils excellent en réactivité, en ton et en continuité. En pratique, cela signifie que les utilisateurs ordinaires ne se tournent pas nécessairement vers ces systèmes pour la précision, mais pour l’interaction elle-même : conversation informelle, réconfort émotionnel ou engagement à faibles enjeux pendant les moments d’inactivité.

Cette distinction est cruciale. Dans un cadre de produit traditionnel, la performance définit la valeur. Dans un cadre axé sur l’attention, la formation d’habitudes définit la valeur. Les produits les plus populaires en ce sens ne sont peut-être pas ceux qui résolvent les problèmes les plus difficiles, mais ceux vers lesquels les utilisateurs reviennent le plus fréquemment.

La divergence entre la commercialisation de l’IA est peut-être plus visible non pas dans la capacité du modèle, mais dans la logique de monétisation – et peu d’exemples l’illustrent plus clairement que la génération vidéo.

Considérez Sora d’OpenAI, basé aux États-Unis. Largement reconnu comme l’un des systèmes de conversion texte-vidéo les plus avancés, il a démontré un niveau de réalisme visuel qui a établi une nouvelle référence. Pourtant, malgré sa force technique, il a eu du mal à se maintenir commercialement et a finalement été réduit. La raison n’était pas une limitation technologique, mais la structure économique. Son modèle reposait sur une logique familière : les utilisateurs paient directement pour l’accès, généralement via des abonnements et une utilisation coûteuse de l’API. Dans ce cadre, la valeur doit être clairement perçue, mesurable et digne d’être payée.

En Chine, en revanche, les modèles de génération vidéo, objectivement moins avancés, ont non seulement survécu, mais se sont rapidement développés. Leurs résultats n’ont peut-être pas le même niveau de réalisme, mais ils sont largement utilisés à grande échelle. La différence réside dans la façon dont ils sont intégrés dans une chaîne économique totalement différente – construite non pas sur le paiement direct, mais sur l’industrialisation de l’attention.

Par exemple, le processus commence par des micro-drames générés par l’IA, souvent distribués gratuitement. Ces vidéos ne sont pas conçues pour maximiser la qualité de production ou la profondeur narrative. Au lieu de cela, ils sont conçus pour l’immédiateté : des intrigues compressées, des arcs émotionnels exagérés et des cycles rapides de tension et de libération. En quelques minutes, ils livrent une expérience émotionnelle complète – vengeance, renversement, triomphe – nécessitant un effort cognitif minimal. Les utilisateurs peuvent pleinement reconnaître leur simplicité, voire les rejeter comme étant de mauvaise qualité, tout en continuant à interagir avec eux. La clé n’est pas la persuasion, mais la disponibilité. Lorsque le coût est nul, l’attention devient la seule monnaie requise.

À ce stade, la monétisation n’a pas encore eu lieu. Elle est différée. Le système capte d’abord l’attention, puis la redirige.

La première semaine du lancement du modèle Xiaomi MiMo-V2-Pro voit la consommation de jetons dépasser les 3 000 milliards, Chine, 27 mars 2026. / VCG

La publicité est insérée, mais plutôt que de promouvoir des produits conventionnels, elle redirige souvent les utilisateurs vers d’autres environnements médiés par l’IA, notamment les jeux mobiles. Ces jeux sont de plus en plus produits par l’IA, depuis la génération de contenu jusqu’aux mécaniques de gameplay.

Une fois à l’intérieur, la logique passe de la capture de l’attention à la rétention de l’attention. L’expérience reste fluide au départ : aucun coût initial, des récompenses immédiates et une progression rapide. Ce n’est qu’une fois l’engagement établi que la monétisation commence, généralement sous des formes progressives – de petits paiements présentés comme des améliorations facultatives. Cependant, à mesure que les utilisateurs investissent du temps et des efforts, leur comportement change. Ce qui commence comme une interaction informelle peut évoluer vers une participation soutenue, où les dépenses ne sont plus une décision discrète mais font partie d’une boucle continue façonnée par le progrès, la compétition et l’engagement psychologique.

Une réalité moins discutée mais cruciale de l’économie de l’attention est que la demande n’est pas toujours rationnelle. En pratique, l’engagement à grande échelle est souvent motivé par des forces totalement différentes : une stimulation émotionnelle, une gratification instantanée et un contenu qui nécessite un effort cognitif minimal. La répétition, la simplicité et l’immédiateté – plutôt que la sophistication – sont ce qui maintient l’attention à grande échelle.

Cela crée une tension structurelle. Les formes de contenu les plus efficaces pour capter l’attention ne sont pas nécessairement celles qui ont la plus grande valeur intrinsèque, ni celles pour lesquelles les utilisateurs choisiraient consciemment de payer. Pourtant, ils génèrent l’engagement même dont dépend la monétisation.

Vu isolément, chaque niveau de ce système apparaît économiquement déraisonnable. Mais pris ensemble, ils forment une structure continue dans laquelle l’attention est captée, redirigée et convertie en revenus à travers plusieurs étapes.

Surtout, ce système ne repose pas sur l’attribution par les utilisateurs d’une valeur explicite à un seul produit. En fait, de nombreux utilisateurs peuvent rejeter complètement l’idée de payer pour le contenu original. Au lieu de cela, la valeur émerge indirectement, grâce à un engagement soutenu et à des modèles de comportement accumulés au fil du temps.

En ce sens, la divergence entre les différentes stratégies de commercialisation de l’IA ne concerne pas simplement la stratégie de prix, mais aussi les hypothèses sous-jacentes en matière de demande. Une approche suppose que les utilisateurs paient pour la qualité. L’autre considère l’attention comme le produit principal, la capturant d’abord et seulement ensuite, incitant les utilisateurs – souvent indirectement – à payer pour cela. Et c’est cet écart – entre ce que les utilisateurs disent apprécier et la façon dont ils se comportent réellement – qui crée l’espace pour une voie d’évolution fondamentalement différente.

Vue sous cet angle, la question du « 0 pour 1 » par rapport au « 1 pour 100 » concerne moins la géographie que la structure économique. Passer de « 1 à 100 » consiste à transformer rapidement ces modèles en systèmes capturant l’attention et intégrés à la vie quotidienne.

L’expérience de la Chine à l’ère de l’Internet mobile suggère une forte capacité dans ce domaine : réduire les frictions d’interface et concevoir des produits qui s’alignent sur le comportement humain réel, parfois contradictoire. Dans le même temps, cette approche soulève ses propres tensions, notamment sur la répartition des ressources entre innovation de pointe et commercialisation à grande échelle, ainsi que sur des questions plus larges sur la qualité et l’orientation de la consommation numérique.

Il reste incertain si ce schéma se répétera à l’ère de l’IA. L’IA peut brouiller la frontière entre innovation et application, au point de rendre l’ancien cadre moins pertinent. Mais il est de plus en plus difficile d’ignorer une réalité sous-jacente.

Si l’économie traditionnelle est définie par la rareté des ressources, alors la rareté déterminante de l’ère de l’IA est l’attention. Et dans cette compétition de commercialisation de l’IA, la capacité technologique n’est que le point de départ. Le facteur décisif pourrait en fin de compte être de savoir qui pourra le plus efficacement transformer l’intelligence en habitude – et l’habitude en économie.

(Couverture via VCG)

Notre média