Un laboratoire d’intelligence artificielle basé à Hangzho, la province du Zhejiang de la Chine orientale, a mis la Silicon Valley en avant avec la publication de son modèle de pointe, formé à une fraction du coût des modèles traditionnels tels que le chatgpt d’Openai. La percée a suscité des critiques de nombreux experts de l’IA en ligne, qui le décrivent comme un « contre-productif » à la tentative des États-Unis de limiter les ambitions de haute technologie de la Chine.
Deepseek, fondé par le directeur des fonds spéculatifs, Liang Wenfeng, a dévoilé son modèle R1 lundi dernier, accompagné d’un document détaillé décrivant comment former un modèle d’apprentissage par renforcement à grande échelle (RL) sans s’appuyer sur le réglage fin supervisé (SFT) comme étape préliminaire .
En quelques jours, l’application de Deepseek a grimpé en flèche sur les graphiques d’applications gratuits de l’iPhone en Chine et aux États-Unis, dépassant le Chatgpt autrefois dominant.
La publication du modèle R1 de Deepseek a déclenché un débat houleux dans la Silicon Valley sur la question de savoir si des sociétés d’IA américaines mieux ressources, y compris Meta et Openai, peuvent maintenir leur avantage technologique.
Pendant ce temps, Liang est devenu un point focal de discussion en Chine. La semaine dernière, il a été invité à un symposium à Pékin, où le premier ministre chinois Li Qiang a demandé des opinions et des suggestions à des experts, des entrepreneurs et des représentants dans divers secteurs – y compris l’éducation, la science, la culture, la santé et le sport – sur un projet de rapport sur le travail du gouvernement, .
Liang Wenfeng est diplômé de l’Université de Zhejiang avec un diplôme en intelligence artificielle. Il a cofondé le fonds spéculatif quantitatif en 2016, qui a rapidement acquis sa reconnaissance pour son utilisation innovante des stratégies commerciales axées sur l’IA. D’ici 2021, High Flyer avait entièrement intégré l’IA dans ses opérations, en utilisant des modèles d’apprentissage automatique pour prédire les tendances du marché et prendre des décisions d’investissement basées sur les données.
En mai 2023, Liang a fait un pas audacieux en fondant Deepseek, visant des recherches axées sur l’IA pour faire progresser le domaine de l’intelligence artificielle générale (AGI). Contrairement aux entreprises traditionnelles à but lucratif, Deepseek a été envisagé comme une plate-forme pour la recherche fondamentale à long terme, où l’exploration axée sur la curiosité pourrait entraîner des progrès significatifs dans l’IA.
Liang Wenfeng est resté peu profond, accordant des interviews uniquement à une sous-marque des médias technologiques commerciaux de la Chine 36KR, en 2023 et 2024. Vous trouverez ci-dessous des extraits de ces interviews, offrant un aperçu de sa philosophie et de sa vision.
Pour Liang, Deepseek ressemble plus à un projet ou un passe-temps parallèle, motivé par une profonde curiosité et un engagement envers la recherche fondamentale. Il reconnaît que la recherche fondamentale donne souvent un faible rendement immédiat sur l’investissement, mais il est captivé par le défi d’explorer des domaines complexes comme la finance et le potentiel de l’intelligence générale artificielle (AGI). L’accent de Liang est de comprendre l’essence de l’intelligence humaine et les processus qui le sous-tendent, estimant qu’une telle exploration est cruciale malgré le manque d’incitations commerciales immédiates.
「人类智能本质可能就是语言 , 人的思维可能就是一个语言的过程。你以为你在思考 , 其实可能是你在脑子里编织语言。这意味着 , 在语言大模型上可能诞生出类人的人工智能 (AGI) 。」
「当时我们尝试了很多场景 , 最终切入了足够复杂的金融 , 而通用人工智能可能是下一个最难的事之一 , 所以对我们来说 , 这是一个怎么做的问题 , 而不是为什么做的问题」
「如果一定要找一个商业上的理由 , 它可能是找不到的 , 因为划不来。从商业角度来讲 , 基础研究就是投入回报比很低的。」
Le profil LinkedIn de Deepseek montre que la société a une équipe de moins de 10 personnes. Un membre aurait été braconné par Lei Jun de Xiaomi pour travailler sur le développement de l’IA en décembre 2024. Liang croit qu’il faut découvrir des talents en Chine.
「如果追求短期目标 , 找现成有经验的人是对的。但如果看长远 , 经验就没那么重要 , 基础能力、创造性、热爱等更重要。从这个角度看 , 国内合适的候选人就不少。」
「因为我们在做最难的事。对顶级人才吸引最大的 , 肯定是去解决世界上最难的问题。其实 , 顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了, 使得他们没有机会被识别出来。我们在做最难的事 , 对他们就是有吸引力的。」
L’innovation nécessite la liberté et la place des essais et des erreurs. Il a noté que l’innovation émerge souvent naturellement, plutôt que d’être planifiée ou enseignée.
「我们的总结是 , 创新需要尽可能少的干预和管理 , 让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的 , 不是刻意安排的 , 更不是教出来的。」
「创新就是昂贵且低效的 , 有时候伴随着浪费。所以经济发展到一定程度之后 , 才能够出现创新。很穷的时候 , 或者不是创新驱动的行业 , 成本和效率非常关键。看 Openai 也是烧了很多钱才出来。」
Liang estime que la Chine ne peut pas rester un suiveur en IA pour toujours. Dans les entretiens, il souligne la nécessité pour la Chine de passer de l’imitation à l’originalité et de construire son propre écosystème technologique.
「我们看到的是中国 Ai 不可能永远处在跟随的位置。我们经常说中国 Ai 和美国有一两年差距 , 但真实的 GAP 是原创和模仿之差。如果这个不改变 , 中国永远只能是追随者 , 所以有些探索也是逃不掉的。」
「英伟达的领先 , 不只是一个公司的努力 , 而是整个西方技术社区和产业 同努力的结果。他们能看到下一代的技术趋势同努力的结果。他们能看到下一代的技术趋势 , 手里有路线图。中国 Ai 的发展 , 同样需要这样的生态。很多国产芯片发展不起来 , 也是因为缺乏配套的技术社区 , 只有第二手消息 , 所以中国必然需要有人站到技术的前沿。」