L’initiative de la semaine open source lancée par la startup d’IA chinois Deepseek s’est terminée vendredi par la sortie de son cinquième référentiel de code, présentant l’engagement de l’entreprise à favoriser un écosystème ouvert et collaboratif pour le développement de l’IA.
L’événement de cinq jours a vu Deepseek, basé à Hangzhou, dans la province du Zhejiang, réaliser cinq de ses référentiels de code – Flashmla, Deepp, Deepgemm, des stratégies de parallélisme optimisées et un système de fichiers Fire-Flyer (3FS) – librement accessible sur Github et le visage étreint.
Selon la société, ces outils sont « documentés, déployés et testés au combat ». Ils offrent une boîte à outils complète pour accélérer les flux de travail d’apprentissage automatique, affiner les modèles d’apprentissage en profondeur, améliorer l’efficacité de calcul et gérer des données à grande échelle.
Les référentiels de code de Deepseek ont remarquablement bien performé sur Github. Flashmla, par exemple, a recueilli plus de 5 000 étoiles dans les six heures suivant sa sortie.
L’excellence technique de ces codes a été largement reconnue. Shen Yang, professeur à l’Université de Tsinghua, a noté que ces outils et cadres d’IA représentent les progrès de haut niveau, en particulier dans l’optimisation du modèle de calcul distribué et de MOE (mélange d’experts).
« Leur innovation réside dans le comblement des lacunes technologiques, enrichissant l’écosystème open source et en explorant de nouvelles voies pour une formation et une inférence efficaces », a ajouté Shen.
D’autres distinctions ont été déversées de la contribution de la société chinoise à une révolution mondiale des développeurs, qui aidera à turbocier les solutions intelligentes de demain.
Fang Yi, PDG du fournisseur de données intelligent Getui à Hangzhou, a comparé l’initiative open-source de Deepseek à «l’ère Android», la décrivant comme un mouvement transformateur qui ouvre le paysage de l’IA. Cette approche permet aux développeurs du monde entier de s’engager rapidement dans le développement secondaire et de co-créer dans divers scénarios, intégrant une IA avancée dans diverses industries. «
Drago Ciliga, un expert en IA croate, a noté que l’initiative open-source de Deepseek prouve au monde que les outils les plus modernes ne sont pas un privilège mais sont accessibles à tout le monde afin que les pays plus petits puissent également bénéficier du développement de l’IA.
Walid Mehanna, chef des données et officier de l’IA du groupe pharmaceutique allemand Merck, a mis en évidence les progrès du développement transparent de Deepseek et les termes de licence attrayants à usage commercial.
« Deepseek-R1 est donc une option rentable, transparente, ouverte et haute performance », a-t-il déclaré.
Les internautes étrangers ont également salué les efforts de Deepseek, beaucoup rendant hommage à son équipe d’ingénierie pour leurs contributions révolutionnaires. Francisco Perlaza, un utilisateur de la plate-forme de médias sociaux X, a déclaré: « Excitant de voir @deepseek_ai embrasser les open source avec un tel esprit communautaire. C’est un grand pas vers la transparence et la collaboration. »
Ces opinions valident la vision originale de Deepseek. « Dans le cadre de la communauté open source, nous pensons que chaque ligne partagée devient une élan collective qui accélère le voyage. Il n’y a pas de tours d’ivoire – juste de l’énergie de garage pure et de l’innovation axée sur la communauté », a déclaré la société dans un article sur X avant de lancer la semaine open source.
Le fondateur de Deepseek, Liang Wenfeng, a également souligné lors d’une interview aux médias en juillet dernier, l’importance de promouvoir la collaboration et l’innovation à travers des principes open source. Il a souligné que la priorité absolue de l’entreprise est de créer un écosystème technologique robuste.
Wu Fei, professeur de l’Université de Zhejiang, a prédit que les modèles de tailles variables de Deepseek serviront de plateformes d’IA fondamentales à travers différents scénarios. « En tirant parti de leurs propres données, connaissances et expérience de l’industrie, les utilisateurs peuvent mener une formation spécialisée et un réglage fin, déverrouiller les possibilités infinies », a-t-il déclaré.