Le PDG de Microsoft dit que Deepseek a une «véritable innovation» et est une «bonne nouvelle»

Deepseek, le modèle d’IA chinois qui a choqué l’industrie technologique et perturbé Wall Street avec son coût et ses bonnes performances nettement faibles, a « une véritable innovation » et est « toutes bonnes nouvelles », a déclaré Satya Nadella, PDG de Microsoft.

Mercredi, Nadella a fait le commentaire lors de l’appel trimestriel du géant du logiciel américain, affirmant que l’IA n’était « pas différente » de l’informatique régulière dans les cycles de développement.

Microsoft a commencé à offrir le modèle de raisonnement Deepseek-R1, un modèle d’IA qui expose son « processus de réflexion » pour les utilisateurs, aux utilisateurs de la plate-forme cloud de Microsoft le même jour.

Microsoft, un important investisseur de la rivale américaine de Deepseek, OpenAI, sonde également si le développeur d’IA chinois a obtenu la production de données d’OpenAI d’une manière non autorisée.

Openai a déclaré aux médias qu’ils avaient des preuves de Deepseek en utilisant le service d’Openai pour former leurs modèles d’IA, un comportement qui n’est pas autorisé dans les conditions d’utilisation d’Openai.

Mais ni Openai ni Microsoft n’ont proposé de preuves.

Bien que la sonde soit en cours, un responsable nommé de l’administration Trump appelle déjà Deepseek à utiliser la technologie américaine « volée ».

Howard Lutnick, le candidat de Trump pour le secrétaire au commerce, a déclaré mercredi aux sénateurs américains que le gouvernement aborderait la question.

Pendant ce temps, le conseiller de l’IA de Trump, David Sacks, a déclaré à Media qu’il y avait « des preuves substantielles » que Deepseek « a distillé les connaissances » des modèles d’Openai.

« La distillation violera la plupart des conditions de service, mais elle est ironique – ou même hypocrite – que Big Tech l’appelle », a déclaré mercredi l’investisseur technologique et conférencier de l’Université Cornell dans un communiqué. « La formation de la formation sur le contenu de Forbes ou du New York Times a également violé leurs conditions de service. »

La distillation est un processus dans lequel un nouveau modèle d’IA interroge à plusieurs reprises un plus grand et apprend de la sortie.

Le processus est décrit dans les documents de recherche publics de Deepseek, mais les chercheurs ont déclaré qu’il avait été utilisé différemment. Selon la société basée à Hangzhou, il a utilisé le modèle de raisonnement Deepseek-R1 comme « plus grand » pour « enseigner » d’autres modèles comme Qwen et Meta’s Llama d’Alibaba afin qu’ils deviennent également capables de raisonner.

Les modèles distillés et le R1 d’origine ont été publiés pour télécharger gratuitement par Deepseek, permettant aux personnes avec des ordinateurs moins puissants, ou même des smartphones, d’exécuter les modèles hors ligne avec un contrôle total, ce qui est impossible pour les utilisateurs de Chatgpt car le modèle derrière le service Openai est caché même aux utilisateurs payants.

Les publications sur les réseaux sociaux ont déclaré que Deepseek s’identifie parfois comme un chatppt, ce qui pourrait être une preuve de vol de données. Mais comme tous les autres modèles d’IA, Deepseek ne dit pas toujours la vérité. Une version précédente du chatbot Google Gemini s’est identifiée comme le bot Ernie de Baidu lorsqu’on lui a demandé en chinois, mais Baidu n’a jamais accusé Google de voler des données.

(Avec la contribution des agences)

Notre média