Sur l’identité biométrique de DeepSeek …
Par analogie à une carte d'identité biométrique digne de ce nom, le phénoménal robot conversationnel chinois « DeepSeek » comporte aussi deux couches informationnelles, une première apparente visible à l'œil nu, et une autre latente, judicieusement enfouie à l'intérieur d'une puce intelligente renfermant les traits biométriques de la personne titulaire de la carte.
-I- DeepSeek en front office (interface)
- Nom juridique de la société : « DeepSeek » créée en 2023 par « Liang Wenfeng », 40 ans, titulaire d’une maîtrise en ingénierie de l’information et de la communication de l’université de « Zheijiang », propriétaire du fond spéculatif « High-Flyer » spécialisé dans la mise en place des stratégies d’investissement sur la base de projections IA.
- Nom commercial du chatbot : DeepSeek est proposé, principalement, en deux versions DeepSeek V3, un LLM à 600 milliards de paramètres & DeepSeek R1 un modèle de raisonnement.
- Secteur d'activité : les technologies IA, notamment dans la filière LLM (Large Language Model) dédiée au développement des capacités conversationnelles des chatbots.
- Siège social : basée à « Hangzhou », un pôle industriel et tertiaire important en Chine où siège le géant du numérique : « Alibaba Group ».
- Format de développement : le chatbot DeepSeek est proposé en libre licence (open source) ce qui explique, en grande partie, sa montée fulgurante à l’échelle planétaire dans un laps de temps record.
- Filiation : « DeepSeek » est une startup chinoise de souche.
-II- DeepSeek en back office (sur puce)
- Conjointement au fond spéculatif « High Flyers », « DeepSeek » est beacoup plus qu’une simple startup : c’est un laboratoire de recherche en IA regroupant des chercheurs en IA & en finance ayant dans son actif une multitude de versions de chatbots et d’applications IA en ingénierie boursier. Se concentrant sur la recherche fondamentale en IA, DeepSeek vise à atteindre « l’Intelligence Artificielle Générale » avant ses rivaux américains.
- Un écosystème politico-numérique favorable :
Jouissant d’un fort appui gouvernemental et d’une logistique de données massives (data center) en pleine expansion gravitant tout autour, DeepSeek évolue, certes, dans un environnement digi-politique hyper-stimulant. A ce titre, il suffit de citer les deux plus gros data center chinois au monde, implantés en Mongolie, appartenant aux puissants opérateurs étatiques « China Telecom » & « China Mobile »…
- Un format open source :
A l’opposé des solutions propriétaires comme ChatGpt 4 ou Gemini de Google, DeepSeek adopte une solution open source librement accessible, modifiable et exploitable par toute la communauté technologique favorisant ainsi l’innovation et la personnalisation des outils IA.
- Un modèle économique compétitif :
Le développement des modèles IA dépend largement d'une meilleure optimisation des coûts et de la puissance de calcul.
A cet égard, DeepSeek parvient à rivaliser GPT-4 qui a mobilisé environ 16 000 GPU et un investissement de 100 millions de dollars contre seulement 2 000 GPU et un budget de 6 millions de dollars pour DeepSeek. Cependant, faute de rapports officiels émanant de la direction de DeepSeek, ces chiffres sont à prendre avec prudence.
- Une modélisation algorithmique hybride :
Adoptant une démarche d’entrainement hybride qui consiste à combiner « l'apprentissage par renforcement » aux « méthodes d’apprentissage supervisé », DeepSeek a réussi à concevoir un modèle conversationnel optimisé et cohérent capable de mieux satisfaire les besoins des utilisateurs en termes de clarté et de précision dans les résultats.
- Une politique de « confidentialité » exhibitionniste :
En s’appuyant sur d’immenses ensembles de données issues d’Internet y compris des données personnelles, la politique de confidentialité de deepSeek l’autorise non seulement à collecter vos saisies au terme d’une session de conversation en coulisse (comme c’est le cas de toutes les autres plateformes IA), mais aussi à enregistrer votre adresse IP, à identifier votre localisation, à surveiller vos interactionss avec d’autres applications web et à effectuer des croisements de vos informations avec d’autres sources pour des fins de profilage publicitaire, politique ou social...
- Une gratuité de façade :
S’il est vrai que DeepSeek publie ses modèles sous licence open source, permettant une utilisation gratuite, il s’avère aussi important de signaler qu’en sus des coûts d’infrastructure (cloud, stockage, etc.) qui peuvent s’appliquer pour l’hébergement et à l’instar de tous ses rivaux (ChatGpt…), le département publicitaire de DeepSeek incarne parfaitement le slogan : « Quand c’est gratuit, c’est vous le produit », autrement dit, qu’au-delà de la gratuité d’apparence, nos données massives collectées par les chatbots et plateformes numériques génèrent des profits considérables.
- Un déficit de transparence :
Selon des tests effectués, DeepSeek prend une posture d'opacité en réponse à certaines requêtes d’internautes relatives aux événements de « Tianmen », du statut de l’île de « Taiwan » ou la question de la minorité musulmane « Ouighours »…
A suivre …
Par : Mahjoub Lotfi Belhedi
(Chercheur en réflexion stratégique // CEO d’un cabinet spécialisé en transformation digitale)
Votre commentaire