外界热议DeepSeek低调“上新”详情
新版本基本信息
2025年3月24日深夜,中国人工智能初创公司深度求索(DeepSeek)低调上线了DeepSeek - V3的新版本DeepSeek - V3 - 0324,其参数量为6850亿。该版本在代码、数学、推理等多个方面的能力再次显著提升,代码能力追平美国Anthropic公司大模型Claude 3.7 。
版本策略与影响
开源策略
新版本采用开源策略,降低了开发者门槛,有助于吸引更多开发者参与到基于该模型的开发和创新中。
对中国AI技术的意义
专家认为此次更新是中国AI技术崛起的力证,可能为后续重大版本V4或R2铺路。在中美AI竞争背景下,该版本凸显了中国企业在技术与成本上的竞争力,2025年或成为中美AI竞争的分水岭。
引发外界关注方向
外界关注中国大模型是否会跟随国际趋势走向通用与推理模型融合。
DeepSeek发展历程回顾
工商信息变更
2025年2月15日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司高级管理人员备案发生多项变更,裴湉由执行董事兼总经理改任经理、董事,新增王贤祖为财务负责人。经营范围此前包含工程和技术研究和试验发展、人工智能应用软件开发等。
发布重要模型
2025年1月20日,深度求索正式发布DeepSeek - R1,并同步开源模型权重。该模型允许用户通过蒸馏技术借助R1训练其他模型,并上线API,对用户开放思想链输出。在仅有少数标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,可以比肩OpenAIo1正式版。
与大厂及高校合作
2025年2月,腾讯集团、百度、京东集团、阿里巴巴等多家互联网大厂旗下业务先后接入DeepSeek。如腾讯云、腾讯元宝App等业务接入,腾讯文档宣布接入DeepSeek - R1满血版;百度搜索全面接入DeepSeek和文心大模型深度搜索功能;京东云全面上线DeepSeek - R1/V3;阿里巴巴在云服务、1688、天猫精灵、国际业务等多个板块部署DeepSeek。多所高校也陆续宣布接入DeepSeek,2月17日,上海交大推出全国产化、“R1 + V3”全系列本地部署的满血版DeepSeek671B