切换到宽版
  • 70阅读
  • 2回复

[智能应用]外界热议DeepSeek低调“上新” [1P] [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
124483
金币
84676
道行
20019
原创
752
奖券
34
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 13075(小时)
注册时间: 2012-06-21
最后登录: 2025-03-28
— 本帖被 兵马大元帅 执行加亮操作(2025-03-27) —
【环球时报报道 记者 刘扬】中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。

DeepSeek移动端页面 图源:视觉中国
在回答《环球时报》记者有关DeepSeek-V3新版本有哪些能力提升时,DeepSeek表示,一是新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。
清华大学新闻学院、人工智能学院教授沈阳25日对《环球时报》记者表示,DeepSeek-V3-0324不仅是V3系列的一次迭代,更是中国AI技术崛起的又一力证。其在性能、效率和开源策略上的综合优势使其在全球大语言模型领域占据重要地位。未来,DeepSeek可能通过推理能力提升和多模态扩展来巩固技术领先优势,同时在中美竞争和社区生态中寻找平衡。沈阳认为,DeepSeek-V3-0324的发布看似是一次“小更新”,但其性能跳跃表明该团队可能在为后续重大版本(如传言中的DeepSeek-R2或V4)铺路。
路透社今年2月底引述3名知情人士的说法宣称,DeepSeek原计划在今年5月初发布R2,但现在希望尽早推出,具体时间尚未透露。此外,DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。不过,外媒的相关传言并没有得到DeepSeek公司的证实与回应。
沈阳表示,DeepSeek-V3-0324的推出进一步凸显中国AI企业在技术与成本上的竞争力。美国对华GPU出口限制可能促使中国企业加速国产硬件适配,同时其开源模式或引发西方厂商的连锁动作,例如推出更强闭源模型。2025年可能是中美AI竞争的分水岭。
沈阳认为,在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,外界关注包括DeepSeek在内的中国头部大模型是不是最终也会出现这种合并的趋势。“这种可能是存在的,因为对于用户来说,并不关心大模型在回应自身问题时用的是什么类型的模型,更关心大模型能不能给出更为智能、合理的参考答案。”
1条评分金币+10
兵马大元帅 金币 +10 优秀文章,支持!n神马都是浮云 前天 19:01
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
124483
金币
84676
道行
20019
原创
752
奖券
34
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 13075(小时)
注册时间: 2012-06-21
最后登录: 2025-03-28
只看该作者 沙发  发表于: 03-26
外界热议DeepSeek低调“上新”详情
新版本基本信息
2025年3月24日深夜,中国人工智能初创公司深度求索(DeepSeek)低调上线了DeepSeek - V3的新版本DeepSeek - V3 - 0324,其参数量为6850亿。该版本在代码、数学、推理等多个方面的能力再次显著提升,代码能力追平美国Anthropic公司大模型Claude 3.7 。

版本策略与影响
开源策略
新版本采用开源策略,降低了开发者门槛,有助于吸引更多开发者参与到基于该模型的开发和创新中。

对中国AI技术的意义
专家认为此次更新是中国AI技术崛起的力证,可能为后续重大版本V4或R2铺路。在中美AI竞争背景下,该版本凸显了中国企业在技术与成本上的竞争力,2025年或成为中美AI竞争的分水岭。

引发外界关注方向
外界关注中国大模型是否会跟随国际趋势走向通用与推理模型融合。

DeepSeek发展历程回顾
工商信息变更
2025年2月15日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司高级管理人员备案发生多项变更,裴湉由执行董事兼总经理改任经理、董事,新增王贤祖为财务负责人。经营范围此前包含工程和技术研究和试验发展、人工智能应用软件开发等。

发布重要模型
2025年1月20日,深度求索正式发布DeepSeek - R1,并同步开源模型权重。该模型允许用户通过蒸馏技术借助R1训练其他模型,并上线API,对用户开放思想链输出。在仅有少数标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,可以比肩OpenAIo1正式版。

与大厂及高校合作
2025年2月,腾讯集团、百度、京东集团、阿里巴巴等多家互联网大厂旗下业务先后接入DeepSeek。如腾讯云、腾讯元宝App等业务接入,腾讯文档宣布接入DeepSeek - R1满血版;百度搜索全面接入DeepSeek和文心大模型深度搜索功能;京东云全面上线DeepSeek - R1/V3;阿里巴巴在云服务、1688、天猫精灵、国际业务等多个板块部署DeepSeek。多所高校也陆续宣布接入DeepSeek,2月17日,上海交大推出全国产化、“R1 + V3”全系列本地部署的满血版DeepSeek671B
1条评分金币+10
兵马大元帅 金币 +10 优秀文章,支持!n神马都是浮云 前天 19:01
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
138597
金币
43927
道行
1971
原创
2350
奖券
2508
斑龄
32
道券
903
获奖
0
座驾
设备
摄影级
在线时间: 32665(小时)
注册时间: 2008-10-01
最后登录: 2025-03-29
只看该作者 板凳  发表于: 03-26
  根据环球时报的报道,中国人工智能初创公司深度求索(DeepSeek)最近上线了DeepSeek-V3的新版本DeepSeek-V3-0324,这个版本在代码、数学、推理等多个方面的能力显著提升,参数量达到了6850亿。以下是关于DeepSeek-V3-0324的一些关键信息:

  1. 代码能力提升:新版本代码能力接近美国Anthropic公司的大模型Claude 3.7水平,能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。

  2. 数学与逻辑推理能力增强:在解决经典逻辑问题如“4升水壶问题”和数学竞赛题(如AIME 2025题目)时,表现接近专业推理模型。

  3. 模型架构与开源生态:V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,降低了开发者的使用门槛。

  4. 中国AI技术的崛起:清华大学教授沈阳认为,DeepSeek-V3-0324不仅是V3系列的一次迭代,更是中国AI技术崛起的又一力证。其性能、效率和开源策略上的综合优势使其在全球大语言模型领域占据重要地位。

  5. 未来发展方向:DeepSeek可能通过推理能力提升和多模态扩展来巩固技术领先优势,并在中美竞争和社区生态中寻找平衡。

  6. 传言中的新版本:有传言称DeepSeek计划发布R2版本,希望尽早推出,但具体时间尚未透露。DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。

  7. 中美AI竞争:2025年可能是中美AI竞争的分水岭,美国对华GPU出口限制可能促使中国企业加速国产硬件适配。同时,DeepSeek的开源模式可能引发西方厂商的连锁动作。

  8. 大模型融合趋势:在OpenAI公司GPT大模型将通用大模型和推理大模型融合的背景下,外界关注中国头部大模型是否也会出现这种合并趋势。对于用户来说,更关心的是大模型能否给出智能、合理的参考答案。

  总的来说,DeepSeek-V3-0324的发布显示了中国AI企业在技术与成本上的竞争力,同时也预示着未来中美在AI领域的竞争将更加激烈。DeepSeek的开源策略和技术创新有望在全球AI领域占据一席之地。

1条评分金币+10
兵马大元帅 金币 +10 优秀文章,支持!n神马都是浮云 前天 19:01
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个