查看完整版本: [-- Kimi万亿模型"横空出世",小鹏人形机器人“以假乱真”! --]

武当休闲山庄 -> 数码讨论 -> Kimi万亿模型"横空出世",小鹏人形机器人“以假乱真”! [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

姜谷粉丝 2025-11-10 14:17
在数学、编程和智能体基准测试中,Kimi K2 Thinking的表现可媲美GPT-5和Claude 4.5 Thinking:在Humanities Last Exam (HLE) 测试中得分44.9%,在SWE-bench验证集测试中得分71.3%,在BrowseComp (智能体搜索)测试中得分60.2%。

这款模型不仅在写作、编码和推理方面具备优异的通用能力,在智能体任务和工具调用方面表现更为出色。它能在无人干预的情况下连续调用工具200到300次,通过数百个步骤的连贯推理来解决复杂问题。Kimi K2 Thinking采用的是量化感知训练(QAT)技术,确保其量化版本不会降低输出质量。鉴于其基准测试结果是基于INT4精度得出的,这更显得模型表现尤为抢眼。
这可能是自DeepSeek R1发布以来,中国企业推出的最重要的AI模型。它再次表明,中国AI实验室正在缩小与美国顶尖AI实验室的差距。
锐评:这次中国AI卷的不是文案,是能做事会做事。
二、AI技术与产品发布——从“算地球”到“换人脸”,大厂“炫技”停不下来
1. 新闻:艾伦人工智能研究所(AI2)推出开源的端到端“地球智能”平台OlmoEarth,旨在利用地球观测数据帮助人们深入理解地球运行机制。其中包含:

OlmoEarth基础模型:基于地球观测数据训练的小型AI模型,参数从140万到3亿不等,用于执行场景识别或图像语义分割等地理空间相关任务;OlmoEarth Studio:用于数据集建模和微调的功能;OlmoEarth Run:地球建模流程引擎;OlmoEarth Projects:经过微调的地球智能实用模型。
锐评:以后AI上算天下算地,中间算空气。
2. 新闻:微软将自研的文生图模型MAI-Image-1整合进Bing Image Creator和Copilot。这款模型能快速生成高质量的食物、自然和现实世界场景图像,使微软摆脱对OpenAI图像生成技术的依赖。
锐评:微软终于不靠OpenAI画图了,决定自己动手丰衣足食。
3. 新闻:美团龙猫团队发布全模态开源模型LongCat Flash Omni,采用MoE架构,总参数量5600亿,激活参数量270亿。技术报告显示,这款模型在多模态基准测试中达到了SOTA水平。
锐评:美团这次不送外卖,改送模型。
4. 新闻:中国电动汽车公司小鹏发布IRON人形机器人。该公司称这款机器人“最像人”,有柔性皮肤和仿生肌肉。人形骨骼、肌肉和皮肤结构使这款机器人成为迄今最接近人类的机器人,甚至引发了有关“恐怖谷效应”和“科幻成真”的讨论。小鹏还同步发布了VLA 2.0大模型,这是一款用于具身AI的视觉-语言-行动模型,适用于自动驾驶汽车和AI机器人。





何小鹏泪洒当场!现场剪掉机器人肌肉自证清白!(来源:科技大佬见闻)


    锐评:过去总有人说小鹏汽车模仿特斯拉,这次要反过来了。
    5. 新闻:Cognition公司发布Windsurf Codemaps。这款工具由SWE-1.5和Sonnet 4.5提供支持。它能帮助开发者理解复杂的代码结构,就像为代码库打造的Notebook LM。
    锐评:Cognition掏出“代码活地图”,程序员再也不会迷路了。
    6. 新闻:Maya Research团队发布Maya1开源语音生成模型,参数量30亿。这款文本转语音模型在质量基准测试中攀升至开源权重语音AI模型的第二名,在全球模型中排名第二十。其演示与模型权重现已上线HuggingFace平台。
    锐评:AI已经不只会说话,还会“说得好听”
    7. 新闻:谷歌在Gemini API中引入文件搜索工具(File Search Tool),提供端到端的检索增强生成(RAG)功能,为开发者简化了复杂的RAG流程。它支持内置引用、多种文件格式和强大的语义向量搜索。此外,谷歌的无代码应用构建工具Opal现已覆盖全球160多个国家和地区。
    锐评:让开发者一键就能搞定头疼的RAG。
    8. 新闻:Mozilla.ai发布开源接口any-llm 1.0,允许开发者将云端和本地的任意模型接入AI工作流。any-llm通过统一的API将项目逻辑与模型提供商解耦,使开发者无需重写集成代码即可自由切换模型。
    锐评:想接谁接谁,实现模型自由不是梦。
    9. 新闻:Higgsfield发布Recast功能,允许用户将任意视频中的角色替换为另一个角色。
    锐评:AI让“主演换人不换戏”成为影视圈新常态。
    10. 新闻:Sora现已登陆Android平台,让Sora 2的高级视频生成功能覆盖更多用户。但目前Android用户仍需邀请码才能使用Sora的生成功能,且仅有部分国家和地区开放。
    锐评:Sora空降安卓,前提是你得有邀请码。
    11. 新闻:谷歌新一代图像生成模型Nano Banana 2最早或将于下周发布。前作Nano Banana因其在图像编辑方面达到SOTA水平而广受欢迎,其升级版预计将大幅提升AI辅助创作工作流的效率。
    锐评:AI绘画圈的传说要开续集了。
    三、AI研究资讯——谷歌嫌地球电费贵,准备玩“算力上天”
    新闻:作为天基AI基础设施项目Suncatcher的组成部分,谷歌将于2027年发射两颗搭载TPU AI芯片的卫星。该项目设想未来由多颗卫星组成的太空数据中心,通过卫星间光通信链路传输数据,执行分布式AI任务。谷歌希望在未来几十年,天基数据中心的成本效益或将超过地面数据中心,因为太阳能板在轨道上的效率比地面高出8倍。

    锐评:省的电够不够发卫星的成本?
    四、AI商业与政策——OpenAI豪掷千金,苹果低头付钱
    1. 新闻:据报道,苹果正与谷歌达成协议,拟每年支付10亿美元,在下一代Siri语音助手中使用参数量达1.2万亿的谷歌AI模型。这意味着苹果在Siri的AI能力上再度依赖外部技术。长期未更新的Siri已让苹果在AI竞赛中明显落后。
    锐评:Siri终于要变聪明,但脑子是谷歌的。
    2. 新闻:OpenAI发布《青少年安全蓝图》,旨在指导AI产品和政策如何保护青少年安全以及如何更好地为青少年赋能。该蓝图强调适龄设计、有效的安全机制,以及持续的研究和评估。OpenAI表示,公司正积极为旗下产品部署家长控制与年龄预测系统等保护机制,而不是被动等待有关AI如何保护青少年的监管规定。
    锐评:OpenAI想证明,关心下一代,我们是认真的。
    3. 新闻:OpenAI与亚马逊宣布达成总额380亿美元的协议。OpenAI将在AWS基础设施上运行模型,以获取对数十万块英伟达芯片的访问权。这一举措进一步强化了OpenAI的算力与云端部署能力,从而更好地支撑ChatGPT的推理和训练。
    锐评:豪掷380亿,只为喂饱ChatGPT。
    4. 新闻:OpenAI宣布全球已经有100万家企业正在直接使用其公司服务。该公告介绍称,统计口径包括所有主动为商业用途付费的组织,以及通过开发者平台直接消费模型的企业。该公司此前在9月初曾披露,包含ChatGPT企业用户和校园版ChatGPT Edu的用户数量破百万。
    锐评:看来都尝到了用AI上班划水的好。
    5. 新闻:周三,英伟达CEO黄仁勋在接受采访时称,“中国将赢得人工智能竞赛”,理由是更有利的监管环境和更低的能源成本。这被视为黄仁勋迄今为止对中美AI竞赛作出的“最直白的表态”。

    锐评:老黄说了句大实话。
    6. 新闻:黄仁勋本周末再度访问台积电,亲赴芯片产线并罕见出席台积电职工运动会。这也是黄仁勋近3个月来第3次访问台积电。对于此次访问的目的,黄仁勋表示其公司最先进的Blackwell芯片正面临“非常强劲的需求”,因此对台积电晶圆的需求也在增长。他说道:“英伟达制造GPU,我们也制造CPU、网络设备、交换机,所以有很多与Blackwell相关的芯片。而且公司也正在努力研发下一代Rubin芯片。”台积电CEO魏哲家则直白地表示“黄仁勋想要更多芯片”,但被问及具体数量时,魏哲家笑称“这是机密!”
    锐评:这是来催货了。
    7. 新闻:全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里通义千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。
    锐评:论炒股,还得是国产。
    8. 新闻:Perplexity表示,亚马逊发出法律威胁,试图阻止Comet AI助手在亚马逊平台购物。Perplexity指责这是“霸凌”,认为亚马逊是想通过控制AI购物智能体来实现平台利润最大化。相比之下,Shopify正积极迎合AI智能体在电商购物领域的新角色。Shopify表示,自今年1月份以来,AI流量增长了7倍,AI下的订单增长了11倍。Shopify已经在与Perplexity和微软合作开发聊天内购物体验,并与OpenAI合作深度集成ChatGPT。
    锐评:亚马逊不让AI购物,是因为它不充会员。
    9. 新闻:Anthropic宣布在巴黎和慕尼黑新设办事处,加速扩张全球业务。欧洲是Anthropic增长最快的地区,Claude AI让该公司的欧洲营收同比增长逾9倍。Anthropic的目标是2026年实现200亿至260亿美元的年化经常性收入。
    锐评:看来在欧洲是真赚到钱了。
    10. 新闻:美联社宣布推出结构化数据产品AP Intelligence,将经过核实的新闻报道转化为可用于AI和数据分析的行业数据集与信息源。
    锐评:老牌媒体开始卖数据了,“真相”正式打包成API格式。
    11. 新闻:面对来自大型科技公司的压力以及与美国在贸易问题上的磋商,欧盟委员会考虑暂停实施《AI法案》的部分条款。尽管法案已于2024年8月正式生效,但某些条款的实施时间可能会推迟。
    锐评:欧洲AI监管也是雷声大雨点小。
    五、AI观点与文章——卡戴珊考试挂科怪AI,“码农”编程全靠“感觉”了
    1. 新闻:在接受《名利场》(Vanity Fair)采访时,美国网红金·卡戴珊 (Kim Kardashian) 谈到ChatGPT对于她可谓“亦敌亦友”。她表示因使用ChatGPT获取法律建议,自己未能通过美国司法考试,并指责模型“幻觉”生成的错误信息导致失分。这再次引发公众对大语言模型生成虚假答案、造成现实后果的关注。
    锐评:考不好不能怪AI,还是要从自己身上找原因。
    2. 新闻:《柯林斯词典》2025年度热词为“氛围编程”(vibe coding)”,意指使用自然语言提示词来让AI编写代码或生成应用程序。AI不仅在改变世界,也在改变语言本身。


    姜谷粉丝 2025-11-10 14:19
    国产AI双响炮,技术突破+拟真进化
    Kimi和小鹏分别在大模型智能体与人形机器人领域实现了关键跃迁,一个以“思考型AI”挑战GPT-5,一个以“类人步态”打破公众认知边界。

    🔍 背景:2025年11月,中国AI迎来高光时刻
    近期,月之暗面(Moonshot AI)和小鹏汽车相继发布里程碑式产品,引发全球关注。Kimi K2Thinking模型被称作“中国企业最重要的AI进展之一”,而小鹏IRON机器人则因拟真度太高被质疑“真人扮演”,足见其震撼力。

    🧠 Kimi万亿模型:能自主做事的“思考者”
    Kimi推出的K2Thinking是一款专为AI智能体设计的开源推理模型,具备真正的“边思考、边行动”能力。

    维度    参数/表现
    模型架构    混合专家(MoE),总参数1万亿,激活320亿
    上下文长度    最长支持25.6万词元
    核心能力    自主调用工具200–300次,解决复杂任务
    训练成本    仅460万美元,远低于GPT-5的数十亿美元
    关键测试表现    HLE人类终极考试44.9%,SWE-bench编程验证71.3%
    该模型采用量化感知训练(QAT),确保压缩后性能不降,且API价格仅为GPT-5的十分之一,性价比极高8。

    🤖 小鹏人形机器人:以假乱真的“具身智能”
    小鹏发布的IRON机器人因其女性形态与“猫步行走”引发热议,动作自然到被网友怀疑“内部藏人”。

    特性    说明
    外观设计    全包覆柔性皮肤、仿生肌肉、仿人脊椎结构
    核心硬件    搭载3颗图灵AI芯片,算力2250TOPS
    动力系统    首发全固态电池,续航8小时
    智能系统    支持第二代VLA(视觉-语言-动作)与VLT大模型
    量产计划    目标2026年底量产,优先用于导览、巡检场景
    为回应质疑,何小鹏发布一镜到底视频,现场剪开机器人腿部,展示内部机械结构,硬核自证清白22。

    💡 建议:关注落地场景与长期价值
    虽然两项技术尚处早期,但已展现出明确的商业化路径:

    Kimi K2Thinking 可赋能企业级AI Agent,在编程、搜索、自动化办公等领域快速落地;
    小鹏IRON 将率先在门店、工厂等场景试用,未来或进入家庭服务领域。
    两者都标志着中国AI从“模仿追赶”转向“原创引领”。

    jjybzxw 2025-11-10 15:01
    AI领域动态全景解析:技术突破、商业博弈与生态重构  

    一、中国AI模型崛起:从“追赶”到“并跑”的跨越  
    Kimi K2 Thinking的发布标志着中国AI实验室在通用能力与工具调用上的突破。其核心优势体现在:  
    1. 多任务处理能力:在HLE测试中得分44.9%(接近人类平均水平),SWE-bench验证集得分71.3%(超越多数开源模型),BrowseComp测试中得分60.2%(智能体搜索能力突出)。  
    2. 长链条推理:支持200-300次无人干预工具调用,通过数百步连贯推理解决复杂问题(如自动化客服、科研数据分析)。  
    3. 量化感知训练(QAT):INT4精度下输出质量不降级,降低部署成本,适合边缘计算场景。  

    战略意义:  
    - 中国AI实验室通过“通用能力+垂直场景”双轮驱动,缩小与美国顶尖模型的差距。  
    - Kimi K2的商业化路径或聚焦企业服务(如自动化流程、智能客服),与DeepSeek R1形成互补。  

    二、AI技术与产品发布:从“炫技”到“实用”的转型  
    1. OlmoEarth:地球智能平台  
       - 功能:基于地球观测数据的地理空间模型(140万-3亿参数),支持场景识别、图像分割、气候建模。  
       - 意义:AI从“算人”转向“算地球”,推动环境监测、灾害预警等领域变革。  

    2. 微软MAI-Image-1:摆脱OpenAI依赖  
       - 技术:自研文生图模型,专注食物、自然场景生成,速度与质量优于DALL·E 3。  
       - 商业逻辑:微软通过“Copilot+Bing”生态构建闭环,减少对第三方API的依赖。  

    3. 美团LongCat Flash Omni:多模态SOTA  
       - 架构:MoE(混合专家)模型,总参数量5600亿,激活参数量270亿。  
       - 场景:外卖、旅游、本地生活服务中的图像理解与交互优化。  

    4. 小鹏IRON人形机器人:具身AI的突破  
       - 设计:柔性皮肤、仿生肌肉、类人骨骼,VLA 2.0模型支持自动驾驶与机器人协同。  
       - 争议:“恐怖谷效应”引发伦理讨论,但技术成熟度领先特斯拉Optimus。  

    三、AI研究前沿:从“地面”到“太空”的算力革命  
    1. 谷歌Suncatcher项目:天基AI数据中心  
       - 计划:2027年发射两颗搭载TPU的卫星,构建太空分布式计算网络。  
       - 优势:太阳能效率提升8倍,降低数据中心能耗与散热成本。  
       - 挑战:卫星间光通信延迟、太空辐射对硬件的影响。  

    2. AI绘画与视频生成:从“静态”到“动态”  
       - Nano Banana 2:图像编辑SOTA,支持一键修图、背景替换。  
       - Sora Android版:高级视频生成功能下放,但邀请码机制限制普及速度。  
       - Higgsfield Recast:角色替换技术或颠覆影视制作流程。  

    四、AI商业与政策:巨头博弈与监管博弈  
    1. 苹果与谷歌的“AI依赖”  
       - 协议:苹果每年支付10亿美元使用谷歌1.2万亿参数模型,Siri升级或依赖外部技术。  
       - 隐忧:苹果在AI竞赛中落后,需平衡“隐私保护”与“功能创新”。  

    2. OpenAI的“算力扩张”  
       - AWS合作:380亿美元协议获取英伟达芯片,支撑ChatGPT训练与推理。  
       - 企业市场:100万家企业用户,包括ChatGPT企业版与Edu版。  

    3. 欧盟《AI法案》的“妥协”  
       - 背景:面对美国科技公司压力,欧盟或推迟部分条款实施。  
       - 影响:AI监管从“激进”转向“务实”,欧洲AI创业生态或受益。  

    五、AI伦理与争议:从“工具”到“责任”的反思  
    1. 金·卡戴珊“挂科”事件  
       - 争议:ChatGPT生成错误法律建议导致考试失分,引发模型“幻觉”问题讨论。  
       - 启示:AI需明确“辅助工具”定位,用户需保持批判性思维。  

    2. 《柯林斯词典》2025年度热词:“氛围编程”(vibe coding)  
       - 定义:通过自然语言提示词让AI生成代码或应用。  
       - 影响:编程门槛降低,但“提示词工程”或成为新职业方向。  

    六、未来趋势预测  
    1. 中国AI的“垂直深耕”:Kimi K2等模型将聚焦企业服务、智能制造等场景,与美国“通用大模型”形成差异化竞争。  
    2. AI基础设施的“太空化”:谷歌Suncatcher项目或引发算力革命,降低数据中心能耗成本。  
    3. 监管与商业的“平衡术”:欧盟《AI法案》的妥协显示,全球AI治理需兼顾创新与风险控制。  

    结语:2025年的AI领域正经历从“技术炫技”到“实用落地”的转型。中国AI实验室通过“通用能力+垂直场景”实现弯道超车,而美国巨头则通过算力扩张与生态整合巩固优势。未来,AI的竞争将不仅限于模型性能,更在于商业化能力与伦理框架的构建。



    查看完整版本: [-- Kimi万亿模型"横空出世",小鹏人形机器人“以假乱真”! --] [-- top --]


    Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
    Gzip enabled


    沪ICP备:05041533号