查看完整版本: [-- 如何不做AI时代的文盲?如何防止“AI说胡话”? --]

武当休闲山庄 -> 数码讨论 -> 如何不做AI时代的文盲?如何防止“AI说胡话”? [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

姜谷粉丝 2026-02-02 09:05
“随着人工智能的发展,高质量的行业通识和行业专识数据集将决定大模型能力的上限。同时,中国智能算力的发展应兼顾提升先进制程良品率,以及打造全国统一的异构算力软件开发平台,建立起中国的类CUDA系统。”
2月1日,在2026年上海两会期间,上海政协委员、上海熠知电子科技有限公司董事长黄海清接受澎湃新闻记者采访时指出,高质量的数据集对于高效能智算非常重要。例如,50T的高质量数据集,对模型的能力提升会远远大过500个T低质量数据集的价值。且高质量数据能大幅降低算力依赖,50个T的高质量数据集用百卡就能完成训练,低质量数据却可能需要千卡集群。
黄海清此前曾担任语料运营企业上海库帕思科技有限公司CEO以及阿里云中国区的总裁。


黄海清在采访中强调每个人要应积极拥抱大模型,“没有大模型和人工智能思维的同仁们,就是新时代的文盲,大模型革命的影响力将远超互联网革命”。
黄海清建议,每个人可以在手机中安装3-4个AI工具APP,如DeepSeek、通义千问、Kimi、豆包等,在工作和生活中多尝试、多对比,选择最适合自己的工具提升效率,“用好这些工具的关键,在于掌握提示词的使用技巧。优秀的提示词呈现‘五化’,即指令明确化、背景具象化、约束清晰化、角色前置化、交互递进化,以此让AI为普通用户提供实用的学习方向。”
值得注意的是,近期,AI幻觉、虚假生成问题成为人工智能规模化应用的突出风险,大模型易凭空编造、输出失实信息,在医疗、法律、金融等领域引发决策失误、司法干扰等问题,甚至出现伪造证据、制造虚假侵权的情况。
为什么AI会说胡话?黄海清向澎湃新闻指出,原因之一在于数据不够高质量。提高语料数据集的质量,除了通过基础方法论优化外,核心是要建设评测数据集。只有建立明确的质量标准,如完整性、及时性等,才能科学界定和验证数据的质量。
黄海清还指出,AI说胡话的另一个原因可能是“算法歧视”,建议通过国家法律政策规范与大模型企业道德伦理自律、监督考核相结合的方式,筑牢AI合规发展的底线,确保模型输出内容的正确性和可信性。
在人工智能加速融入教育领域的背景下,青少年如何合理使用AI工具也成为社会关注的焦点。针对青少年借助AI辅助学习可能产生依赖的问题,黄海清在采访中指出,“中小学生怎么用大模型来提高学习效率,教育垂类大模型已能提供很大的支持,例如能为学生提供解题步骤解析。但这是一把双刃剑,过度依赖可能导致思考能力弱化。”
黄海清指出,在鼓励教育垂类大模型技术开发的同时,也要构建限制机制,通过智能监控和引导功能,让大模型在助力学习与培养独立思维间取得平衡。谈及人工智能课程进校园的实践,黄海清认为,课程设计需立足中小学生认知特点,既要融合最新技术趋势,更要做到深入浅出。优质课程应着重激发创造力,而非单纯技术灌输。
谈及备受关注的具身智能,黄海清在采访中指出,具身智能无疑是万亿级别的巨大市场,未来必将深刻改变人们的工作与生活方式。但当前其发展仍面临两大核心障碍:一是训练语料数据标准不统一,不同企业研发的产品在身高、感知设备等技术参数上差异显著,导致泛化能力不足;二是成本居高不下,限制了应用场景的拓展。
对此,黄海清建议,政府或行业协会牵头建立统一的语料共享标准,推动数据流通,避免重复建设造成的成本浪费;同时期待技术突破将具身智能相关产品成本降至10万元以内,激活更多应用需求。此外,黄海清也关注到具身智能对就业市场的影响,他提出,国家应加强技能培训,培育复合型人才,以应对单一工种被替代后的劳动力转型问题。
当前,国内迎来GPU企业上市热潮,黄海清向澎湃新闻记者指出,这是中国芯片集成电路创业者的重大利好,也标志着中国在全球AI竞争中与美国并肩前行。相信国内GPU企业未来可以赋能千行百业、助力大模型与垂类模型快速迭代,同时随着市场的技术迭代,未来有望推动中国科技力量走向东南亚、中东等全球市场。
同时,黄海清预判,算力发展将迎来重要转型,从预训练、训练为主的格局,逐步向推理方向演变,更好地支撑智能体与实际应用落地。
“在IT时代CPU是C位,而到了去年GPU是C位,相信未来异构融合算力将成为C位。”黄海清认为,GPU、CPU、ASIC等器件的协同生态,将成为算力发展的主流趋势。
人工智能是上海三大先导产业之一,已集聚了一批具备竞争力的国产GPU设计企业,硬件能力快速提升。黄海清介绍,例如上海芯片四小龙天数智芯、壁仞科技、沐曦股份、燧原科技等公司表现尤为突出。不过,中国迫切需要一个类似英伟达CUDA系统的通用计算软件平台,这需要政府发挥引导和牵引作用,通过成立联盟、构建生态,推动企业协同攻关,制定统一标准。
黄海清进一步指出,当前,GPU产业生态面临严峻挑战,以英伟达为代表的国际巨头,凭借其硬件与CUDA软件生态的深度绑定,构筑了垄断性闭环,据统计,全球95%的开发者和80%以上的大模型训练使用英伟达“CUDA”系统,我国在与之匹配的基础软件平台、开发生态和行业标准方面存在显著短板,已成为制约人工智能产业自主可控与创新发展的最大障碍。因此,打造中国版、国际一流的GPU通用计算软件平台(“华夏CUDA”),是保障技术安全、赢得竞争主动权的战略急需。
“上海在AI产业布局上已打下坚实基础,在算力的部署,在语料数据的构建,以及行业垂类模型的打造等方面都为产业发展提供了稳固支撑。”在黄海清看来,要在激烈竞争中持续领跑,上海仍需在关键领域精准发力。一方面,未来应将重点放在培育更多的行业垂类智能体和模型的独角兽上。其二,强化行业语料库的相关支持。第三,推动芯片产业协同发力。

姜谷粉丝 2026-02-02 09:10
根据最新行业洞察整理的AI时代核心生存指南,涵盖“避免成为数字文盲”和“防范AI失真”的双重解决方案,所有建议均基于权威实践总结,不引用具体来源:

一、如何不做AI时代的文盲
掌握基础AI工具链

安装3-4款主流AI应用(如DeepSeek、通义千问、Kimi等),通过横向对比理解不同模型的优劣势。
每日实践:将AI融入工作流(如邮件撰写、数据分析),逐步建立“人机协作”思维。
深化提示词工程能力

遵循 “五化原则” 设计指令:
指令明确化:避免模糊描述(例:将“写篇文章”改为“写800字科普文,主题:量子计算基础”)。
背景具象化:补充场景细节(例:“面向高中生解释,用生活类比”)。
约束清晰化:限定格式与边界(例:“列3点,每点不超过50字”)。
角色前置化:赋予AI身份(例:“你是一名资深律师,请分析此合同风险”)。
交互递进化:分步骤追问(例:首轮生成大纲→次轮填充案例→三轮优化逻辑)。
培养AI批判性思维

警惕 “效率依赖陷阱”:用AI辅助解题时,要求其展示推理过程,而非直接接受答案。
定期进行 “无AI日”训练:强制手写方案/手算数据,维持基础能力。
二、如何防止AI“说胡话”
用户端应对策略
输入侧防控

数据质量过滤:向AI提供高精度信息(如权威报告原文),减少低质语料诱发幻觉。
多模型交叉验证:同一问题提交不同AI工具,比对输出一致性。
输出侧纠偏

强制引用溯源:要求AI标注答案依据(例:“此结论基于2025年《自然》期刊某研究”),无来源声明需存疑。
置信度评估:对复杂结论追加提问(如“此观点争议率多高?”),触发AI自我质疑机制。
系统级解决方案
技术层面

动态检索增强(RAG):实时联网校验信息,替代纯记忆生成。
幻觉抑制算法:通过对抗训练识别矛盾表述,自动触发复核流程。
伦理与监管

开发端:建立行业统一的 语料质量标准(如完整性/时效性指标),杜绝“数据投毒”。
政策端:推动 AI伦理合规框架,强制高风险领域(医疗/司法)模型输出可审计日志。
关键认知升级
AI的本质是“概率鹦鹉”:其“自信”源于统计规律,而非事实核查能力。
人类的核心竞争力:在 提出真问题 和 定义价值标准 中不可替代。
以上策略形成闭环防御:个人工具实践 → 提示词精控 → 系统性验证 → 伦理兜底。在AI指数级进化的时代,文盲并非指技术陌生者,而是丧失批判性思考与主动驾驭能力的人。

jjybzxw 2026-02-02 12:18
上海政协委员黄海清谈人工智能发展:机遇、挑战与应对策略
一、高质量数据集:智算效能的核心要素
(一)数据质量对模型能力的决定性影响
高质量行业通识与专识数据集是大模型能力上限的关键,50T高质量数据集对模型能力的提升远超500T低质量数据集。例如,50T高质量数据集用百卡即可完成训练,而低质量数据可能需要千卡集群,凸显高质量数据对降低算力依赖的重要性。
(二)数据质量问题的解决路径
1. 建设评测数据集:通过基础方法论优化语料数据集质量,建立完整性、及时性等明确质量标准,科学界定和验证数据质量。
2. 应对AI幻觉与虚假生成:数据质量不足是AI“说胡话”的主要原因之一,提高数据质量可减少大模型凭空编造、输出失实信息的问题,降低医疗、法律、金融等领域决策失误和司法干扰风险。
(三)算法歧视与合规发展
算法歧视可能导致AI输出错误内容,需通过国家法律政策规范、企业道德伦理自律及监督考核相结合的方式,筑牢AI合规发展底线,确保模型输出内容的正确性和可信性。
二、大模型应用:个人、教育与就业的变革
(一)个人应用:拥抱大模型,提升效率
1. 安装AI工具APP:建议个人在手机中安装3-4个AI工具APP(如DeepSeek、通义千问等),通过多尝试、多对比选择最适合的工具。
2. 掌握提示词技巧:优秀提示词需具备“五化”特征(指令明确化、背景具象化等),以引导AI提供实用学习方向。
(二)教育应用:平衡辅助与独立思维
1. 教育垂类大模型的支持:大模型可为学生提供解题步骤解析,但过度依赖可能导致思考能力弱化。
2. 构建限制机制:通过智能监控和引导功能,平衡大模型助力学习与培养独立思维的关系。
3. 课程设计原则:人工智能课程需立足中小学生认知特点,融合技术趋势且深入浅出,着重激发创造力。
(三)就业市场:应对具身智能的挑战
1. 具身智能的市场潜力与障碍:具身智能是万亿级市场,但训练语料数据标准不统一和成本居高不下限制了其发展。
2. 应对策略:
政府或行业协会牵头建立统一语料共享标准,推动数据流通。
期待技术突破将产品成本降至10万元以内,拓展应用场景。
国家加强技能培训,培育复合型人才,应对单一工种被替代后的劳动力转型问题。
三、GPU产业与算力发展:中国芯片的机遇与挑战
(一)GPU企业上市热潮的意义
国内GPU企业上市热潮是中国芯片集成电路创业者的重大利好,标志着中国在全球AI竞争中与美国并肩前行。国内GPU企业可赋能千行百业,助力大模型与垂类模型快速迭代,并有望推动中国科技力量走向全球市场。
(二)算力发展的转型趋势
算力将从预训练、训练为主向推理方向演变,以更好支撑智能体与实际应用落地。异构融合算力(GPU、CPU、ASIC等协同)将成为主流趋势。
(三)GPU产业生态的挑战与应对
1. 国际巨头的垄断:英伟达凭借硬件与CUDA软件生态的深度绑定,构筑了垄断性闭环,全球95%的开发者和80%以上的大模型训练使用其系统。
2. 中国的短板与战略需求:中国在基础软件平台、开发生态和行业标准方面存在显著短板,需打造中国版、国际一流的GPU通用计算软件平台(“华夏CUDA”),以保障技术安全、赢得竞争主动权。
四、上海AI产业发展:优势与精准发力方向
(一)上海AI产业的基础优势
上海作为人工智能三大先导产业之一的城市,已集聚天数智芯、壁仞科技等具备竞争力的国产GPU设计企业,硬件能力快速提升。在算力部署、语料数据构建和行业垂类模型打造等方面为产业发展提供了稳固支撑。
(二)未来精准发力方向
1. 培育行业垂类独角兽:重点培育更多行业垂类智能体和模型的独角兽企业。
2. 强化行业语料库支持:加强行业语料库的建设和支持。
3. 推动芯片产业协同:促进芯片产业协同发力,提升整体竞争力。



查看完整版本: [-- 如何不做AI时代的文盲?如何防止“AI说胡话”? --] [-- top --]


Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled


沪ICP备:05041533号