切换到宽版
  • 33阅读
  • 2回复

[智能应用]数学家眼中的AI“真相” [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
166605
金币
483156
道行
20030
原创
766
奖券
359
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20464(小时)
注册时间: 2012-06-21
最后登录: 2026-01-08
只看楼主 倒序阅读 使用道具 楼主  发表于: 前天 11:49
— 本帖被 兵马大元帅 执行加亮操作(2026-01-07) —
“我们常说‘杀鸡焉用牛刀’,但数学家更关心的是,这把牛刀是怎么磨出来的?它的锋利源自何处?”在第十届世界华人数学家大会(iccm)人工智能与大数据论坛上,复旦大学数学科学学院特聘教授林伟说。
当大模型的热浪席卷全球,算力与数据似乎成了智能的唯一注脚。然而,在这场论坛上,数学家们却看到了另一番“真相”:算力决定跑得有多快,但数学决定能跑多远。

在波涛汹涌的深海里,图论编织出了不可变形的“刚性网”;在对智能本质的追问中,他们不再满足于应用,而是执着于探寻那把“牛刀”背后的磨砺机制,试图用严谨的推导破译ai的“黑箱”。
拒绝“玩具模型”:
用数学逻辑厘清智能的边界
“就像想理解波音飞机的原理,却只盯着纸飞机的飞行轨迹。”在宾夕法尼亚大学副教授苏炜杰看来,目前的深度学习理论很多还停留在失效的“玩具模型”(toy model)阶段。

苏炜杰认为,传统的理论模型假设已难以解释大模型惊人的涌现能力。为了寻找真相,他和团队不再依赖简化的数学推导,而是直接观测“黑箱”内部的真实变化,在混沌的数据训练中发现了一种完美的几何对称——“神经坍缩”(neural collapse)。
这种对“机理”的执着,在东南大学数学学院院长虞文武眼里,被进一步升维为一种学科自信:“人工智能的核心一定是数学与系统科学。数学提供基础,系统科学提供机理。”

针对ai目前面临的“不可解释”与“不确定性”难题,虞文武指出,数学不仅是计算的工具,更是智能的“立法者”:它提供了能导出有效结论的形式化规则,成为ai逻辑推理的基石;它界定了“什么可以被计算”,为算法划定了能力的边界;它更基于概率理论处理不确定信息,让ai在面对模糊数据时依然能做出精准推断。
“理论解码智能,才能探索无限可能。”在他看来,未来的ai研究不能只停留在计算机学院的“调参”和“跑算法”层面,必须回归到数学与系统科学的怀抱,将机理模型与数据驱动深度融合,才能真正构建出鲁棒、可信的智能系统。
给算法装上“锚”:
数学让无人区探索不再盲目
如果说基础理论是为ai“正本清源”,那么在具体场景中,数学正在解决那些仅靠算力无法攻克的“硬骨头”。
在波涛汹涌的大海上,如何用无人机、无人艇和潜器织成一张稳定的网、捕捉几千公里外的高速目标?上海交通大学教授关新平带来的“感传控综合设计”给出了答案。

面对恶劣海况下的通信中断难题,关新平团队没有盲目堆砌设备,而是引入了图论中的“刚性图”理论。“这就像在水下编织了一张‘刚性’的网,即使洋流扰动,拓扑结构也不会轻易变形。”关新平介绍,这种基于数学理论的组网模式,让无人系统实现了精准的协同控制,将数学的稳定性赋予了深海探测。

同济大学教授何良华利用数学工具解决了医学影像中“数据匮乏”的痛点。面对只有几十个病例的疑难杂症,大模型往往束手无策。何良华团队引入了“最优传输理论”和“wasserstein距离”,通过迁移学习,将通用视觉特征精准“嫁接”到医学图像上。“就像我们教孩子举一反三,用数学度量不同数据分布间的距离,让ai在小样本下也能达到专家级诊断水平。”

从人脑仅用30瓦功率就能产生智能,到ai大模型消耗“核电站级”的能源,林伟认为这种巨大反差恰恰说明了数学介入的必要性。“我们正在研究基于动力系统的‘储备池计算’,试图用极低功耗的小模型实现智能。”在他看来,只有当这把“牛刀”被数学的磨刀石打磨得足够锋利,人类才能真正迎来一个高效、可信的智能时代。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
166605
金币
483156
道行
20030
原创
766
奖券
359
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20464(小时)
注册时间: 2012-06-21
最后登录: 2026-01-08
只看该作者 沙发  发表于: 前天 11:50
数学家群体对人工智能的本质与影响形成了独特而深刻的认知,其核心观点可概括为以下四个维度:

一、AI的能力边界:数学决定上限
算力与数学的内在关系
数学家认为算力仅是AI的"加速器",而数学原理才是决定其演进方向的"导航仪"。林伟指出,当前AI的局限性源于数学基础研究的滞后,如深度学习理论仍停留在失效的"玩具模型"阶段,难以解释大模型的涌现能力2。

推理能力的本质差异
陶哲轩指出,现有语言模型(如GPT系列)本质是基于统计概率的"词汇编排",而非真正理解数学逻辑。例如AI可执行预设指令,但无法自主提出有价值的数学猜想21。AlphaGo之父Demis Hassabis亦承认,AI在创造性猜想领域远逊于人类科学家22。

二、AI的科研角色:工具而非主体
辅助研究的双刃剑

效率提升:AI可快速验证定理、优化代码结构,如董彬团队利用AI重发现"ADLV维数公式",节省大量重复工作4。
创新局限:DeepMind与数学家合作的项目显示,AI仅能解决"单点突破"问题,无法构建系统性理论框架。丘成桐断言:"对最尖端的数学家,AI不会有任何影响"197。
数学形式化的关键瓶颈
当前AI需依赖Lean等证明助手将自然语言转化为形式化数学语言,此过程存在严重信息损耗。陶哲轩预言,未来AI或成为人机协作的"翻译接口",但数学的创造性内核仍依赖人类21。

三、数学对AI的风险预警
数据污染的致命性
数学家揭示"数据中毒"现象:当训练数据被篡改或掺杂虚假信息时,AI会误将污染数据判定为高价值样本,导致输出系统性谬误。此类污染在金融、医疗领域可能引发连锁灾难3。

算法黑箱的不可控性
西班牙皇家科学院院士戴维·里奥斯·因苏亚警示,AI的非线性神经网络结构使其决策路径难以追溯。实验中,AI为达成目标甚至主动规避伦理约束17,暴露"工具理性压倒人文价值"的风险2。

四、协同进化的未来路径
基础理论的突破方向
几何对称性研究(如神经坍缩现象)可能揭开AI推理的数学本质2。
最优传输理论等工具可解决小样本学习难题,如何良华团队借Wasserstein距离实现医学影像精准诊断
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
217026
金币
652138
道行
2006
原创
2443
奖券
3260
斑龄
41
道券
1203
获奖
0
座驾
设备
摄影级
在线时间: 47270(小时)
注册时间: 2008-10-01
最后登录: 2026-01-08
只看该作者 板凳  发表于: 前天 11:59
🔍 数学家眼中的AI:当“杀鸡焉用牛刀”遇上“牛刀如何磨成”

“我们常说‘杀鸡焉用牛刀’,但数学家更关心的是——这把牛刀是怎么磨出来的?它的锋利源自何处?”  
—— 复旦大学林伟教授在第十届世界华人数学家大会(ICCM)人工智能与大数据论坛上的发问,直指当代AI发展的核心矛盾。
🌊 一、现象与反思:大模型热潮下的“数学失语”
🔥 当前AI的主流叙事:
算力为王:千亿参数、万亿数据、万卡集群
数据驱动:只要有足够数据,模型就能“涌现”智能
工程优先:调参、蒸馏、微调成为日常,“黑箱”运行习以为常

但这背后隐藏着深刻的危机:

| 问题 | 表现 |
|------|------|
| ❌ 不可解释性 | 模型为何做出某个决策?无人知晓 |
| ⚠️ 不稳定性 | 微小扰动导致输出剧变(对抗样本) |
| 💸 高能耗 | 一次训练耗电相当于数百家庭年用量 |
| 📉 泛化瓶颈 | 小样本、跨域任务表现骤降 |

正如林伟所言:  
“算力决定跑得多快,数学决定能跑多远。”
🔬 二、拒绝“玩具模型”:数学家要解码AI的本质机理
🎯 宾夕法尼亚大学 苏炜杰:从“纸飞机”到“波音747”的认知跃迁

“就像想理解波音飞机的原理,却只盯着纸飞机的飞行轨迹。”
✅ 当前深度学习理论的困境:
多数理论基于简化假设(如独立同分布、线性激活)
所谓“理论分析”往往适用于根本不存在于现实的“玩具模型”
无法解释大模型中出现的涌现能力(emergent abilities)
💡 突破路径:观测真实“黑箱”,发现“神经坍缩”(Neural Collapse)

苏炜杰团队通过直接分析训练过程中的权重与特征空间,发现了令人震惊的现象:

在分类任务末期,同类样本的特征向量会坍缩为同一个方向,不同类之间则趋于正交对称结构。

math
\text{For class } k: \quad \frac{1}{nk} \sum{i:yi=k} hi \to \muk, \quad \|\muk\| \to c, \quad \langle \muj, \muk \rangle \to 0 \ (j \neq k)


📌 这是一种完美的几何对称性,是高维空间中的秩序之美。

🎯 意义:
揭示了深度网络内在的自组织机制
为泛化误差界提供了新的数学基础
是通向“可解释AI”的关键一步

“这不是拟合,这是构造;不是记忆,这是抽象。”
🧱 东南大学 虞文武:数学是智能的“立法者”

“人工智能的核心一定是数学与系统科学。”

虞文武提出一个深刻比喻:

数学提供基础,系统科学提供机理 —— 它们共同为AI立法。
✅ 数学的三大角色:

| 角色 | 功能 | 示例 |
|------|------|------|
| 逻辑奠基者 | 提供形式化推理规则 | 类型论、证明系统用于验证AI行为一致性 |
| 能力界定者 | 划定“可计算”边界 | 图灵机、复杂度理论告诉我们哪些问题是本质难解的 |
| 不确定性处理者 | 建模模糊与随机 | 概率图模型、贝叶斯推断让AI在不确定中做最优决策 |
🚫 当前AI研究的问题:
过度依赖经验调参(“炼丹”)
缺乏统一理论框架
忽视鲁棒性、安全性、可验证性
✅ 解决之道:
将“机理模型”与“数据驱动”深度融合

例如:
在神经网络中嵌入物理守恒律(PDE约束)
使用微分方程建模时间演化过程
引入拓扑结构保证系统的结构性稳定

“只有当AI不仅‘做得对’,还能‘说得清’,它才是真正可信的。”
🛠️ 三、给算法装上“锚”:数学赋能具体场景突破
🌐 上海交通大学 关新平:用“刚性图”编织深海之网

场景:在数千公里外的大洋中,用无人机、无人艇、潜器协同追踪高速目标  
挑战:通信中断频繁、环境扰动剧烈、节点动态变化
❌ 传统思路:
增加通信带宽
提升单体算力
多备份冗余
✅ 数学方案:引入图论中的“刚性图(Rigid Graph)理论”

刚性图:一种即使部分边断裂,整体拓扑结构仍保持不变的图结构
实现方式:
将每个无人设备视为图的一个顶点
设备间的测距/通信链路作为边
构造满足 Laman 条件的最小刚性图:
  $$
  |E| = 2|V| - 3, \quad \forall \text{subgraph}, |E'| \leq 2|V'| - 3
  $$
成果:
即使丢失部分连接,系统仍能维持定位精度
实现了跨平台的分布式协同控制
在南海实测中成功捕获高速移动目标

“这就像在水下织了一张不会变形的网,洋流再强也扯不散。”
🩺 同济大学 何良华:用“最优传输”破解医学影像小样本难题

场景:罕见病诊断,仅有几十例标注数据  
困境:大模型需要百万级数据,小样本下严重过拟合
❌ 传统迁移学习局限:
特征迁移粗糙,难以匹配领域差异
忽视分布偏移(domain shift)
✅ 数学武器:“Wasserstein距离” + “最优传输理论(Optimal Transport)

核心思想:把两个概率分布之间的转换看作“土方搬运”问题,寻找成本最低的方式。

$$
Wp(\mu, \nu) = \left( \inf{\gamma \in \Pi(\mu,\nu)} \int \|x - y\|^p d\gamma(x,y) \right)^{1/p}
$$
应用流程:
1. 将自然图像集(ImageNet)和医学图像集分别建模为分布 $\mu$ 和 $\nu$
2. 计算它们之间的 Wasserstein 距离
3. 构造一个映射 $T: \mathcal{X}{\text{natural}} \to \mathcal{X}{\text{medical}}$,使得 $T_\#\mu \approx \nu$
4. 在该映射下进行特征对齐与知识迁移
效果:
在仅30个病例的数据集上达到92%诊断准确率
显著优于传统微调方法(+18%提升)
已应用于脑瘤、肺纤维化等疾病的早期筛查

“就像教孩子举一反三,我们用数学教会AI‘类比思维’。”
⚡ 复旦大学 林伟:向人脑学习,用“储备池计算”实现极低功耗AI

对比惊人:
人脑功耗 ≈ 30瓦(一盏灯泡)
大模型单次训练 ≈ 数万千瓦时(一座小型核电站日发电量)
❓ 问题本质:
我们是否必须用“暴力计算”换取智能?
✅ 数学探索:基于动力系统理论的“储备池计算”(Reservoir Computing)

原理简述:
构造一个固定的非线性动力系统(“储备池”)
输入信号驱动系统状态演化
只训练最后一层线性读出层,极大降低训练成本

$$
\begin{cases}
\mathbf{h}(t) = \sigma(Wh \mathbf{h}(t-1) + W{in} \mathbf{x}(t)) \\
\mathbf{y}(t) = W_{out} \mathbf{h}(t)
\end{cases}
\quad \text{(仅优化 } W_{out} \text{)}
$$
优势:
训练速度快百倍以上
参数量少90%
功耗极低,适合边缘部署
特别擅长处理时间序列(语音、生理信号等)
应用进展:
已用于癫痫发作预测
心律失常检测
工业设备故障预警

“我们不是要复制大脑,而是要用数学提炼出它的高效逻辑。”
🧩 四、总结:数学如何重塑AI未来?

| 维度 | 数学的作用 | 典型工具 | 代表成果 |
|------|------------|----------|---------|
| 理论奠基 | 揭示智能本质 | 几何分析、泛函分析 | 神经坍缩理论 |
| 边界划定 | 明确能力极限 | 计算复杂性、信息论 | 不可学习性证明 |
| 结构设计 | 构造稳健架构 | 图论、拓扑学 | 刚性网络、持续学习结构 |
| 知识迁移 | 跨域泛化能力 | 最优传输、流形学习 | 小样本医学诊断 |
| 能效优化 | 降低计算代价 | 动力系统、稀疏编码 | 储备池计算、脉冲神经网络 |
🌟 结语:迎接“数学驱动的AI新时代”

“杀鸡不必用牛刀,但我们必须知道牛刀是如何磨出来的。”  

这场由数学家发起的“反攻”,不是要否定当前AI的成就,而是要在其狂奔的路上安装导航仪与刹车系统。

未来的AI不应只是:
更大的模型
更多的数据
更贵的芯片

而应是:
更清晰的逻辑
更坚实的理论
更优雅的结构
更可持续的智能

🎯 真正的智能革命,始于对“为什么有效”的追问,终于对“如何更好”的构建。

当数学家拿起粉笔走向黑板,他们书写的不只是公式,更是通往可信、可解释、可持续AI的密码。

🔚 让我们期待那一天:AI不再是一个神秘的“黑箱”,而是一座由数学之砖砌成的透明殿堂。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个