刚刚过去的五月,是一个炙热的AI之夏。前有2023谷歌 I/O开发者大会“炸场”,开建AI全宇宙,后有2023微软Build大会,一切都与AI相关。
AI被谷歌和微软应用到各个产品,落地速度一路狂飙。不过,应用层面,国內能做AI产品的很多,很快会能推出类似的产品, 因为路都是通的,工程师人才不是问题, 技术不是问题, 可能来得慢一点,效果略差一点, 但这都没关系,复现是肯定的。
但谷歌和微软在一个领域,打得风声四起,国内能做的厂商,却是凤毛麟角,那就是操作系统。
目前,微软已经将GPT-4大模型嵌入Windows PC操作系统,推出Windows Copilot,在底层操作系统输出AI能力。谷歌Android系统近年来总被吐槽“缺乏亮点、抄国内厂商”,但最新Android 14中许多AI功能集成,说明Google还是有点东西在的。
打造 AI时代的操作系统,谷歌和微软都在抢船票了。
操作系统是硬件性能的释放窗口,又是大量软件服务的承载体,可以说是一切人机交互的起点。在大语言模型带来颠覆式的变革之后,操作系统也有了重新划分格局的可能性。
AI时代,操作系统是会重演移动互联网的双寡头垄断,还是迎来百花齐放,2023的夏天刚刚写下了开篇,你我都将见证这一场产业变局。
不妨从故事开头讲起,看看AI究竟能为OS做什么?
AI和OS组CP,都有哪些方式?
AI与操作系统OS的结合就像组CP,方式有很多。
普通用户,最熟悉的可能是AI in OS,也就在原有的操作系统上集成AI软件和应用。微软这些年一直努力在Windows里加入AI语音对话能力,移动操作系统苹果、安卓、鸿蒙对AI能力的拥抱更是开展了很久,AI算法辅助计算摄影、人脸识别、智能语音助手等,大家应该都不陌生。
对于开发者,OS for AI才是“王道”,也就是供给机器学习、深度学习的操作系统(AI OS)。比如TensorFlow、PyTorch、飞桨、昇腾等,通过操作系统从硬件到软件到网络的全面重构,更好地支持AI模型训练应用推理。
而科技厂商要打造AI时代的操作系统,则非常关心AI for OS。简单来说,就是利用人工智能来构建和优化操作系统,提升系统的设计、开发、维护等。不难发现,AI for OS直接影响到普罗大众使用操作系统的体验,是我们普通人最期待的一对CP。
而AI for OS提高先进性和竞争力,也会直接影响到操作系统在AI时代的“国民度”,成为操作系统成功的关键。
AI for OS,这对CP甜在何处?
强拧的瓜不甜,AI for OS这对CP能不能甜到用户心里头,是接下来要回答的问题。那现在真的是用AI优化OS的好时机吗?
我们来看看如今的操作系统,有哪些可以被AI改变的地方。
第一个当然是“变重了”。
随着用户使用数字化应用的场景不断丰富,操作系统所要承担的交互和任务负载,也在持续快速增长。大家回想一下,智能手机里安装的应用是不是越来越多,要控制的外部智能设备也越来越丰富,而矛盾的是,随着摩尔定律的放缓,处理器增加的计算能力,越来越接近瓶颈。这种计算资源与任务之间的不匹配,正在成为操作系统的不可承受之重。
要让操作系统变轻,就要充分地发挥出硬件的性能,挖掘出更多的算力,而系统的环境有强烈的动态性,随着任务负载而变。传统操作系统,需要用户手工切换关闭任务。这时利用AI,自动实时感知业务场景的变化,预估现在(或未来)的工作量和所需的资源,进行动态调整,优化资源配额,实现更精准的算力供给,使用体验当然也就更加丝滑流畅。
比如感知到用户正在打游戏,就自动降低后台应用,释放CPU资源来保证游戏运行,不会因为卡顿而错失了五杀。
第二个是“变笨了”。
可以确定的是,AI是最具潜力的新赛道,未来将与大量软硬件相连。可以想象一下,如果让AI大模型帮你分析十篇论文,从应用启动到生成结果,需要半个小时,中间还时不时掉线重来,这谁受得了?还不如自己上手算了。
传统操作系统不想因“变笨”而被用户抛弃,必须开始支撑 AI 全方位的应用,自然要进一步提升操作系统的能力。比如微软Windows 11让AI深扎底层PC系统,可以在没有任何APP作为中介的情况下,直接调用AI大模型能力完成任务。
支撑 AI 在各种智能设备上更好地运行,必须从操作系统层面下刀,从硬件到软件到网络全面重构。
第三个是“变复杂了”。
如今每个人身边都围绕着多种多样的终端,不可逆地驶入万物互联时代,系统的复杂度也在不断增加。
对用户来说,操作系统各自为战,碎片化的体验是非常不舒服的。拿我自己来说,智能家电是安卓,手机是IOS,电脑是Windows,很多应用在不同设备之间基本不能自如切换,每个系统单独一个账号,一些个人行为数据很难在不同终端中流通,结果就是应用“不懂我”“人工智障”。
设备不够聪明也就罢了,更令人担忧的是安全,不知道哪个设备成为“最短板”,被黑客攻破,其他联网设备一起遭殃。
对开发者来说,万物智联的应用开发,意味着巨大的代码量和工作量,也不是一件轻松的事。
开脑洞想出一个创意不算难,开发出来之后,要将应用部署到数量众多的物联网设备上,得考虑本地算力、网络连接能力、跨平台兼容……如果发现某个设备的UI交互有问题,再调试一轮,上线周期又延长了,开发成本有点过于高昂。不能释放成千上万开发者的创意和生产力,智能世界来得自然就更慢了。
让复杂的场景变简单,令多终端归一化,已经成为移动产业的共识,一些品牌提出了“全场景智慧”,但如果没有操作系统层面的兼容和协作,对高集成场景进行针对性简化,支撑应用跨设备、跨系统、跨平台的一次开发、多端部署;如果没有AI全流程辅助来提升操作系统的运维、性能与安全等能力,“全场景智慧”是很难真正实现的。
这样看,AI for OS这对CP甜就甜在一心同体、其力断金。操作系统作为中枢,协调软硬件的关系;AI作为大脑,解决很多现有的挑战,让系统能力变得简单而强大。
系统层面的路铺平了,芯片、终端、平台、场景的隔阂与瓶颈也就消弭于无形了。
三大流派,各自甘甜
正如图灵奖得主 Edsger Dijkstra所说,Simplicity is a great virtue but it requires hard work to achieve it。简单是一种伟大的美德,但它需要努力去实现。
AI for OS带来简单但强大的能力,更适合“万物智联的体质”。问题在于,怎么实现呢?
目前,有实力打造下一代操作系统的科技企业,都在探索AI for OS。具体分为三个流派:
流派一:PC端的逆袭。
这一波大模型浪潮,OpenAI是绝对的顶级流量明星,攫取到最大的话题度和关注度,而拥有这一顶流的微软Windows,也成了“一夜爆红”的赢家。
微软已经让“AI副驾(Copilot)”全面登陆Windows系统,对Windows系统的界面和交互,带来了颠覆式的体验,也吸引到了非常多的用户和开发者粉丝。
面向用户,Copilot AI 助手贯穿整个操作系统,用户直接通过Windows PC系统去调用AI模型能力,无缝连接应用程序,大大简化了交互步骤。
面向开发者,微软基于OpenAI模型构建的AI辅助编程解决方案,在全球最大的代码托管平台GitHub打造GitHub Copilot X,能自动检测代码问题并给出建议,提升开发者的工作效率。
不过,PC相比智能手机、平板等移动终端有天然的劣势,微软在移动操作系统领域的长期缺位,目前还无法靠AI来快速补上。想把用户拉入下一个操作交互时代,还需要进一步给出更具颠覆性的系统能力。
流派二:移动端的稳定发挥。
移动互联网时代,谷歌Android和苹果IOS二分天下,打造下一代操作系统,二者的很多特性也得以保留。
安卓的浅。在今年I/O 大会上,谷歌展示了下一代移动操作系统 Android 14,总的来说,AI对Android 14的赋能,停留在较为浅表的应用层,集中在全系列工具的 AI 化升级,对Android 14系统级提升介绍寥寥。长期以来,安卓原生系统的开放性和复杂性一直受到诟病,APP运行时整体驻留在后台,导致卡顿、不稳定,主要靠下游终端厂商自行“魔改”底层代码,所以AI for Android的进展,大概还要等待国內厂商“卷起来”。
IOS的深。刚刚结束的苹果WWDC,虽然也更新了一些AI功能,但iOS 17此次新增升级都是一些小功能。尽管发布会上苹果很淡定地避免“蹭AI热度”,但AI for iOS的融合程度,其实是很深度,也很有实用性的。
这一方面源于iOS系统生态先天的封闭性。Mac、iPhone、ihome、智能穿戴等被捆绑在苹果生态上,数据可以无缝流转,系统也拥有很高的整体性和舒适性。
另一方面是AI软硬件协同的优势。自研的AI芯片是苹果产品的最大亮点,在AI运算性能上都做了大幅地提升,此次WWDC全新发布的M2 Ultra 芯片,苹果表示能流畅支持大模型的运算,比其他芯片优势更明显。
所谓“一力降十会”,强大的芯片带来充足的算力,再与IOS系统中大量机器学习算法相结合,效果自然显著。比如AI帮助IOS监控用户使用习惯,以优化设备的电池寿命和充电频次;通过AI加速,让移动终端如iPad可以执行AR渲染等高难度任务;支持利用端侧的本地机器学习,保护用户隐私。
问题也就在于,IOS为用户带来了便利,但也将用户牢牢捆绑在这一生态。如今,国内外的操作系统百花齐放,包括服务器操作系统、物联网操作系统等,泛在操作系统的生态在逐步形成,越来越交互需要跨终端、跨系统进行,这一点,IOS几乎是无解的。生态捆绑带来的交互不便、数据不通等难题,已经让本苹果用户感到越来越不自由,也成了苹果无法逃避的问题。
流派三:全场景的另辟蹊径。
目前来看,微软、谷歌、苹果都是从己方大本营出发,将AI与自己占据既有优势的操作系统相结合。HarmonyOS作为全场景操作系统的代表,思考AI for OS的路径,跟这些老牌操作系统都不太一样。
鸿蒙OS从一开始,就强调对各自硬件集群的管理和交互,从操作系统层面,通过分布式软总线技术,实现近场设备间统一的分布式通信,高效分发任务和传输数据,应用可以跨设备流转。
然后,再引入AI技术对操作系统进行整体优化。用户能感知到的变化,是AI实现资源的精准供给,提高系统流畅;开发者可以借助环境配置、工具链配置、模板选择、三方库推荐等,进行多设备自适应开发,减少工作量。
值得期待的地方在于鸿蒙OS从零开始,本身也没什么既有优势可以“吃老本”,所以可以在空白的纸上画出更新的图画,针对现有操作系统尚未解决的痛点另辟蹊径,进行底层的系统级重构和技术创新,让人耳目一新。
有待观望的是,目前鸿蒙OS在富屏终端设备上的占比,相对安卓、IOS还有一定差距,一些技术解决方案还需要进一步研究。比如跨平台、跨系统的数据安全和隐私保护,多设备自适应开发的极简智能的工具链等。
一个操作系统要走向大众、走向全球,最重要的还是技术本身的先进,AI for OS或许能让鸿蒙取得更多话语权。
看到这里,大家可能会给出一个结论:AI for OS看起来真香,但市面上已经有的流派好像都差点意思。
确实,在智能终端产业竞争激烈的今天,谷歌苹果微软这样的巨头,也不可能在朝夕之间挖掘出操作系统的全部密码,刚刚过去的五月只是暖场。
有个行业段子说,研究算法的人把算法搞出来,弄不好自己就失业了,可研究系统的人就不用担心,因为每10年硬件、任务一定会变,系统就要重写。