切换到宽版
  • 79阅读
  • 2回复

[智能应用]用AI设计蛋白质 满足“定制”需求 [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
111540
金币
733
道行
19523
原创
29308
奖券
17828
斑龄
197
道券
10550
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 22359(小时)
注册时间: 2007-11-29
最后登录: 2025-07-12
在上海张江科学城的实验室里,科学家正见证一场生命极限的突破——90摄氏度的密闭罐里,酶正在快速“瓦解”塑料。这款耐高温的塑料降解酶,是上海交通大学洪亮教授团队用AI设计改造的“新品”蛋白质。

  当传统生物学家还在实验室用移液枪逐个测试蛋白质功能、组装“理想型”蛋白质时,洪亮团队的AI大模型“启明星”已构建出亿级蛋白质的“功能图谱”,能够精准、高效地设计出耐热、耐碱、耐酸等“超能”蛋白质,满足“定制”蛋白质的需求。

  蛋白质是生命活动的物质基础,自然界中参与构成蛋白质的氨基酸有20种,一个蛋白质分子通常由几十个至上千个数量不等的氨基酸按照特定顺序排列而成。排序的细微差别,可能让蛋白质表现出截然不同的功能特性,比如稳定性、活性、亲和力等。过去数十年间,生物学家只能依靠实验方法来测定蛋白质的结构,揭示复杂的蛋白质结构会耗费生物学家大量时间。2018年,谷歌DeepMind团队发布了AI大模型AlphaFold,它能精准地解析蛋白质的三维构造,为科研人员更高效、更精准地进行药物开发、疫苗设计奠定基础。

  “使用AI设计蛋白质时,我们就在思考,设计的目的是满足某些功能需求,为何不训练AI模型,把满足功能需求的蛋白质直接设计出来?”洪亮团队决定训练一个与AlphaFold不同的AI大模型,挑战蛋白质功能设计的难关。

  “我们利用AI技术学习不同自然环境下,各种生物体内蛋白质链条中氨基酸的排列规则。更重要的是,我们从温度、酸碱度、压强这3个维度,为5亿个蛋白质打上功能标签,然后把这海量的功能标签‘投喂’给AI大模型,使之能快速、精准地设计出耐热、耐酸、耐碱的‘皮实’蛋白产品。”洪亮说。

  如果把一个蛋白质看作一块模具,那么整个数据集就是装满90亿块模具的超级工具箱,这是迄今为止全球最大的蛋白质数据集。由36.2亿条陆地微生物蛋白质序列、26.4亿条海洋微生物蛋白质序列、24.3亿条抗体蛋白质序列、0.6亿条病毒蛋白质序列等组成的蛋白质数据集中,蕴藏着从地表到极地冰川、深海沟壑的“适者生存法则”。

  “比如这款耐热的塑料降解酶,我们先从‘启明星’中挑出几个具备耐热功能的蛋白质‘模具’,再使用AI技术修饰改造这些蛋白质‘模具’的氨基酸序列,提高它的耐热性,同步进行实验验证,从而避免了过去的高通量筛选,提升了蛋白质设计与改造的效率。”洪亮说。

  在上海交通大学张江校区的自动化实验室里,机械臂正飞快地验证着AI设计的蛋白质。这里每天产生的实验数据,又会回流到AI系统中持续优化蛋白质模具,形成“数据—模型—实验”的增强循环,洪亮形象地称之为“蛋白质的自动驾驶模式”。“我们的目的就是让设计AI化、实验自动化,把复杂的蛋白质科学变成简单的工程过程。”洪亮说。

  截至目前,已有8个产业项目使用“启明星”大模型设计蛋白质,成功率达70%。这种突破正在改写产业规则:某生物医药企业利用“启明星”设计的极度耐碱的蛋白质,使用寿命提高一倍多,每年可为企业节省上千万元的成本。

  谈及未来图景,洪亮这样描绘:生物学家只需在电脑上输入需求,AI就能自动生成候选蛋白质“模具”,自动化平台完成验证优化。这不仅能够将科研人员从重复实验中解放,更可能催生“定制化合成生物”的全新产业形态。

  由中国科研团队建立的蛋白质大模型及部分数据集已于日前发布,并在软件托管平台GitHub上开源,供全世界的科研机构接入。

  站在合成生物产业的新赛道,洪亮说,当AI开始理解生命的“设计逻辑”,我们或许正在见证新的产业革命——在这个蛋白质可以被精准“编程”的时代,从医药研发到环境保护,生命科学将向前迈出更大的步伐。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线jjybzxw

UID: 551814


发帖
167956
金币
275071
道行
2004
原创
2404
奖券
2775
斑龄
35
道券
1005
获奖
0
座驾
设备
摄影级
在线时间: 38204(小时)
注册时间: 2008-10-01
最后登录: 2025-07-12
只看该作者 沙发  发表于: 05-17
  上海交通大学洪亮教授团队利用人工智能技术在蛋白质设计领域取得了重大突破。他们开发的AI大模型“启明星”能够构建出亿级蛋白质的功能图谱,并精准、高效地设计出具有特定功能的蛋白质,如耐热、耐碱、耐酸等。这项技术的应用不仅提高了蛋白质设计与改造的效率,还可能催生全新的产业形态。

  1. AI大模型“启明星”:与传统生物学家逐个测试蛋白质功能的方法不同,洪亮团队的AI大模型“启明星”能够快速、精准地设计出满足特定功能需求的蛋白质。

  2. 全球最大的蛋白质数据集:该团队构建了迄今为止全球最大的蛋白质数据集,包含90亿条蛋白质序列,涵盖了从地表到极地冰川、深海沟壑的“适者生存法则”。

  3. 耐热塑料降解酶:利用AI技术,洪亮团队设计出耐高温的塑料降解酶,能够在90摄氏度的密闭罐中快速“瓦解”塑料,有望在环境保护领域发挥重要作用。

  4. 自动化实验室:在上海交通大学张江校区的自动化实验室里,机械臂正在验证AI设计的蛋白质,每天产生的实验数据回流到AI系统中持续优化蛋白质模具,形成“数据—模型—实验”的增强循环。

  5. 产业应用:已有8个产业项目使用“启明星”大模型设计蛋白质,成功率达70%。例如,某生物医药企业利用设计的极度耐碱的蛋白质,使用寿命提高一倍多,每年可节省上千万元的成本。

  6. 开源共享:由中国科研团队建立的蛋白质大模型及部分数据集已在软件托管平台GitHub上开源,供全世界的科研机构接入。

  7. 未来展望:洪亮教授描绘了未来图景,生物学家只需在电脑上输入需求,AI就能自动生成候选蛋白质“模具”,自动化平台完成验证优化。这将把科研人员从重复实验中解放出来,并催生“定制化合成生物”的全新产业形态。

  总之,洪亮教授团队利用AI技术在蛋白质设计领域取得了革命性突破,不仅提高了研究效率,还为合成生物产业的发展开辟了新的道路。随着AI对生命“设计逻辑”的理解不断深入,我们或许正在见证新的产业革命的到来。

如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
144341
金币
264936
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 16795(小时)
注册时间: 2012-06-21
最后登录: 2025-07-12
只看该作者 板凳  发表于: 05-17
用AI设计蛋白质,满足“定制”需求
传统蛋白质研究的困境
蛋白质是生命活动的物质基础,自然界中参与构成蛋白质的氨基酸有20种,一个蛋白质分子通常由几十个至上千个数量不等的氨基酸按照特定顺序排列而成。排序的细微差别,可能让蛋白质表现出截然不同的功能特性,比如稳定性、活性、亲和力等。过去数十年间,生物学家只能依靠实验方法来测定蛋白质的结构,揭示复杂的蛋白质结构会耗费生物学家大量时间。

AI在蛋白质设计中的突破
AlphaFold模型
2018年,谷歌DeepMind团队发布了AI大模型AlphaFold,它能精准地解析蛋白质的三维构造,为科研人员更高效、更精准地进行药物开发、疫苗设计奠定基础。

启明星大模型
上海交通大学洪亮教授团队训练的AI大模型“启明星”,构建出亿级蛋白质的“功能图谱”,能够精准、高效地设计出耐热、耐碱、耐酸等“超能”蛋白质,满足“定制”蛋白质的需求。该团队利用AI技术学习不同自然环境下,各种生物体内蛋白质链条中氨基酸的排列规则,从温度、酸碱度、压强这3个维度,为5亿个蛋白质打上功能标签,然后把这海量的功能标签“投喂”给AI大模型,使之能快速、精准地设计出耐热、耐酸、耐碱的“皮实”蛋白产品。整个数据集是装满90亿块模具的超级工具箱,这是迄今为止全球最大的蛋白质数据集,由36.2亿条陆地微生物蛋白质序列、26.4亿条海洋微生物蛋白质序列、24.3亿条抗体蛋白质序列、0.6亿条病毒蛋白质序列等组成,蕴藏着从地表到极地冰川、深海沟壑的适者生存法则。

设计示例
以耐热的塑料降解酶为例,团队先从“启明星”中挑出几个具备耐热功能的蛋白质“模具”,再使用AI技术修饰改造这些蛋白质“模具”的氨基酸序列,提高它的耐热性,同步进行实验验证,从而避免了过去的高通量筛选,提升了蛋白质设计与改造的效率。在上海交通大学张江校区的自动化实验室里,机械臂正飞快地验证着AI设计的蛋白质。这里每天产生的实验数据,又会回流到AI系统中持续优化蛋白质模具,形成数据—模型—实验的增强循环,洪亮形象地称之为蛋白质的自动驾驶模式。

AI设计蛋白质的优势
高效设计
传统的蛋白质设计方法通常依赖于大量的实验和试错,耗时且成本高昂。而人工智能通过学习大量已知的蛋白质结构和功能数据,能够快速预测和设计出满足特定需求的蛋白质结构。在为小分子“钥匙”定制蛋白质“锁”的过程中,AI可以根据小分子的化学性质和形状等特征,高效地设计出与之完美结合的蛋白质结构,将效率提升10倍甚至更高。

精确匹配
AI能够精确计算小分子与蛋白质之间的相互作用,从而优化蛋白质的结构,使其与小分子的结合更加紧密和特异性。例如,通过模拟分子动力学和量子化学计算等方法,AI可以预测蛋白质与小分子结合的位点、结合能以及结合后的构象变化,为设计出最优化的蛋白质“锁”提供依据4。

AI设计蛋白质的应用成果
截至目前,已有8个产业项目使用“启明星”大模型设计蛋白质,成功率达70%。某生物医药企业利用“启明星”设计的极度耐碱的蛋白质,使用寿命提高一倍多,每年可为企业节省上千万元的成本。

AI设计蛋白质的未来前景
谈及未来图景,洪亮描绘道:生物学家只需在电脑上输入需求,AI就能自动生成候选蛋白质“模具”,自动化平台完成验证优化。当AI开始理解生命的“设计逻辑”,我们或许正在见证新的产业革命——在这个蛋白质可以被精准“编程”的时代,从医药研发到环境保护,生命科学将向前迈出更大的步伐123。同时,在药物研发方面,AI定制蛋白质锁的技术可以大大加速寻找与特定疾病相关的蛋白质靶点并设计与之结合的药物分子的过程,缩短药物研发周期,提高研发效率,还能提高药物的特异性,减少副作用
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个