生命科学走向 “聊天时刻”
宋乐,生物地图的CTO。将xTrimo比作生命科学领域的 “ChatGPT时刻” -- 就像ChatGPT可以在与世界各地的用户进行多轮对话和迭代后产生越来越高质量的答案一样,生命科学大模型还需要通过闭环验证不断升级,并通过高通量多轮湿法实验进行数据补充。
本文独家获悉,BioMap即将发布AIGP平台 (相当于生命科学模型的输出) 和相应的合作计划,开放部分能力接口。
现在大家都知道ChatGPT,好像是突然出现的,但实际上是AI领域不断研究和逐步进步的结果。”BioMap的CTO、国际机器学习巨头宋乐在接受该论文采访时表示 (www.thetaper。cn),ChatGPT代表了一种新的范式转变,这种转变实际上发生在人工智能的其他领域,如自然语言和成像,其中使用大规模预训练模型,然后对下游应用进行微调。我们从一开始就将这种范式引入生命科学,并在人才、人工智能模型开发和相应的计算能力方面进行了早期布局。因此,今天我们能够拥有一个十亿级的生命科学模型,xTrimo。
宋乐,生物地图的CTO。在采访中,song Le将xTrimo比作生命科学领域的 “ChatGPT时刻” -- 就像ChatGPT可以在与世界各地的用户进行多轮对话和迭代后产生越来越高质量的答案一样,生命科学大模型还需要通过闭环验证不断升级,并通过高通量多轮湿法实验进行数据补充。
XTrimo选择了一种类似于CPT-3.5的技术范式,而ChatGPT在最近发布后的惊人表现再次证实了Song Le的感觉。“我们再次看到了大规模预训练模型与下游模型相结合的成功。从某种意义上说,我们在自己的实验或人工智能模型中也看到了这种效果
宋乐认为,过去几年,随着大模型的出现,在生命科学或制药领域也有一些跨越式的改进。例如,去年流行的Alpha Fold 2已经预测了世界上几乎所有的蛋白质结构。实际上,它还依靠大型变压器模型进行了一步改进。”
“用于生命科学的人工智能 (AI For Life Sciences) 正变得越来越具有生成性,无论是在蛋白质序列生成还是蛋白质结构生成方面。稍后,我们可能会继续看到AIGP (AI产生的蛋白质,AI产生的蛋白质) 的有趣进展。宋乐说。
在采访中,论文独家获悉,BioMap将发布AIGP平台 (相当于生命科学模型的输出) 和相应的合作计划,开放部分能力接口。据悉,这是一个可以解读蛋白质语言、解决生命科学行业问题的平台。它是由BioMap的近300个AI生物技术跨国技术团队开发的,历时两年多。该平台对湿式实验系统和AI干式实验系统两个系统进行了闭环测试。为了确保平台的效率和稳定性,BioMap和百度合作设计了专用于大型模型xTrimo的高性能超级计算中心。