探索Bio AI「o1时刻」:百奥几何的三年微观天下模子演进
底层依赖外洋开源模子举行微调,,,,,实质上是在别人的地基上修修补补。。。。。。
作者丨周蕾
编辑丨岑峰
1965年,,,,,戈登·摩尔提出了那条著名的摩尔定律,,,,,即半导体算力约莫每两年翻一倍。。。。。。这条曲线向上走了半个多世纪,,,,,数字天下因此天翻地覆。。。。。。
2012年,,,,,反摩尔定律被提出,,,,,它在医药领域意味着这样一种逆境:每投入十亿美元,,,,,获批的新药数目每九年减半。。。。。。一条曲线向上,,,,,一条曲线向下,,,,,两条线背道而驰了六十多年。。。。。。
六十多年里,,,,,新药研发越来越难,,,,,古板工具链支离破碎,,,,,大都团队只能拿着开源模子做局部修补。。。。。。与此同时,,,,,AI先后完成了数字天下和物理天下的重构。。。。。。现在,,,,,它来到了最难的生命天下。。。。。。而百奥几何,,,,,正是这个路口上走得最远的一家。。。。。。
克日,,,,,百奥几何完成数亿元战略融资。。。。。。比起融资额巨细或是投资方配景,,,,,这笔钱的重点在于,,,,,它确认了一个拐点:当行业还在应用层寻找增量时,,,,,这家AI Native公司已经用三年时间,,,,,完成了从团队搭建、底层大模子研发到商业闭环的验证。。。。。。
从原子层面重新设计生命,,,,,不再是论文里的远期设想,,,,,而是正在爆发的工程化现实。。。。。。
从数字、物理到生命AI:AI的第三条蹊径
正如人们所熟知的那样,,,,,人工智能正在沿着数条清晰的主线重构天下。。。。。。
第一条是数字AI,,,,,以大语言模子和多模态模子为代表,,,,,正在重塑人类的信息与知识天下。。。。。。第二条是物理AI,,,,,以自动驾驶和人形机械人为代表,,,,,正在重塑人类的物理与机械天下。。。。。。
而第三条是生命AI,,,,,它不止于信息处理或机械控制,,,,,而是要深入明确生命的底层语言,,,,,在原子级精度上实现对生命的工程化刷新——这或许是三条线里最难的一条。。。。。。卵白质、抗体、酶等生物大分子的设计空间近乎无限,,,,,但生命的底层数据是三维图结构,,,,,古板的序列建;;蛲枷袷侗鹇呒薹ㄖ苯忧ㄡ。。。。。。
百奥几何首创人唐建博士很早就注重到了这个差别。。。。。。2022年接受雷峰网AI科技谈论采访时他指出,,,,,生物医药领域获得实验数据极其难题,,,,,往往本钱腾贵且周期漫长,,,,,这导致AI必需在少少样本的条件下学习。。。。。。这种数据稀缺性,,,,,让生命AI的迭代逻辑与数字AI截然差别。。。。。。
数据稀缺性带来的直接挑战,,,,,最终都体现在了工业端的本钱与效率上。。。。。。生物医药行业对此感受最深。。。。。。如前文提到的反摩尔定律所示,,,,,行业内面临着“研发本钱一连攀升、产出效率却在下降”的逆境。。。。。。一位切入AI制药底层模子的从业者向AI科技谈论指出,,,,,已往大都创业公司将管线卖给药企,,,,,看似找到了商业模式,,,,,实则陷入古板biotech的老路——被同化、利润薄、易受甲方价钱控制。。。。。。这种路径依赖说明,,,,,只做应用层的局部增效,,,,,无法突破行业的结构性逆境。。。。。。
比商业模式逆境更深层的,,,,,是工具链自己的割裂。。。。。。AlphaFold能展望卵白质结构,,,,,但设计新分子往往需要切换到其他工具;;展望结构、设计序列、实验验证,,,,,每一步使用差别的平台和逻辑,,,,,误差逐级放大。。。。。。而海内大都“AI+Bio”团队,,,,,底层依赖外洋开源模子举行微调,,,,,实质上是在别人的地基上修修补补。。。。。。面临难成药靶点和重大抗体设计这类硬问题,,,,,应用层的修补很快触及天花板。。。。。。
唐建以为,,,,,这背后尚有一个更基础的工业逻辑。。。。。。大模子可以“模子即产品”,,,,,靠基模能力卖token就能赚钱;;但生物医药是垂类,,,,,“模子再准也执偾锤子,,,,,得找到好的钉子。。。。。。”这意味着生命AI的终局竞争,,,,,不但看基模性能,,,,,更看能否把模子放进详细应用场景,,,,,与干湿实验形成闭环。。。。。。一个团队必需同时明确算法、生物和工业的语言,,,,,把结构展望、序列天生、成药性评价与湿实验反馈整合成闭环。。。。。。只有这样,,,,,才华从底层重构研发范式,,,,,从“明确生命”跃迁到“设计生命”。。。。。。
当数字AI和物理AI的基础设施已经成型,,,,,生命天下仍在期待属于自己的操作系统。。。。。。而决议未来几十年新药研发效率的底层战场,,,,,已悄然开启。。。。。。
从学术直觉到工业收敛:一个AI Native团队的三年
百奥几何的首创人唐建,,,,,在十多年前就做出了一个奇异判断,,,,,与眼下BioAI的希望形成了草蛇灰线。。。。。。
2013-2014年左右,,,,,深度学习的大潮涌向图像识别和自然语言处理,,,,,但唐建专程转向了图结构数据这个深度学习尚未涉及的问题。。。。。。在他看来,,,,,社交网络和知识图谱虽然是热门偏向,,,,,但生物制药才具备杀手级的应用潜力——卵白质、抗体、酶等生命分子的底层数据,,,,,自然就是三维图结构。。。。。。
这个判断带有对数据结构与应用场景匹配的底层直觉,,,,,以后十年,,,,,唐建的研究事情也沿着这一判断继续向前航行。。。。。。从密歇根大学到加拿大AI之父Yoshua Bengio教授建设的Mila实验室,,,,,他成为该机构最早举行生命科学研究的教授,,,,,图结构深度学习论文LINE在WWW聚会上被引用超七千次,,,,,学术上的积累也为厥后的创业提供了详细的坐标。。。。。。
2022年,,,,,大分子AI制药工具TorchProtein开源。。。。。。经由一年的思索,,,,,唐建以为该往前再走一步。。。。。。“希望能够更进一步,,,,,使研究效果不但仅局限于论文的形式。。。。。。”他告诉我们,,,,,其时学术界还没有相似的平台,,,,,他决议把积累整合成一个通用工具。。。。。。这个想法很质朴:让厥后的研究者可以直接使用,,,,,而不必重复造轮子。。。。。。
降低门槛的思绪,,,,,厥后延续到了百奥几何。。。。。。2023年3月,,,,,百奥几何正式运营。。。。。。
但创业初期,,,,,焦点团队险些全是盘算机配景,,,,,AI与生物学之间的“语言鸿沟”成了第一道必需跨越的墙。。。。。。生物领域的人才普遍资深,,,,,早期对AI通常是张望甚至质疑的态度,,,,,“生物的人,,,,,除非你做出药来才会相信你。。。。。。”唐建感伤,,,,,跟他们相同,,,,,讲AI多厉害没用,,,,,必需形成行业认知,,,,,说清晰AI怎么解决行业痛点,,,,,拿出足够重大的详细乐成案例,,,,,才华建设信任。。。。。。
这种跨学科磨合一连了数年。。。。。。百奥几何自建了两套湿实验平台,,,,,划分对应抗体药和合成生物学。。。。。。“模子底层一样,,,,,但差别应用场景需要的生物职员专业知识画像完全差别。。。。。。”这种跨学科磨合远非易事——AI团队与生物团队的文化气氛、治理方式差别重大,,,,,直接拉长了行业的迭代周期。。。。。。
手艺蹊径也曾走过弯路。。。。。。百奥几何建设之初的愿景就是实现抗体重新设计,,,,,但手艺始终未抵达最佳预期,,,,,因此2024年至2025年底时代,,,,,团队将重心转向合成生物学,,,,,甚至实验自建工厂走重资产蹊径。。。。。。但工厂侧的认知更多从制造业的头脑出发,,,,,难以与AI研发团队告竣共识,,,,,这次相助最终未能顺遂落地,,,,,这也一度影响了公司的融资节奏。。。。。。
唐建向雷峰网AI科技谈论坦言,,,,,2025年底,,,,,百奥几何正式做了战略收敛,,,,,研发聚焦立异药主航道,,,,,合成生物学领域则接纳相助分成形式。。。。。。此番战略回调之后,,,,,轻装上阵,,,,,抗体手艺率先突破,,,,,公司回到准确轨道。。。。。。
支持这些突破的底层模子,,,,,也在统一时期快速迭代。。。。。。从2024年6月宣布的GeoFlow V1最先,,,,,百奥几何的底层模子能力快速迭代。。。。。。V1主要做抗原抗体复合物结构展望,,,,,对标AlphaFold 3;;V2在国际上首先提出用一个模子同时做复合物结构展望和重新天生,,,,,将“明确”与“天生”统一;;V3引入大模子推理阶段的多步推理,,,,,提升了抗体重新设计的乐成率。。。。。。现在V4正在研发,,,,,建模标准从单个分子拓展至细胞水平的分子系统。。。。。。
AI科技谈论相识到,,,,,百奥几何也是海内最早突破抗体重新设计的团队。。。。。。其底层手艺蹊径与外洋头部公司类似,,,,,都基于diffusion model,,,,,但差别化在于V2提出的统一模子思绪——用一个模子同时完成结构展望和de novo design。。。。。。这一思绪同样泛起在Chai Discovery和Boltz等模子中。。。。。。
与英伟达的相助也一连多年。。。。。。唐建在Mila时代向导团队开发了针对小分子和卵白的开源机械学习平台TorchDrug与TorchProtein,,,,,其中TorchProtein即是与英伟达、英特尔、IBM等团队配合完成。。。。。。近期相助进一步加深,,,,,英伟达General AI团队注重到AI for Science特殊是卵白质设计的潜力,,,,,双方在手艺层面最先更细密的协作。。。。。。唐建也加入了部分事情,,,,,包括在搜索阶段增添算力、使用test time compute提高设计乐成率。。。。。。这些手艺探索被应用到GeoFlow V2到V3的迭代中,,,,,使百奥几何在底层手艺层面始终与外洋头部团队坚持同步。。。。。。
三年时间,,,,,百奥几何完成了从学术工具到工业基础设施的跃迁。。。。。。但这只是验证了手艺可行性,,,,,真正的磨练在于,,,,,这些底层能力能否在工业端重新界说研发流程。。。。。。
从分子到系统:基模能力的工业验证
底层模子跑通之后,,,,,真正的磨练是工业交付。。。。。。百奥几何也制订了两个重点战略偏向:抗体药物开发和合成生物学里的酶设计。。。。。。
抗体重新设计是百奥几何最先突破的硬骨头。。。。。。针对一个难成药靶点设计高特异性连系抗体,,,,,古板方式需要从动物免疫或自然库中筛选,,,,,但靶点所在的卵白家族里,,,,,其他成员与目的靶点只差两个氨基酸,,,,,很难找到不脱靶的分子。。。。。。“我们通过GeoFlow做了精准建模设计,,,,,乐成找到了几个抗体,,,,,能够跟靶点连系得很好,,,,,同时跟另外的靶点不连系。。。。。。”他透露,,,,,相关分子现在正在往IND阶段推进。。。。。。
疫苗设计的希望则更迅速。。。。。。2025年,,,,,百奥几何相助开发疫苗,,,,,难点在于设计一种卵白,,,,,使其能够高效自组装为稳固的二聚体。。。。。。实验数据显示,,,,,自然卵白里这种二聚体比例缺乏10%,,,,,而百奥几何介入后,,,,,直接提升至90%以上。。。。。。现在相关疫苗已乐成转让给下游药企,,,,,正式步入工业化阶段。。。。。。
合成生物学方面,,,,,龙脑提供了一个差别的验证场景。。。。。。这种中药活性因素已往只能从樟科植物提取。。。。。。植物里的龙脑含量极低,,,,,是自然进化凑巧爆发的副产品,,,,,一株植物往往要种一两年才华采收。。。。。。百奥几何通过GeoFlow重新设计了一种酶,,,,,把它导入微生物,,,,,让发酵罐里的微生物主要生产龙脑,,,,,而不再是微量副产品。。。。。。这样一来,,,,,本钱降到植物提取的十分之一,,,,,且不再受季节和莳植周限期制。。。。。。相关手艺也已在工厂完成中试放大,,,,,现在正与下游相助方洽谈生产。。。。。。
从抗体到疫苗再到酶,,,,,三个案例的落点各不相同,,,,,但底层逻辑一致:AI重新界说了流程自己。。。。。。
古板方式拿到先导分子,,,,,需要通过动物免疫筛选再优化,,,,,周期长达9~12个月。。。。。。现在,,,,,百奥几何的做法是跳过动物免疫,,,,,直接从盘算端天生候选分子,,,,,靶点交付周期能大幅缩短,,,,,短则一个月,,,,,长则三个月——更实质的转变是乐成率:有些难成药靶点,,,,,古板动物免疫基础做不出来,,,,,盘算端却能给出可行方案。。。。。。
管线验证只是起点。。。。。。唐建以为,,,,,这个领域真正的恒久壁垒在数据端。。。。。。接下来百奥几何将搭建自动化实验室——现有湿实验室之外,,,,,自动化平台能爆发更大通量的数据,,,,,把干湿实验的迭代效率再提一档。。。。。。
他的愿景是模子能够自我进化,,,,,形成一套自主进化、自主执行的系统,,,,,类似Claude设计下一代系统的偏向。。。。。。叠加自动化实验室之后,,,,,就能做自主的科学探索,,,,,好比在药物研发里做靶点的自主发明、分子的自主设计验证。。。。。。
这指向一个更大的行业判断。。。。。。在唐建看来,,,,,大模子的生长早已为AI制药的演变路径给出了清晰预演:“在大模子生态中,,,,,我们已经看到一个残酷的现实——随着前沿基模在架构与通用能力上的一连进化,,,,,其一直外延的能力界线,,,,,正在直接‘蚕食’大宗缺乏焦点壁垒的下游应用。。。。。。”正因云云,,,,,在垂类基模领域,,,,,Isomorphic、Chai Discovery、百奥几何等头部团队都选择了闭源——模子自己就是焦点竞争力。。。。。。未来两三年,,,,,行业将泛起明确分化:不具备基模训练能力的团队,,,,,会逐渐失去对 AI 制药下一阶段游戏规则的界说权。。。。。。
百奥几何的界线也在随之扩展。。。。。。GeoFlow V4正在把建模标准从单个分子推向细胞水平的分子系统。。。。。。从抗体、疫苗到酶工程,,,,,从药物发明到合成生物学,,,,,底层能力一旦验证,,,,,天花板就不再是简单管线,,,,,而是生命工程的基础设施自己。。。。。。
被命名为Moore和Eroom的两条曲线,,,,,仍在运行。。。。。。百奥几何正在两者之间撕开一道口子——跳出“为旧流程加速”的局部修补,,,,,转向底层重构,,,,,从原子层面重新设计流程。。。。。。
从抗体、疫苗到合成生物学,,,,,从GeoFlow V1到V4,,,,,底层模子的能力界线一直扩展,,,,,唐建的判断也始终如一:行业终局由基模层的底层操作系统界说,,,,,应用层的微调无法改变名堂。。。。。。
现在,,,,,生命天下正在等来属于自己的操作系统。。。。。。而百奥几何,,,,,已经和Isomorphic、Chai Discovery一起,,,,,站在了界说这套系统的最前排。。。。。。BioAI时代刚刚开启,,,,,底层基础设施的搭建者已经先行一步。。。。。。
@刘淑映:环彩网官网,,,,,有些学校为什么装了空调却不必@吕安新:天涯社区正式恢复会见
@苏长君:坚持一其中国原则 瑙鲁出台公务规范