底层依赖外洋开源模子举行微调,,实质上是在别人的地基上修修补补。。。。。
作者丨周蕾
编辑丨岑峰
1965年,,戈登·摩尔提出了那条著名的摩尔定律,,即半导体算力约莫每两年翻一倍。。。。。这条曲线向上走了半个多世纪,,数字天下因此天翻地覆。。。。。
2012年,,反摩尔定律被提出,,它在医药领域意味着这样一种逆境:每投入十亿美元,,获批的新药数目每九年减半。。。。。一条曲线向上,,一条曲线向下,,两条线背道而驰了六十多年。。。。。
六十多年里,,新药研发越来越难,,古板工具链支离破碎,,大都团队只能拿着开源模子做局部修补。。。。。与此同时,,AI先后完成了数字天下和物理天下的重构。。。。。现在,,它来到了最难的生命天下。。。。。而百奥几何,,正是这个路口上走得最远的一家。。。。。
克日,,百奥几何完成数亿元战略融资。。。。。比起融资额巨细或是投资方配景,,这笔钱的重点在于,,它确认了一个拐点:当行业还在应用层寻找增量时,,这家AI Native公司已经用三年时间,,完成了从团队搭建、底层大模子研发到商业闭环的验证。。。。。
从原子层面重新设计生命,,不再是论文里的远期设想,,而是正在爆发的工程化现实。。。。。
从数字、物理到生命AI:AI的第三条蹊径
正如人们所熟知的那样,,人工智能正在沿着数条清晰的主线重构天下。。。。。
第一条是数字AI,,以大语言模子和多模态模子为代表,,正在重塑人类的信息与知识天下。。。。。第二条是物理AI,,以自动驾驶和人形机械人为代表,,正在重塑人类的物理与机械天下。。。。。
而第三条是生命AI,,它不止于信息处理或机械控制,,而是要深入明确生命的底层语言,,在原子级精度上实现对生命的工程化刷新——这或许是三条线里最难的一条。。。。。卵白质、抗体、酶等生物大分子的设计空间近乎无限,,但生命的底层数据是三维图结构,,古板的序列建模唬;;;蛲枷袷侗鹇呒薹ㄖ苯忧ㄡ。。。。。
百奥几何首创人唐建博士很早就注重到了这个差别。。。。。2022年接受雷峰网AI科技谈论采访时他指出,,生物医药领域获得实验数据极其难题,,往往本钱腾贵且周期漫长,,这导致AI必需在少少样本的条件下学习。。。。。这种数据稀缺性,,让生命AI的迭代逻辑与数字AI截然差别。。。。。
数据稀缺性带来的直接挑战,,最终都体现在了工业端的本钱与效率上。。。。。生物医药行业对此感受最深。。。。。如前文提到的反摩尔定律所示,,行业内面临着“研发本钱一连攀升、产出效率却在下降”的逆境。。。。。一位切入AI制药底层模子的从业者向AI科技谈论指出,,已往大都创业公司将管线卖给药企,,看似找到了商业模式,,实则陷入古板biotech的老路——被同化、利润薄、易受甲方价钱控制。。。。。这种路径依赖说明,,只做应用层的局部增效,,无法突破行业的结构性逆境。。。。。
比商业模式逆境更深层的,,是工具链自己的割裂。。。。。AlphaFold能展望卵白质结构,,但设计新分子往往需要切换到其他工具;;;;;展望结构、设计序列、实验验证,,每一步使用差别的平台和逻辑,,误差逐级放大。。。。。而海内大都“AI+Bio”团队,,底层依赖外洋开源模子举行微调,,实质上是在别人的地基上修修补补。。。。。面临难成药靶点和重大抗体设计这类硬问题,,应用层的修补很快触及天花板。。。。。
唐建以为,,这背后尚有一个更基础的工业逻辑。。。。。大模子可以“模子即产品”,,靠基模能力卖token就能赚钱;;;;;但生物医药是垂类,,“模子再准也执偾锤子,,得找到好的钉子。。。。。”这意味着生命AI的终局竞争,,不但看基模性能,,更看能否把模子放进详细应用场景,,与干湿实验形成闭环。。。。。一个团队必需同时明确算法、生物和工业的语言,,把结构展望、序列天生、成药性评价与湿实验反馈整合成闭环。。。。。只有这样,,才华从底层重构研发范式,,从“明确生命”跃迁到“设计生命”。。。。。
当数字AI和物理AI的基础设施已经成型,,生命天下仍在期待属于自己的操作系统。。。。。而决议未来几十年新药研发效率的底层战场,,已悄然开启。。。。。
从学术直觉到工业收敛:一个AI Native团队的三年
百奥几何的首创人唐建,,在十多年前就做出了一个奇异判断,,与眼下BioAI的希望形成了草蛇灰线。。。。。
2013-2014年左右,,深度学习的大潮涌向图像识别和自然语言处理,,但唐建专程转向了图结构数据这个深度学习尚未涉及的问题。。。。。在他看来,,社交网络和知识图谱虽然是热门偏向,,但生物制药才具备杀手级的应用潜力——卵白质、抗体、酶等生命分子的底层数据,,自然就是三维图结构。。。。。
这个判断带有对数据结构与应用场景匹配的底层直觉,,以后十年,,唐建的研究事情也沿着这一判断继续向前航行。。。。。从密歇根大学到加拿大AI之父Yoshua Bengio教授建设的Mila实验室,,他成为该机构最早举行生命科学研究的教授,,图结构深度学习论文LINE在WWW聚会上被引用超七千次,,学术上的积累也为厥后的创业提供了详细的坐标。。。。。
2022年,,大分子AI制药工具TorchProtein开源。。。。。经由一年的思索,,唐建以为该往前再走一步。。。。。“希望能够更进一步,,使研究效果不但仅局限于论文的形式。。。。。”他告诉我们,,其时学术界还没有相似的平台,,他决议把积累整合成一个通用工具。。。。。这个想法很质朴:让厥后的研究者可以直接使用,,而不必重复造轮子。。。。。
降低门槛的思绪,,厥后延续到了百奥几何。。。。。2023年3月,,百奥几何正式运营。。。。。
但创业初期,,焦点团队险些全是盘算机配景,,AI与生物学之间的“语言鸿沟”成了第一道必需跨越的墙。。。。。生物领域的人才普遍资深,,早期对AI通常是张望甚至质疑的态度,,“生物的人,,除非你做出药来才会相信你。。。。。”唐建感伤,,跟他们相同,,讲AI多厉害没用,,必需形成行业认知,,说清晰AI怎么解决行业痛点,,拿出足够重大的详细乐成案例,,才华建设信任。。。。。
这种跨学科磨合一连了数年。。。。。百奥几何自建了两套湿实验平台,,划分对应抗体药和合成生物学。。。。。“模子底层一样,,但差别应用场景需要的生物职员专业知识画像完全差别。。。。。”这种跨学科磨合远非易事——AI团队与生物团队的文化气氛、治理方式差别重大,,直接拉长了行业的迭代周期。。。。。
手艺蹊径也曾走过弯路。。。。。百奥几何建设之初的愿景就是实现抗体重新设计,,但手艺始终未抵达最佳预期,,因此2024年至2025年底时代,,团队将重心转向合成生物学,,甚至实验自建工厂走重资产蹊径。。。。。但工厂侧的认知更多从制造业的头脑出发,,难以与AI研发团队告竣共识,,这次相助最终未能顺遂落地,,这也一度影响了公司的融资节奏。。。。。
唐建向雷峰网AI科技谈论坦言,,2025年底,,百奥几何正式做了战略收敛,,研发聚焦立异药主航道,,合成生物学领域则接纳相助分成形式。。。。。此番战略回调之后,,轻装上阵,,抗体手艺率先突破,,公司回到准确轨道。。。。。
支持这些突破的底层模子,,也在统一时期快速迭代。。。。。从2024年6月宣布的GeoFlow V1最先,,百奥几何的底层模子能力快速迭代。。。。。V1主要做抗原抗体复合物结构展望,,对标AlphaFold 3;;;;;V2在国际上首先提出用一个模子同时做复合物结构展望和重新天生,,将“明确”与“天生”统一;;;;;V3引入大模子推理阶段的多步推理,,提升了抗体重新设计的乐成率。。。。。现在V4正在研发,,建模标准从单个分子拓展至细胞水平的分子系统。。。。。
AI科技谈论相识到,,百奥几何也是海内最早突破抗体重新设计的团队。。。。。其底层手艺蹊径与外洋头部公司类似,,都基于diffusion model,,但差别化在于V2提出的统一模子思绪——用一个模子同时完成结构展望和de novo design。。。。。这一思绪同样泛起在Chai Discovery和Boltz等模子中。。。。。
与英伟达的相助也一连多年。。。。。唐建在Mila时代向导团队开发了针对小分子和卵白的开源机械学习平台TorchDrug与TorchProtein,,其中TorchProtein即是与英伟达、英特尔、IBM等团队配合完成。。。。。近期相助进一步加深,,英伟达General AI团队注重到AI for Science特殊是卵白质设计的潜力,,双方在手艺层面最先更细密的协作。。。。。唐建也加入了部分事情,,包括在搜索阶段增添算力、使用test time compute提高设计乐成率。。。。。这些手艺探索被应用到GeoFlow V2到V3的迭代中,,使百奥几何在底层手艺层面始终与外洋头部团队坚持同步。。。。。
三年时间,,百奥几何完成了从学术工具到工业基础设施的跃迁。。。。。但这只是验证了手艺可行性,,真正的磨练在于,,这些底层能力能否在工业端重新界说研发流程。。。。。
从分子到系统:基模能力的工业验证
底层模子跑通之后,,真正的磨练是工业交付。。。。。百奥几何也制订了两个重点战略偏向:抗体药物开发和合成生物学里的酶设计。。。。。
抗体重新设计是百奥几何最先突破的硬骨头。。。。。针对一个难成药靶点设计高特异性连系抗体,,古板方式需要从动物免疫或自然库中筛选,,但靶点所在的卵白家族里,,其他成员与目的靶点只差两个氨基酸,,很难找到不脱靶的分子。。。。。“我们通过GeoFlow做了精准建模设计,,乐成找到了几个抗体,,能够跟靶点连系得很好,,同时跟另外的靶点不连系。。。。。”他透露,,相关分子现在正在往IND阶段推进。。。。。
疫苗设计的希望则更迅速。。。。。2025年,,百奥几何相助开发疫苗,,难点在于设计一种卵白,,使其能够高效自组装为稳固的二聚体。。。。。实验数据显示,,自然卵白里这种二聚体比例缺乏10%,,而百奥几何介入后,,直接提升至90%以上。。。。。现在相关疫苗已乐成转让给下游药企,,正式步入工业化阶段。。。。。
合成生物学方面,,龙脑提供了一个差别的验证场景。。。。。这种中药活性因素已往只能从樟科植物提取。。。。。植物里的龙脑含量极低,,是自然进化凑巧爆发的副产品,,一株植物往往要种一两年才华采收。。。。。百奥几何通过GeoFlow重新设计了一种酶,,把它导入微生物,,让发酵罐里的微生物主要生产龙脑,,而不再是微量副产品。。。。。这样一来,,本钱降到植物提取的十分之一,,且不再受季节和莳植周限期制。。。。。相关手艺也已在工厂完成中试放大,,现在正与下游相助方洽谈生产。。。。。
从抗体到疫苗再到酶,,三个案例的落点各不相同,,但底层逻辑一致:AI重新界说了流程自己。。。。。
古板方式拿到先导分子,,需要通过动物免疫筛选再优化,,周期长达9~12个月。。。。。现在,,百奥几何的做法是跳过动物免疫,,直接从盘算端天生候选分子,,靶点交付周期能大幅缩短,,短则一个月,,长则三个月——更实质的转变是乐成率:有些难成药靶点,,古板动物免疫基础做不出来,,盘算端却能给出可行方案。。。。。
管线验证只是起点。。。。。唐建以为,,这个领域真正的恒久壁垒在数据端。。。。。接下来百奥几何将搭建自动化实验室——现有湿实验室之外,,自动化平台能爆发更大通量的数据,,把干湿实验的迭代效率再提一档。。。。。
他的愿景是模子能够自我进化,,形成一套自主进化、自主执行的系统,,类似Claude设计下一代系统的偏向。。。。。叠加自动化实验室之后,,就能做自主的科学探索,,好比在药物研发里做靶点的自主发明、分子的自主设计验证。。。。。
这指向一个更大的行业判断。。。。。在唐建看来,,大模子的生长早已为AI制药的演变路径给出了清晰预演:“在大模子生态中,,我们已经看到一个残酷的现实——随着前沿基模在架构与通用能力上的一连进化,,其一直外延的能力界线,,正在直接‘蚕食’大宗缺乏焦点壁垒的下游应用。。。。。”正因云云,,在垂类基模领域,,Isomorphic、Chai Discovery、百奥几何等头部团队都选择了闭源——模子自己就是焦点竞争力。。。。。未来两三年,,行业将泛起明确分化:不具备基模训练能力的团队,,会逐渐失去对 AI 制药下一阶段游戏规则的界说权。。。。。
百奥几何的界线也在随之扩展。。。。。GeoFlow V4正在把建模标准从单个分子推向细胞水平的分子系统。。。。。从抗体、疫苗到酶工程,,从药物发明到合成生物学,,底层能力一旦验证,,天花板就不再是简单管线,,而是生命工程的基础设施自己。。。。。
被命名为Moore和Eroom的两条曲线,,仍在运行。。。。。百奥几何正在两者之间撕开一道口子——跳出“为旧流程加速”的局部修补,,转向底层重构,,从原子层面重新设计流程。。。。。
从抗体、疫苗到合成生物学,,从GeoFlow V1到V4,,底层模子的能力界线一直扩展,,唐建的判断也始终如一:行业终局由基模层的底层操作系统界说,,应用层的微调无法改变名堂。。。。。
现在,,生命天下正在等来属于自己的操作系统。。。。。而百奥几何,,已经和Isomorphic、Chai Discovery一起,,站在了界说这套系统的最前排。。。。。BioAI时代刚刚开启,,底层基础设施的搭建者已经先行一步。。。。。
那么,,价钱回暖能带来什么利益????