字节Seed预训练认真人顾全全在X上宣布了一条简短的离别帖。。。。。
Today marks my last day at ByteDance Seed.
但顾全全脱离Seed,,,,不是字节故事里最大的转变。。。。。
豆包6月马上最先收费才是。。。。。
一个顶级研究者的脱离,,,,虽然值得关注。。。。。更大的关注点在于,,,,字节已经进入了第二阶段,,,,AI成为驱动字节增添的主引擎。。。。。
已往两年,,,,豆包帮字节证实晰一件事,,,,那就是它有能力把AI产品推到亿级用户眼前。。。。。
然而收费之后,,,,豆包要证实的是另一件事,,,,这好几亿的用户里,,,,又有几多人愿意为AI付钱??????
从这一刻最先,,,,Seed做出的工具,,,,光有论文和评分是没用的,,,,得能转化成为产品、收入以及用户体验才行。。。。。
这就导致字节必需有取舍,,,,不可再大而全地去探索所有偏向。。。。。
顾全全的脱离,,,,正好爆发在这个转折点上。。。。。
顾全全:毗连生物AI、基础模子
和scale能力的那类人
顾全全本科和硕士都在清华自动化系,,,,2014年在UIUC拿到盘算机PhD。。。。。博士结业后先在普林斯顿大学做博士后(2014-2015),,,,2015年赴弗吉尼亚大学任助理教授,,,,2018年加入UCLA,,,,研究偏向笼罩机械学习、优化算法、统计学习理论。。。。。
2023年,,,,顾全全加入字节Seed。。。。。
那一年,,,,字节刚刚完成AI组织架构的重大调解,,,,组建了首个大模子团队,,,,由朱文佳认真。。。。。
2024年头,,,,完玉成面重组,,,,Flow和Seed升级为与抖音平级的一级部分,,,,直接向梁汝波汇报。。。。。
2025年2月,,,,吴永辉加入并接受Seed基础研究,,,,朱文佳转向模子应用。。。。。
Seed需要的不但是发论文的科学家,,,,更需要那种既懂模子训练、又能把能力落到详细问题里、还真的带过高强度项目的人。。。。。
顾全全恰恰切合这个画像。。。。。
他在Seed同时加入了两条线:一条是AI4S,,,,另一条是前沿LLM。。。。。
AI4S(AI for Science),,,,就是用AI解决科学问题,,,,好比卵白质结构展望、药物分子设计、质料研发,,,,这些已往需要实验室花几年才华搞定的事,,,,现在AI可以在几小时内给出谜底。。。。。
AI4S在其时也算是较量热门的一条线,,,,谷歌的AlphaFold,,,,就是AI4S上的一个里程碑式产品。。。。。
然而顾全全的这种跨度在大厂AI组织里并不常见。。。。。大部分科学家要么深耕某个笔直领域,,,,要么专注于基础模子训练,,,,很少有人能在两个偏向上同时产出。。。。。
AI4S这边,,,,他带队做了SeedFold、SeedProteo和DPLM系列。。。。。
SeedFold是字节Seed做的生物分子结构展望模子,,,,论文里体现,,,,SeedFold在FoldBench多个卵白相关使命上,,,,均凌驾AlphaFold3
SeedProteo则面向卵白连系剂设计,,,,是一个de novo全原子卵白设计模子。。。。。
若是说SeedFold是“看懂”卵白质结构,,,,那SeedProteo就是“设计”新的卵白质分子。。。。。后者的商业化想象空间更大,,,,但手艺难度也更高。。。。。
DPLM系列则是卵白质语言模子,,,,试图用类似训练大语言模子的方式,,,,让AI明确和天生卵白质序列。。。。。
这条线在学术界已经有不少探索,,,,但字节Seed的特点是把它和自己的基础模子能力连系起来,,,,形成了一套相对完整的AI4S手艺栈。。。。。
这些效果在学术上很有分量。。。。。
SeedFold的论文揭晓后,,,,被多个研究机构引用和复现。。。。。SeedProteo在卵白设计使命上的体现,,,,也被以为是其时业界最强的几个模子之一。。。。。
顾全全在AI4S领域的声誉,,,,很洪流平上就是这三年里用这些项目积累起来的。。。。。
但AI4S只是顾全全在Seed事情的一半。。。。。
2025年头,,,,他又加入了LLM预训练事情,,,,组建了LLM优化和扩展团队,,,,加入Seed 2.0的训练。。。。。这个转向在其时看起来有些突然,,,,但若是明确字节AI战略的转变,,,,就会发明这着实是一个必定选择。。。。。
DeepSeek的走红,,,,让所有大厂意识到,,,,预训练能力不但是算力问题,,,,更是工程化和优化能力的问题。。。。。
字节Seed需要一个能够把预训练做成系统的人。。。。。
顾全全又懂统计学习理论、优化算法,,,,还懂大规模训练履历,,,,这就让他成为了这个位置最合适的人选。。。。。
他组建的LLM优化和扩展团队,,,,目的就是建设一套“高度可扩展的预训练栈”,,,,让Seed 2.0和后续的frontier-scale模子能够稳固训练和迭代。。。。。
从他自己的LinkedIn帖子来看,,,,这个目的基本告竣了。。。。。他提到团队“我向导团队搭建了一套高度可扩展的预训练手艺栈,,,,乐成支持了 Seed 2.0 以及后续前沿级大模子的训练事情”。。。。。
它意味着字节Seed在预训练能力上,,,,已经不再依赖外部手艺或者单点突破,,,,而是形成了一套可以一连迭代的工程化系统。。。。。
顾全全在字节Seed的三年,,,,把字节的科学问题、基础模子能力和大规模训练能力全都毗连起来了。。。。。
顾全全的价值,,,,就在于他能够在AI4S和LLM这两个偏向上,,,,同时产出,,,,并且把它们都做成了系统化的能力。。。。。
但这也是问题所在。。。。。
顾全全做的事情,,,,都是“远期价值”很强、但“近期产品价值”不那么明确的事情。。。。。
豆包最先收费后,,,,字节Seed的价值排序必定会变得更现实。。。。。
AI4S组织调解
就在顾全全宣布去职新闻的前几天,,,,有这么一条新闻,,,,称字节Seed旗下AI4S团队正在履历组织调解。。。。。
靠近字节的人士称“不思量分拆”,AI4S团队将由杨震原认真。。。。。随后才有了肖文之、顾全全等AI4S相关焦点成员已脱离或准备脱离创业的新闻。。。。。
“不思量分拆”意味着字节并不妄想把AI4S作为一个自力营业拆出去,,,,也不妄想让它成为一个可以自力运作的实体。。。。。
AI4S仍然是Seed的一部分,,,,仍然要听从Seed整体的战略优先级。。。。。杨震原接手,,,,说明字节对这个偏向尚有投入,,,,但投入的方式和目的可能已经爆发了转变。。。。。
AI4S是一个很特殊的领域。。。。。它的价值很难用我们现在的产品指标去权衡。。。。。
做出一个凌驾AlphaFold3的卵白结构展望模子,,,,在学术上虽然是重大突破。。。。。但这个突破要转化成商业收入,,,,中心尚有很长的路要走。。。。。
尚有一点,,,,AI4S的效果很容易“随着人走”。。。。。
做豆包这种产品,,,,能力更多沉在公司系统里。。。。。好比模子平台、训练集群、推理架构、产品入口,,,,这些都在字节手里。。。。。人走了会有影响,,,,但系统还在。。。。。
但AI4S纷歧样。。。。。它往往依赖某几个焦点研究者对生物、化学、卵白结构、药物发明和模子要领的交织明确。。。。。许多效果不是一个App功效,,,,而是一套研究蹊径、模子假设、数据处理要领、实验判断和工业资源。。。。。
这些工具很大一部分长在人的脑子里、履历里和关系网里。。。。。
以是顾全全走后,,,,Seed 2.0受到的影响可能不大。。。。。
但AI4S就纷歧样了。。。。。
肖文之、顾全全这些焦点成员的脱离,,,,对AI4S团队的影响很是大。。。。。
他们带走的不但是手艺能力,,,,尚有在这个领域的声誉、人脉和对未来偏向的判断。。。。。
杨震原接手后,,,,AI4S团队能不可在学术界和工业界坚持保存感,,,,这些都是未知数。。。。。
更要害的问题是,,,,字节还愿意给AI4S几多资源和耐心。。。。。
AI4S是一个需要恒久投入、短期回报不明确的偏向。。。。。
它的价值可能在三年后、五年后才会展现,,,,也可能永远不会展现。。。。。对一家商业公司来说,,,,这种不确定性是很难恒久遭受的。。。。。
尤其是当豆包最先收费,,,,AI4S的处境就会变得越发尴尬。。。。。
字节是舍得在AI上投入的,,,,并且在海内大厂里,,,,字节也都是顶级的。。。。。
5月就有新闻称,,,,字节把2026年资源开支妄想上调至少25%,,,,AI相关资源开支以后前讨论的约1600亿元人民币提高到凌驾2000亿元人民币。。。。。
但耐心终归是有限度的,,,,再加上字节内部自己的赛马机制,,,,就导致团队必需得在一准时间内拿出效果。。。。。
当组织的优先级爆发转变时,,,,那些远期价值很强、但近期孝顺不明确的偏向,,,,优先级可能会被降低。。。。。
AI4S团队的组织调解,,,,实质上就是这个历程的一部分。。。。。
它不是字节要放弃AI4S,,,,而是字节要让AI4S更明确地服务于产品和商业化目的。。。。。
这对科学家来说,,,,是一个很现实的选择题。。。。。
留下来,,,,意味着接受组织的新逻辑,,,,把研究偏向调解到更靠近产品需求的地方。。。。。脱离,,,,意味着去一个更尊重“远期科学价值”的情形,,,,或者自己创业,,,,把手艺理想酿成一个新的组织。。。。。
肖文之、顾全全选择了后者。。。。。这不是由于他们不认可字节,,,,而是由于他们更认可自己在AI4S偏向上的判断。。。。。他们相信这个偏向有恒久价值,,,,也相信自己有能力把这个价值做出来。。。。。
豆包收费,,,,真正的转折点
一切的原因在于豆包要最先收费了。。。。。
着实险些所有AI产品都在收费,,,,OpenAI的ChatGPT Plus、Anthropic的Claude Pro、谷歌的Gemini Advanced,,,,海内的Kimi、智谱、MiniMax都有付费版本。。。。。
豆包收费,,,,我以为一点都没有问题。。。。。
已往,,,,Seed可以讲一个很弘大的手艺国界故事。。。。。
LLM是基础,,,,多模态是延伸,,,,视频天生是突破口,,,,语音是体验增强,,,,AI4S是恒久结构,,,,Agent是未来偏向。。。。。
每一个偏向都有自己的价值,,,,每一个团队都在做自己的事情。。。。。Seed的角色,,,,是把这些能力整合起来,,,,形成一个完整的AI手艺系统。。。。。
这个故事在2023年、2024年是建设的。。。。。
那时间整个AI行业都在探索偏向,,,,所有大厂都在广撒网,,,,试图在每一个可能的手艺偏向上占有位置。。。。。字节Seed的手艺国界足够宽,,,,也足够深,,,,这自己就是一种竞争力。。。。。
但现在,,,,情形变了。。。。。
凭证豆包自己的话来说就是,,,,“我将接纳最直接、最真相、最不绕弯、最扎心、最硬核、最爽性、最不墨迹、最戳痛点、最不留人情、最一针见血、最开门见山的方式来告诉你。。。。。收费就意味着产品要对用户体验认真”。。。。。
这时间,,,,Seed内部的每一个团队都要回覆这样一个问题:你做的这个功效,,,,能不可放进豆包的会员权益里??????
显然,,,,AI4S的价值是恒久的、战略性的、面向特定行业客户的。。。。。它可能在三年后、五年后,,,,成为字节在生物医药、质料科学、化学合成领域的焦点竞争力。。。。。
但现在的豆包,,,,很难证实自己的产品价值。。。。。
这不是字节的问题,,,,是所有商业公司在AI商业化阶段都会面临的问题。。。。。
谷歌也是云云。。。。。DeepMind一经可以做AlphaGo、AlphaFold这样的恒久项目,,,,但厥后谷歌发明,,,,DeepMind的研究偏向也应该向产品靠拢,,,,以是谷歌才会把DeepMind和谷歌Brain合并成谷歌DeepMind,,,,让Gemini成为谷歌AI战略的焦点。。。。。
以后,,,,那些不可为Gemini、谷歌搜索、谷歌云孝顺价值的项目,,,,就很难再获得足够的资源支持。。。。。
字节Seed现在走的,,,,就是这条路。。。。。
谁能降低推理本钱,,,,谁就能让豆包的毛利率更高;;;;;;谁就能让用户体验更好。。。。。谁就能拉高留存,,,,让用户掏钱。。。。。
由于这些能力,,,,都是可以量化、可以审核、可以直接对应到收入和利润的,,,,这些也切合字节内部的价值系统。。。。。
与此同时,,,,这内里尚有一个问题我们得辩证地去看,,,,AI生长需要恒久投入、需要容忍失败、需要给科学家足够的自由度去探索未知偏向,,,,在这一点上是无可厚非的。。。。。
但AI的商业化,,,,需要短期回报、需要明确的价值证实、需要每一个能力都能对应到用户愿意付费的场景。。。。。
在AI行业的早期阶段,,,,所有大厂都在广撒网,,,,都在实验种种可能的偏向,,,,都可以容忍一部分团队做恒久的、不思量短期回报的研究。。。。。
但当AI进入商业化阶段,,,,当产品要最先收费,,,,公司要最先对股东、投资人和用户认真。。。。。
字节Seed现在面临的,,,,就是这个转折点。。。。。
顾全全的脱离,,,,对双方来说都不是坏事,,,,更像是一次相互玉成。。。。。
对顾全全来说,,,,他在字节Seed三年里已经证实晰自己。。。。。这些履历和声誉,,,,让他的履历越发富厚,,,,可以回到学术界继续深耕AI4S,,,,或者创业,,,,就像林俊旸一样,,,,把手艺理想酿成一个新的故事。。。。。
对字节来说,,,,Seed的组织性子转变已经不可逆转。。。。。Seed 2.0后续迭代并未受影响,,,,豆包还在继续迭代,,,,火山引擎还在上线新能力。。。。。
一个康健的AI生态,,,,原来就需要差别类型的组织。。。。。
顾全全找到了更适合自己的位置,,,,字节Seed也找到了更清晰的偏向。。。。。这是一次双向选择,,,,也是一次双向玉成。。。。。
活动周时代,,,,广东省各地还将开展“粤学粤优”终身学习品牌建设、职业手艺提升培训、数智赋能全民学习、多领域协同砚习等系列活动。。。。。(完)
责任编辑:李俐念 校对:蔡明宏