凯时AG

泉æºï¼šé«˜è€ƒç«£äº‹åº”让孩å­çœ‹åˆ°ç”Ÿæ¶¯çš„原æ¥é¢ç›®ä½œè€…: 詹瑜月:

大模å­ç¦»åˆ«åšé¢˜å®¶æ—¶ä»£

æ–‡ | 浪潮ä¸ç™«

æ¢æ–‡é”‹æ˜¯ä¸ªå¾ˆæœ‰æ„æ€çš„人。。。。。他ä¸çƒ­è¡·èžèµ„ã€ä¸æžå›¢å»ºã€ä¸ç¤¾äº¤,,,,,公å¸ä¸åˆ°200人,,,,,下昼六七点下ç­,,,,,在中国科技圈简直是一股清æµã€‚。。。。

昨天看了晚点的稿å­,,,,,写DeepSeek在V4宣布å‰å¤•的状æ€,,,,,有许多让浪哥å°è±¡æ·±åˆ»ã€ä¸”æ·±æœ‰åŒæ„Ÿçš„细节。。。。。

好比,,,,,deepseekä¸åŠ ç­,,,,ï¼Œç”±äºŽæ¢æ–‡é”‹ä»¥ä¸º,,,,,一个人天天能高质é‡è¾“出的时间,,,,,很难凌驾 6~8 å°æ—¶,,,,,加ç­ç–²åŠ³ä¼šè®©åˆ¤æ–­åŠ›ä¸‹é™,,,,,å而铺张算力资æºï¼›;; ï¼›å†å¥½æ¯”,,,,ï¼Œæ¢æ–‡å³°åœ¨äº‹æƒ…中åªåšå°‘数事情,,,,,但è¦åšå¾—详尽ã€åšåˆ°æžè‡´ã€‚。。。。

ä¾ç„¶è®©äººå¿ƒç”Ÿé’¦ä½©ã€‚。。。。

但看稿å­ä¹Ÿèƒ½æ„Ÿå—到,,,,,deepseek现在到了一个玄妙的转折点了:焦点研究员陆续出走,,,,,期æƒä»·å€¼ä¸æ˜Ž,,,,,Agentåå‘的产å“å¸ç†åˆšæœ€å…ˆæ‹›,,,,,编程工具还没影。。。。。

这家一ç»é æžè‡´æ•ˆçŽ‡å’Œå¼€æºç¢¾åŽ‹å…¨åœºçš„å…¬å¸å‘明,,,,,仅仅专注æå‡å¤§è¯­è¨€æ¨¡å­çš„æ™ºèƒ½ä¸Šé™,,,,,已ç»ä¸æ•·äº†ã€‚。。。。

è¿™ä¸æ€ªdeepseek,,,,,而是行业已ç»è½¬å‘。。。。。

已往两年,,,,,大模å­é¢†åŸŸçš„åšäº‹é€»è¾‘特殊åƒé«˜è€ƒ,,,,,跑分就是分数线,,,,,Benchmark就是科场,,,,,è°çš„分数高è°å°±æ˜¯çŠ¶å…ƒã€‚ã€‚。。。

但现在,,,,,OpenAI在æžAgent,,,,,Anthropic在æžClaude Code,,,,,Google在æžå¤šæ¨¡æ€,,,,ï¼Œæ‰€æœ‰å¤´éƒ¨çŽ©å®¶éƒ½åœ¨å›žè¦†ç»Ÿä¸€ä¸ªé—®é¢˜ï¼šæ¨¡å­æ€Žä¹ˆçœŸæ­£å¸®äººæŠŠæ´»å¹²å®Œ??

这就åƒä¸€ä¸ªé«˜è€ƒçŠ¶å…ƒå‘æ˜Ž,,,,,用人å•ä½çš„é¢è¯•官翻了翻你的效果å•,,,,,点颔首说"ä¸é”™",,,,,然åŽé—®ä½ ï¼šâ€œèƒ½ä¸å¯è‡ªåŠ›å®Œæˆä¸€ä¸ªé¡¹ç›®??能ä¸å¯åšå¥½å›¢é˜Ÿå作??é‡åˆ°æ²¡è§è¿‡çš„问题你怎么办??â€

大模å­ç¦»åˆ«åšé¢˜å®¶æ—¶ä»£äº†ã€‚。。。。

èŒåœºçš„è¦æ±‚纷歧样了

è¦æ˜Žç¡®æ–°çš„竞争究竟比什么,,,,,有一个现æˆçš„鲜活案例。。。。。

3月31æ—¥,,,,,Anthropic的明星产å“Claude Code,,,,ï¼Œé—¹å‡ºäº†ä»£ç æ³„露的大乌龙,,,,,酿æˆäº†çœŸæ­£opençš„AI了。。。。。

åƒç“œç¾¤ä¼—扒完代ç ä¹‹åŽ,,,,ï¼Œå‘æ˜ŽClaude比å„人想象的还更厉害,,,,ï¼Œä¸“ä¸šå‰–æžæœ‰è®¸å¤š,,,,,就ä¸ç»†è¯´äº†,,,,,划é‡ç‚¹å°±æ˜¯ä¸€å¥è¯ï¼šClaude真正的竞争力,,,,ï¼Œè¿œä¸æ­¢æ¨¡å­è‡ªå·±ã€‚。。。。

模å­è™½ç„¶ç…§æ—§ç„¦ç‚¹,,,,,没有Claude强盛的推ç†èƒ½åŠ›,,,,,什么系统都白æ­ã€‚。。。。但光有模å­,,,,,就åƒå…‰æœ‰ä¸€ä¸ªæ™ºå•†160的天æ‰,,,,,你把他丢到一个生ç–的工地上,,,,ï¼Œæ²¡æœ‰å›¾çº¸ã€æ²¡æœ‰å·¥å…·ã€æ²¡æœ‰æ¸…é™è§„范,,,,,他照样干ä¸å¯æ´»ã€‚。。。。

Claude Codeé‚£51万行代ç å¹²çš„事情,,,,,就是给这个åšé¢˜å®¶è®¾ç½®ä¸Šæ‰“工人需è¦çš„能力。。。。。简朴看几个例å­å°±æ˜Žç¡®â€”—

çœé’±çš„能力。。。ã€‚ã€‚æ¯æ¬¡æŒªç”¨API都是真金白银,,,,,Claude Code把System Prompt切æˆâ€œç¨³å›ºçš„部分â€å’Œâ€œç»å¸¸å˜çš„部分â€,,,,,稳固的部分缓存起æ¥é‡å¤ç”¨,,,,,å˜çš„部分æ‰é‡æ–°å¤©ç”Ÿã€‚。。。。这个Benchmarkä¸ä¼šè€ƒ,,,,ï¼Œä½†é™æœ¬æœ‰å¤šä¸»è¦,,,,,打工人都知é“。。。。。

知é“什么时间该问人的能力。。。。。Claude Codeæžäº†ä¸€å¥—å››å±‚é€’è¿›çš„æ¸…é™æœºåˆ¶â€”—设置白åå•ã€å·¥å…·è‡ªæ£€ã€ä¸€ä¸ªä¸“门判断“这æ¡ä¸‹ä»¤å±ä¸å±é™©â€çš„å°æ¨¡å­ã€æœ€åŽæ‰æ˜¯å¼¹çª—问用户。。。。。这就åƒä¸€ä¸ªé è°±çš„æ–°å‘˜å·¥,,,,,拿ç¦ç»çš„事ä¸ä¼šé—·å¤´å¹²,,,,,但也ä¸ä¼šäº‹äº‹éƒ½å޻问å‘导,,,,,ç»å¤§å¤§éƒ½æƒ…形自己就处ç†äº†ã€‚。。。。这个Benchmark虽然也ä¸ä¼šè€ƒ,,,,ï¼Œä½†å®ƒç›´æŽ¥å†³è®®äº†ç”¨æˆ·æ•¢ä¸æ•¢æŠŠçœŸå®žçš„代ç å®¢æ ˆäº¤ç»™AI。。。。。

记性好的能力。。。。。对è¯ä¸€é•¿,,,,,模å­å°±ä¼šâ€œå¿˜äº‹â€ã€‚。。。。Claude Codeçš„æ–¹æ¡ˆä¸æ˜¯ç¡¬å¡žä¸€ä¸ªå‘釿•°æ®åº“,,,,,而是把对è¯åކå²åŽ‹ç¼©æˆä¸€ä»½ç»“构化的摘è¦â€”—目的是什么ã€åšäº†å“ªäº›å†³è®®ã€ä»£ç æ”¹äº†é‚£é‡Œâ€”—ä¿å­˜å¤–地文件里。。。。。简朴,,,,,但有用。。。ã€‚ã€‚å°±åƒæ¯ä¸ªäººå¤©å¤©éƒ½å†™äº‹æƒ…文档,,,,,第二天å„人翻一翻就能接ç€å¹²ã€‚。。。。

è¿™äº›å·¥å…·æ²¡æœ‰ä¸€é¡¹æ˜¯â€œæ¨¡å­æ›´æ™ºæ…§ã€è€ƒåˆ†æ›´å¥½â€å°±èƒ½è§£å†³çš„,,,,,它们解决的是å¦ä¸€ä¸ªå±‚é¢çš„问题:怎么让一个智慧的模å­åœ¨çœŸå®žå¤©ä¸‹é‡Œç¨³å›ºã€é«˜æ•ˆã€æ¸…é™ã€å¯ä¸€è¿žåœ°å¹²æ´»ã€‚。。。。

这也æ„味ç€,,,,,大模å­åŒç šèµ°å‡ºå­¦æ ¡ã€è¿›å…¥èŒåœº,,,,ï¼Œåˆ«äººå¯¹ä½ çš„è¦æ±‚å°±å˜äº†ã€‚。。。。

好马也è¦é…好éž

ç§‘æŠ€åœˆå‘æ¥å–„äºŽå‘æ˜Žç§ç§é»‘è¯,,,,,这么大的转折点,,,,,黑è¯è‚¯å®šå°‘ä¸äº†ã€‚。。。。

最新很ç«çš„一个,,,,,就是跟这有关的,,,,,å«Harness Engineering。。。。。

Harness这个è¯,,,,ï¼ŒåŽŸæ¥æ˜¯é©¬å…·çš„æ„æ€â€”—套在马身上,,,,ï¼Œä¸æ˜¯ä¸ºäº†çº¦æŸå®ƒ,,,,,而是为了让马的实力凭è¯ä½ è¦çš„åå‘释放出æ¥ã€‚。。。。

用在AI这儿,,,,ï¼Œæ„æ€å°±æ˜¯ï¼šæ¨¡å­æ˜¯é‚£åŒ¹é©¬,,,,,Harness是那套缰绳ã€é©¬éžå’Œåå‘盘。。。。。

这个看法怎么出圈,,,,,浪哥特æ„去考å¤ä¸€ä¸‹,,,,ï¼Œå‘æ˜Žæœ‰ä¸¤ä¸ªè¦å®³èŠ‚ç‚¹ã€‚ã€‚。。。

第一个是2026å¹´2月5æ—¥,,,,,在工程界的江湖èŒä½å¾ˆé«˜çš„一ä½è€å…„,,,,,Terraform的作者Mitchell Hashimoto,,,,,写了篇文章讲自己从拒ç»åˆ°æ‹¥æŠ±AI的心路历程,,,,,其中æäº†ä¸€æ¡ç„¦ç‚¹åŽŸåˆ™ï¼š

ä»»ä½•æ—¶é—´ä½ å‘æ˜ŽAgent犯了错,,,,,就花时间设计一个方案,,,,,确ä¿å®ƒæ°¸è¿œä¸å†çŠ¯åŒæ ·çš„错。。。。。

å¬ç€åƒç©ºè¯å¯¹å§??但你仔细å“å“,,,,,它的潜å°è¯æ˜¯ï¼šç«žäº‰åŠ›ä¸åœ¨æ¨¡å­é‡Œ,,,,ï¼Œåœ¨ä½ æ€Žä¹ˆé©¯æœæ¨¡å­çš„那套系统里。。。。。 模å­ä¼šçН错,,,,,这是天性;;; ;但你的系统能ä¸å¯æŠŠæ¯ä¸€æ¬¡çŠ¯é”™é…¿æˆæ°¸ä¸–性的刷新,,,,,这是手艺。。。。。

第二个è¦å®³èŠ‚ç‚¹æ›´æ—©ä¸€äº›ã€‚ã€‚。。。1月5æ—¥,,,,,Google DeepMind的工程师Philipp Schmidå‘了一篇åšå®¢,,,,,甩出一å¥å¼•起行业大讨论的è¯ï¼š

“The Harness is the Dataset.(Harness自己就是数æ®é›†ï¼‰â€

è¿™è¯çš„æ€ä¼¤åŠ›åœ¨å“ª??

说白了就是:好的Harness能纪录下模å­åœ¨çœŸå®žä½¿å‘½ä¸­çš„完整轨迹——它看到了什么信æ¯ã€åšäº†ä»€ä¹ˆåˆ¤æ–­ã€åœ¨å“ªä¸€æ­¥ç¿»äº†è½¦ã€æœ€åŽæ€Žä¹ˆä¿®ç¦çš„。。。。。这些轨迹,,,,,å过æ¥å°±æ˜¯è®­ç»ƒä¸‹ä¸€ä»£æ¨¡å­æœ€æœ‰ä»·å€¼çš„燃料。。。。。

也就是说,,,,,è°å…ˆæŠŠHarness跑通,,,,,è°å°±çŽ‡å…ˆå¯åŠ¨äº†ä¸€ä¸ªæ•°æ®é£žè½®â€”—系统越好,,,,,数æ®è¶Šå¥½,,,,,模å­è¶Šå¥½,,,,ï¼Œç³»ç»Ÿåˆæ›´å¥½ã€‚。。。。

大模å­å’Œå®ƒå‘¨å›´çš„驾驭系统,,,,,ä¸å†æ˜¯ä¸¤ä»¶äº‹,,,,,而是一个共生体。。。。。

接待æ¥åˆ°çœŸå®žçš„天下

所谓AI一日,,,,,人世一年。。。。。;; W房创竽W佣潭陶饧改,,,,,ç€å®žèµ°è¿‡äº†ä¸‰ä¸ªé˜¶æ®µï¼š

2022到2024å¹´,,,,,å„人ç¢ç£¨çš„æ˜¯æ€Žä¹ˆé—®â€”—Prompt Engineering,,,,,写好æé†’è¯,,,,,把模å­çš„能力哄出æ¥ã€‚。。。。

2025å¹´,,,,,进化到给什么上下文——Context Engineering,,,,,把对的信æ¯åœ¨å¯¹çš„æ—¶é—´å¡žç»™æ¨¡å­ã€‚。。。。

到了2026å¹´,,,,,竞争å‡çº§åˆ°æ€Žä¹ˆæ­æ•´å¥—系统——Harness Engineering,,,,,从工具挪用ã€å½±è±¡æ²»ç†ã€æœ¬é’±æŽ§åˆ¶åˆ°æ¸…é™é˜²æŠ¤,,,,,通盘æ€é‡ã€‚。。。。

竞争颗粒度在一步步å˜å¤§ï¼šä»Žä¸€å¥è¯,,,,,到一段信æ¯,,,,,到一整套系统。。。。。

è¿™è¶‹åŠ¿å·²ç»æ˜¯å…±è¯†äº†ã€‚。。。。

几个月å‰,,,,,MiniMax首创人闫俊æ°åœ¨ç½—永浩的播客访谈里,,,,,é‡å¤è®²ä¸€ä¸ªåˆ¤æ–­ï¼šæ¨¡å­èƒ½åŠ›æ­£åœ¨è¶‹åŒã€‚。。。。中国公å¸ç”¨ç¾Žå›½1/50的资æº,,,,,就能åšåˆ°95%的性能。。。。。5%的差别虽然ä¿å­˜,,,,,但它已ç»ä¸æ˜¯å†³è®®è¾“赢的å˜é‡äº†ã€‚。。。。

这几天,,,,,MiniMax交出上市åŽçš„首份财报,,,,,闫俊æ°ç»™äº†å‡ ä¸ªæ–°çš„判断F驵程领域会最先泛起L4–L5级别的智能,,,,,从“工具â€èµ°å‘“åŒäº‹çº§â€å作;;; ;办公领域接下æ¥ä¸€å¹´,,,,,会å¤åˆ»åŽ»å¹´ç¼–ç¨‹é¢†åŸŸçš„å‰è¿›é€ŸçŽ‡ï¼›;; ;多模特会走å‘“直出å¯äº¤ä»˜â€çš„中长内容,,,,,甚至泛起é è¿‘实时输出的形æ€ã€‚。。。。

æ¯ä¸€ä¸ªéƒ½æŒ‡å‘更系统的能力,,,,ï¼Œæ›´å‘¨å…¨çš„è¦æ±‚,,,,,更å¯é çš„æ‰§è¡Œ,,,,,而ä¸å†æ˜¯ç®€æœ´çš„æ¨¡å­å‚数和跑分。。。。。

回到deepseek。。。。。

晚点稿å­é‡Œ,,,,,有一段è¯ç‰¹æ®Šä¸»è¦ï¼šå³å°†å®£å¸ƒçš„ V4,,,,ï¼Œæˆ–è®¸çŽ‡ä»æ˜¯å¼€æºæœ€å¼ºæ¨¡å­,,,,,但很难是碾压级的强。。。。。由于现在差别场景的差别开å‘者和用户对 “强†的标准和体感已越æ¥è¶Šå¤šå…ƒã€‚。。。。

有个很好的å‚照例å­,,,,,就是跟V4åŒæ ·é¢„计在4月宣布的腾讯混元新模å­ã€‚。。。。凭è¯ä»¥å¾€çš„剧本,,,,,这åˆè¯¥æ˜¯ä¸€è½®â€œè°çš„分数高â€çš„跑分大战,,,,,混元的分数,,,,,预计也会被deepseekæ‘地上摩擦。。。。。

æœ‰æ„æ€çš„æ˜¯,,,,,在离别åšé¢˜å®¶çš„æ–°è¯­å¢ƒä¸‹,,,,,混元的压力å而没那么大了,,,,,由于比的ä¸å†æ˜¯ä¸¤å¼ è€ƒå·çš„分数,,,,,而是两套系统在真实场景里,,,,ï¼Œè°æ›´èƒ½æŠŠæ´»å¹²å®Œã€‚。。ã€‚ã€‚ä¹‹å‰æ™šç‚¹è¯´,,,,,姚顺雨上任åŽ,,,,ï¼Œæ˜Žç¡®è¦æ±‚混元团队“ä¸ä»¥æ‰“榜为导å‘â€â€”—也是æ„è¯†åˆ°è€ƒè¯•åˆ†æ•°å·²ç»æ²¡é‚£ä¹ˆä¸»è¦çš„,,,,,更主è¦çš„æ˜¯,,,,,åšä¸€ä¸ªæ›´é€‚é…腾讯的大模å­ã€‚。。。。

但对deepseekæ¥è¯´,,,,,这也æ„味ç€ä¸€ä¸ªå­¦éœ¸,,,,,ä¸å¯å†ç»§ç»­å‘†åœ¨è±¡ç‰™å¡”里笃志研究了,,,,,你得走到更大的系统里,,,,,去顺应新的游æˆè§„则了——

你智慧虽然好,,,,,但能ä¸å¯ç”¨å¥½å·¥å…·ã€èƒ½ä¸å¯è·ŸåŒäº‹åšå¥½å作ã€èƒ½ä¸å¯åœ¨é‡å¤§ç³»ç»Ÿé‡Œæ‰¾åˆ°è‡ªå·±çš„ä½ç½®ã€çŠ¯äº†é”™èƒ½ä¸å¯è‡ªæˆ‘修正……这些在科场里基础ä¸è€ƒçš„工具,,,,,åè€Œå†³è®®äº†ä½ èƒ½å¦æˆäº‹,,,,,èŒä¸šç”Ÿæ¶¯èƒ½å¦èµ°å¾—更远。。。。。

接待æ¥åˆ°è¿™ä¸ªçœŸå®žçš„天下,,,,,deepseekåŒç š,,,,,ç¥ä½ å¥½è¿ã€‚。。。。

@郑åè£ï¼š新2网址足球网,,,,,疯狗进æ‘咬伤3人 社区回应
@郭贤é’ï¼šä¸“å®¶ï¼šæ—¥æœ¬é¢„æ¼”å°æ¹¾æœ‰äº‹æ¸…空战场
@åˆ˜å½¦è‡»ï¼šé’æµ·çŽ‰æ ‘å·žçŽ‰æ ‘å¸‚çˆ†å‘4.0级地动

热门排行

ã€ç½‘站地图】