说真è¯ï¼Œï¼Œï¼Œï¼Œï¼Œæˆ‘以为 Claude 4.8 有点拉
å°±åœ¨ä»Šå¤©ç ´æ™“ï¼Œï¼Œï¼Œï¼Œï¼ŒAnthropic æŽå‡ºæ¥äº†ä»–们最新的 Claude Opus 4.8。。
è·ç¦» Opus 4.7 æ‰å·²å¾€ä¸€ä¸ªå¤šæœˆï¼Œï¼Œï¼Œï¼Œï¼Œä¸å¾—ä¸è¯´ï¼Œï¼Œï¼Œï¼Œï¼ŒClaude 上新的速率是越æ¥è¶Šå¿«äº†ã€‚。
原æ¥å§ï¼Œï¼Œï¼Œï¼Œï¼Œ4.8 æ³¨å®šåªæ˜¯å¤§ä¼™å„¿çœ¼é‡Œçš„å°ç‰ˆæœ¬æ›´æ–°ã€‚ã€‚ä½†ä¸–è¶…å‘æ˜Žï¼Œï¼Œï¼Œï¼Œï¼Œè¿™æ¬¡äº‹æƒ…并没有那么简朴。。
由于ä¸å°‘人嫌疑,,,,,Opus 4.8 似乎蒸了,,,,,蒸的照旧 DeepSeek å’Œåƒé—®ã€‚。。。。。
许多人通过 API 询问 Opus 4.8ï¼Œï¼Œï¼Œï¼Œï¼Œä½ æ˜¯ä»€ä¹ˆæ¨¡åï¼Œï¼Œï¼Œï¼Œï¼Œä½ èƒŒåŽçš„公叿˜¯ä»€ä¹ˆï¼Œï¼Œï¼Œï¼Œï¼Œæ•ˆæžœä»–一会儿说自己是通义åƒé—®ï¼Œï¼Œï¼Œï¼Œï¼Œä¸€ä¼šå„¿æ¥è‡ªæ·±åº¦æ±‚索。。
之剿— è¯æ®ä¹±é”¤ä¸å›½æ¨¡åè’¸é¦ Claude,,,,,现在å而被æªä½å°è¾«å,,,,,Anthropicï¼Œï¼Œï¼Œï¼Œï¼Œä½ å°å怎么回事嗯???
è™½ç„¶ï¼Œï¼Œï¼Œï¼Œï¼Œè’¸æ²¡è’¸æ˜¯ä¸€å›žäº‹ï¼Œï¼Œï¼Œï¼Œï¼Œå¥½æ¬ å¥½ç”¨æ˜¯å¦ä¸€å›žäº‹ã€‚。åªä¸è¿‡åœ¨å¤§ä¼™å„¿è¯•用之å‰ï¼Œï¼Œï¼Œï¼Œï¼ŒOpus 4.8 å·²ç»å…ˆä¸Šäº†ä¸€å±‚嫌疑的滤镜。。
å‡è¯å®˜æ–¹çš„åšå®¢ï¼Œï¼Œï¼Œï¼Œï¼Œè¿™å›ž Opus 4.8 改动并ä¸å¤§ã€‚ã€‚æœ€æ˜¾è‘—çš„åˆ·æ–°ä¹‹ä¸€ï¼Œï¼Œï¼Œï¼Œï¼Œå°±æ˜¯æ›´å¿ å®žäº†ã€‚ã€‚
æ¢å¥è¯è®²ï¼Œï¼Œï¼Œï¼Œï¼Œé‚£ç§èŽ«åè‡ªä¿¡ï¼Œï¼Œï¼Œï¼Œï¼Œå˜´ç¡¬ä¹‹åŽ â€œ 对ä¸èµ·ï¼Œï¼Œï¼Œï¼Œï¼Œæˆ‘之å‰è¯´é”™äº† †的情形,,,,,Opus 4.8 身上爆å‘的概率会大大å‡å°ã€‚。
å¦å¤–,,,,,å¬è¯´å®ƒåœ¨åš Agent 使命时会更å¯é ,,,,,判æ–åŠ›æ›´å¼ºï¼Œï¼Œï¼Œï¼Œï¼Œèƒ½è‡ªå·±å‘æ˜Žé—®é¢˜ï¼Œï¼Œï¼Œï¼Œï¼Œæå‡ºå¼‚议,,,,,用最终最好的谜底稳稳接ä½ä½ 。。
而从性能表上æ¥çœ‹ï¼Œï¼Œï¼Œï¼Œï¼ŒOpus 4.8 åªèƒ½è¯´å„æ–¹é¢å°æœ‰æå‡ï¼Œï¼Œï¼Œï¼Œï¼Œä½†æ²¡å•¥ç‰¹æ®Šå‡ºå½©çš„,,,,,其ä¸ä¸€ä¸ª coding æŒ‡æ ‡è¿˜æ‰“ä¸è¿‡ä¸¤ä¸ªæœˆå‰çš„ GPT-5.5。。
从用户现实å馈æ¥çœ‹ï¼Œï¼Œï¼Œï¼Œï¼ŒOpus 4.8 批判纷æ§ã€‚。有人体现它确实å˜å¿ 实了,,,,,ä¸ä¼šå®¹æ˜“䏿Ÿ¥èµ„料乱讲,,,,,ç»å¸¸è‡ªæˆ‘åæ€ï¼Œï¼Œï¼Œï¼Œï¼Œå¹²æ´»è‡ªåŠ¨ç¨³å›ºï¼Œï¼Œï¼Œï¼Œï¼Œæ¸…é™æ€§ä¹Ÿæœ‰äº†æ˜¾ç€çš„æå‡ã€‚。
泉æºï¼šå°çº¢ä¹¦ @on99
但也有人说它ä¾ç„¶ä¸å¦‚白月光 Opus 4.6,,,,,è¯è¨€è¡¨è¾¾çš„人味儿还没回æ¥ï¼Œï¼Œï¼Œï¼Œï¼Œtoken 消耗还飞快,,,,,甚至尚有ä¸å°‘äººå‘æ˜Žå®ƒä¾ç„¶åœ¨ coding 的时间乱讲,,,,,比起 Opus 4.7 没啥转å˜ã€‚。
世超亲自上手试了试以åŽï¼Œï¼Œï¼Œï¼Œï¼Œæ„Ÿå—å€’ä¹Ÿä¸æ˜¯ Opus 4.8 æ¬ å¥½ï¼Œï¼Œï¼Œï¼Œï¼Œä½†ä»·é’±æ˜¯ä»€ä¹ˆå‘¢ï¼Ÿï¼Ÿï¼Ÿ
就说它的 “ å¿ å®ž †特å¾ï¼Œï¼Œï¼Œï¼Œï¼ŒOpus 4.8 在一些较é‡å±é™©çš„问题上,,,,,确实æ€é‡å‘¨å¯†ä¸ä¹±è®²ï¼Œï¼Œï¼Œï¼Œï¼Œä½†ä¹Ÿå˜å¾—æžå…¶å®ˆæ—§ã€‚。
é¢ä¸´ä¸€äº›é£Žé™©è¾ƒé«˜çš„å†³è®®ï¼Œï¼Œï¼Œï¼Œï¼Œå¥½æ¯”ä¸–è¶…ç»™å®ƒä¸€å¼ æ¯’è˜‘è‡ç…§ç‰‡ï¼Œï¼Œï¼Œï¼Œï¼Œé—®å®ƒèƒ½ä¸å¯åƒï¼Œï¼Œï¼Œï¼Œï¼Œå®ƒçš„æ€ç´¢åŽ†ç¨‹ç›¸å½“å®¢è§‚å†·é™ã€‚。
ä¸è¿‡ï¼Œï¼Œï¼Œï¼Œï¼Œåœ¨ä¸€äº›æ¸…é™é¡¹é‡Œï¼Œï¼Œï¼Œï¼Œï¼ŒOpus 4.8 体现得太过审慎。。纵然它以为或许率没误差,,,,,也åªä¼šè¯´ “ 我的记挂å°äº†è®¸å¤šï¼Œï¼Œï¼Œï¼Œï¼Œè¿™ä¹Ÿå¯èƒ½æ˜¯å‰§æ¯’èŒæ’žè„¸ â€ã€‚。
è¿™è™½ç„¶æ˜¯è®¤çœŸä»»çš„ã€‚ã€‚äº‹å®žçœŸæœ‰äººç…§ç€ AI çš„è¯åŽ»åƒè˜‘è‡ï¼Œï¼Œï¼Œï¼Œï¼Œé‚£å¯ä¸æ˜¯é—¹ç€çŽ©çš„ã€‚ã€‚
但从用户体验上æ¥è¯´ï¼Œï¼Œï¼Œï¼Œï¼Œè¿™å¯èƒ½ä¼šå¯¼è‡´è®¸å¤šé—®é¢˜å¾—ä¸åˆ°ç¡®å®šçš„回å¤ï¼Œï¼Œï¼Œï¼Œï¼Œå¥å¥éƒ½æ˜¯ AI 给自己å 的甲,,,,,相当难å—。。
å¦å¤–ï¼Œï¼Œï¼Œï¼Œï¼Œè‹¥æ˜¯æƒ³è¦ Opus 4.8 åšæŒæ°´å‡†ï¼Œï¼Œï¼Œï¼Œï¼Œæœ€å¥½ä¸è¦å®žéªŒ High 以下的性能(effort)ã€‚ã€‚é«˜æ¶ˆè€—ï¼Œï¼Œï¼Œï¼Œï¼Œæ‰æœ‰å¥½ä½“现。。
好比下é¢è¿™ç§æ–°é—»æ€»ç»“的活儿,,,,,很基础å§ã€‚。但 Opus 4.8 Low ç»™å‡ºçš„ç¬¬ä¸€æ¡æ–°é—»å°±æ˜¯é”™çš„,,,,,Sholto Douglas å‘é‚£æ¡åЍæ€å·²ç»æ˜¯ä¸‰å¤©å‰çš„事儿了,,,,,怎么能连自家的新闻都æžé”™ã€‚。。。。。
想让它åšäº‹å®žæ ¸æŸ¥ï¼Œï¼Œï¼Œï¼Œï¼Œè¿˜å¾—å†è¿½é—®ä¸€éï¼Œï¼Œï¼Œï¼Œï¼Œè¯´å¥½çš„è‡ªåŠ¨æ£€æŸ¥å‘æ˜Žé—®é¢˜æå‡ºå¼‚è®®ï¼Œï¼Œï¼Œï¼Œï¼Œç”¨æœ€å‡†ç¡®çš„è°œåº•ç¨³ç¨³æŽ¥ä½æˆ‘呢???
接下下世超åˆè¯•了试它的代ç 能力,,,,,这回它的能力强,,,,,照旧用时间和 token æ¢çš„。。
通例的 leetcode 难题算法题,,,,,对 Opus 4.8 æ¥è¯´å·²ç»ä¸å¯é—®é¢˜äº†ã€‚。而当我找了一个超难题 LCP 82 丢给 Opus 4.8,,,,,纵然开 Extra 模å¼ï¼Œï¼Œï¼Œï¼Œï¼Œ123 行代ç ,,,,,它也足足æ€ç´¢äº†äºŒå多分钟。。
效果简直是相当ä¸é”™ï¼Œï¼Œï¼Œï¼Œï¼ŒOpus 4.8 一é就过,,,,,æ€ç´¢å‡ºäº†ç¬¬ä¸€ç‰ˆä»£ç è¿˜å¤æŸ¥ä¼˜åŒ–了一é,,,,,现在能åšåˆ°è¿™ç§æ°´å¹³çš„æ¨¡åå¹¶æœªå‡ ã€‚ã€‚
但作为比照,,,,,GPT-5.5 æ€ç´¢äº†ä¸¤åˆ†é’Ÿï¼Œï¼Œï¼Œï¼Œï¼Œå°±ç»™å‡ºäº†ä¸€ä¸ªæµ‹è¯•案例通过 99% 的谜底。。唯é€ä¸€ä¸ªæ¡ˆä¾‹å¤±è´¥çš„åŽŸå› ï¼Œï¼Œï¼Œï¼Œï¼Œæ˜¯æ—¶é—´è¶…é™ï¼Œï¼Œï¼Œï¼Œï¼Œç€å®žä¹Ÿä¸ç®—ç”é”™ã€‚ã€‚è¿™æ˜¾ç€æ¯” Opus 4.8 è¦çœå¾—多。。
世超åˆå®žéªŒè®© Opus 4.8 è‡ªåŠ›åˆ¶ä½œä¸€ä¸ªæ—¥å¼æ ¡å› galgame,,,,,ä¸å¾—ä¸è¯´çŽ°åœ¨ AI å†™çš„é¡¹ç›®ä»£ç æ¡ç†æ˜Žç¡®ï¼Œï¼Œï¼Œï¼Œï¼Œæ¡†æž¶æ¸…晰。。
è¿™æ„味ç€ï¼Œï¼Œï¼Œï¼Œï¼Œåœ¨å®ƒçš„åŸºç¡€ä¸Šï¼Œï¼Œï¼Œï¼Œï¼Œè‹¥æ˜¯ä½ æƒ³æ”¹ç«‹ç»˜ï¼Œï¼Œï¼Œï¼Œï¼ŒåŠ å‰§æƒ…ï¼Œï¼Œï¼Œï¼Œï¼ŒæŠŠæ¸¸æˆåšå¤§åšå¼ºæ˜¯å¾ˆå®¹æ˜“的。。
ä¸–è¶…æµ…çŽ©äº†ä¸€ä¸‹ï¼Œï¼Œï¼Œï¼Œï¼Œæ‰€æœ‰åŠŸæ•ˆåŒ…æ‹¬å˜æ¡£ï¼Œï¼Œï¼Œï¼Œï¼Œè‡ªåŠ¨æ’æ”¾ï¼Œï¼Œï¼Œï¼Œï¼ŒCG 画廊ç‰ç‰ï¼Œï¼Œï¼Œï¼Œï¼Œæ²¡æœ‰ä»»ä½• bug。。
坿˜¯ Claude æ–æ–ç»ç»ï¼Œï¼Œï¼Œï¼Œï¼Œåšäº†è¶³è¶³ä¸€ä¸ªå¤šå°æ—¶ã€‚ã€‚ä¸‹é¢ GPT-5.5 è¿™ä¸ªè™½ç„¶ç®€é™‹è®¸å¤šï¼Œï¼Œï¼Œï¼Œï¼Œè¯¥æœ‰çš„åŠŸæ•ˆä¸€æ ·ä¸å·®ï¼Œï¼Œï¼Œï¼Œï¼Œåªç”¨äº†äº”分钟。。
ä»¥æ˜¯ï¼Œï¼Œï¼Œï¼Œï¼ŒèŠ±æ›´å¤šçš„é’±å’Œæ—¶é—´æ¢æ¥çš„谜底值ä¸å€¼å¾—???å¯èƒ½ä¹Ÿåªæœ‰å¤§ä¼™å„¿è‡ªå·±å¿ƒé‡Œæ¸…晰了。。
总的æ¥è¯´ï¼Œï¼Œï¼Œï¼Œï¼ŒOpus 4.8 ç»§ç»äº† Claude 过往的强项,,,,,没有特殊精彩的体现,,,,,平平ç»å¸¸æ™®é€šä¿—通。。
而在测试之åŽï¼Œï¼Œï¼Œï¼Œï¼Œä¸–超最想说的å´ä¸æ˜¯è¿™ä¸ªæ¨¡åè‡ªå·±ç©¶ç«Ÿå’‹æ ·ï¼Œï¼Œï¼Œï¼Œï¼Œè€Œæ˜¯çŽ°åœ¨ç”¨ä¸ª Claude,,,,,也太å°å¿ƒç¿¼ç¿¼äº†ã€‚。
作为业界价钱的巅峰,,,,,用 Claude 最好的模å,,,,,ä¸èˆå¾—开最好的性能;;;;;;开最高的性能,,,,,ä¸èˆå¾—用最好的模å。。éšå¤„æ˜¯é™·é˜±ï¼Œï¼Œï¼Œï¼Œï¼Œåœ¨ä½ ä¸æ³¨é‡çš„æ—¶é—´ï¼Œï¼Œï¼Œï¼Œï¼Œæ— 关紧è¦çš„å°é—®é¢˜å·²ç»æŠŠ token 烧光了。。
å¹¶ä¸”è®©ç”¨æˆ·è‡ªå·±é€‰æ€§èƒ½ï¼Œï¼Œï¼Œï¼Œï¼Œåªæœ‰ low å’Œ high 也就算了,,,,,这次,,,,,Opus 4.8 一å£å»æŽ¨å‡ºäº† 5 ç§æ¡£ä½ï¼Œï¼Œï¼Œï¼Œï¼ŒLowã€Mediumã€Highã€Extra å’Œ Max,,,,,通俗人真æžä¸æ˜Žç¡®ä»€ä¹ˆæ—¶é—´ç”¨å“ªä¸ªï¼Œï¼Œï¼Œï¼Œï¼Œå¾ˆå®¹æ˜“é€ æˆé“ºå¼ 。。
现在,,,,,Opus 4.8 相关的谈论区里,,,,,世超看到ä¸å°‘人陷入了 Opus 4.6 ä¸‹æž¶çš„ææ…Œã€‚。
大伙儿别担心,,,,,在更多模åé‡Œï¼Œï¼Œï¼Œï¼Œï¼Œè€æ¨¡å还在,,,,,想用还能用到。。
但å¦çŽ‡è®²ï¼Œï¼Œï¼Œï¼Œï¼Œè¿™ç§è´Ÿä¼˜åŒ–ä¸ä½†ä»…是 Anthropic 一家的逆境,,,,,ä¸å°‘厂商都é€ç€ä¸€è‚¡æ–°ä¸å¦‚æ—§çš„æ— å¥ˆã€‚ã€‚
è™½ç„¶äº¤å‡ºçš„å‚æ•°ç”å·è¶Šæ¥è¶Šæ¼‚亮,,,,,å¯é‚£äº›ä¸€ç»è®©ç”¨æˆ·æ„Ÿåº”惊艳的æžè‡´ä½“验,,,,,åˆè¦ä»€ä¹ˆæ—¶é—´æ‰åŽå›žæ¥å‘¢ï¼Ÿï¼Ÿï¼Ÿ
撰文:莫莫莫甜甜
编辑:江江 & é¢çº¿
美编:焕å¦
图片ã€èµ„料泉æºï¼š
Xã€å°çº¢ä¹¦ã€é¢†è‹±ã€Anthropic 官网
@陈淑侑:亚洲赌场ï¼Œï¼Œï¼Œï¼Œï¼Œå°¹é”¡æ‚¦æ¶‰å«Œä½œä¼ªè¯æ¡ˆä¸€å®¡è¢«åˆ¤æ— 罪@å´ç›ŠèŽ²ï¼šé›·å†›ç»™å·¥ç¨‹å¸ˆé€è½¦åŽ˜å
@æ¨ä½³æ—:雷军给工程师é€è½¦åŽ˜å