OpenAI官宣退役o3与GPT-4.5ï¼
新智元报é“
ã€æ–°æ™ºå…ƒå¯¼è¯»ã€‘o3被å°ã€ŒGOATã€ã€GPT-4.5被å«ã€Œçµé‚写手ã€ï¼Œï¼ŒOpenAI说退就退。。。。。GPT-5.6已在çƒèº«â€”—但「更强ã€èƒ½ä¸å¯ä¿¡ï¼Ÿï¼Ÿï¼Ÿï¼Ÿï¼Ÿï¼ŸOpenAI自己说:未必。。。。。
OpenAIåˆå¹²äº†ä»¶è®©è€ç”¨æˆ·å¿ƒç¢Žçš„事。。。。。
28å·ï¼Œï¼Œä»–们在官方Release Notes上宣布:从2026å¹´8月26日起,,o3从ChatGPTæ£å¼é€€å½¹ï¼
GPT-4.5æ›´ç‹ ï¼Œï¼Œ6月27日就下线,,åªç»™30天缓冲。。。。。
两个模å现在仅é™ä»˜ç”¨åº¦æˆ·åœ¨è®¾ç½®é‡Œæ‰‹åŠ¨åˆ‡æ¢æ‰åŽç”¨åˆ°â€”â€”å®ƒä»¬æ—©å°±ä¸æ˜¯é»˜è®¤é€‰é¡¹äº†ï¼Œï¼Œè¿™æ¬¡æ˜¯è¦å½»åº•从èœå•上抹掉。。。。。
与æ¤åŒæ—¶ï¼Œï¼Œç€ååšä¸»Leo 5月29æ—¥å‘帖确认:GPT-5.6的开å‘全力推进ä¸ï¼Œï¼Œä¸€ä¸ªæ˜¾ç€æ›´å¼ºçš„æ–°æ£€æŸ¥ç‚¹å·²åœ¨å†…部上线。。。。。
一边是用户还没æ¥å¾—åŠè¯´å†è§ï¼Œï¼Œä¸€è¾¹æ˜¯æ–°æ¨¡åå·²ç»åœ¨åŽå°çƒèº«ã€‚。。。。
最åŽä¸¤ä¸ªå¥½ç”¨çš„æ¨¡åï¼Œï¼Œè¦æ²¡äº†
è¿™è¯ä¸æ˜¯æˆ‘说的。。。。。
Redditçƒå¸–下é¢å‡ 百æ¡è°ˆè®ºï¼Œï¼Œä»˜ç”¨åº¦æˆ·ä»¬åœ¨ChatGPTè®¾ç½®é‡Œç–¯ç‹‚æˆªå›¾ç•™å¿µï¼Œï¼Œæ°”æ°›åƒæ˜¯èµ¶åœ¨æ‹†è¿å‰æœ€åŽä¸€æ¬¡ç…§ç›¸ã€‚。。。。
æœ‰ç½‘å‹æ¼æ€’地体现,,OpenAIè¿™ç§æ“作「给了我作废Pro账户的最åŽä¸€ä¸ªç†ç”±ã€‚。。。。ã€
尚有用户表达了对o3写作气概的贪æ‹ä¸Žä¸èˆã€‚。。。。
o3是OpenAIçš„ã€Œçº¯è¡€æŽ¨ç†æ¨¡åã€ï¼Œï¼Œ2025å¹´4月上线,,专门给那些需è¦ä¸€æ¥æ¥æƒ³ã€ä¸€å±‚å±‚å‰¥çš„ç¡¬æ ¸ä½¿å‘½è®¾è®¡çš„ã€‚ã€‚ã€‚ã€‚ã€‚
æ•°å¦è¯å®žã€ç§‘妿ލ坼ã€ä»£ç debug……在这些需è¦ã€Œæ…¢æ€ç´¢ã€çš„场景里,,o3é™©äº›æ˜¯æ— æ•Œçš„ä¿å˜ã€‚。。。。
X上有用户直接å°å®ƒä¸ºã€ŒGOATã€ï¼ˆGreatest Of All Time,,å²ä¸Šæœ€å¼ºï¼‰ã€‚。。。。
尚有人说得更直白:「o3是最åŽä¸€ä¸ªçœŸæ£åœ¨ã€Žæƒ³é—®é¢˜ã€çš„æ¨¡å,,5系列更智慧,,但少了那股å轴劲儿。。。。。ã€
o3-pro更是Pro用户的心头好——花更多时间æ€ç´¢ï¼Œï¼Œç»™å‡ºæ›´å¯é 的谜底,,在数å¦ã€ç§‘å¦ã€ç¼–程三大领域碾压å¼é¢†å…ˆï¼Œï¼Œå¦æœ¯è¯„ä¼°é‡Œçš„æ•ˆæžœå•æ¼‚亮得åƒå¦éœ¸çš„æœŸæœ«è€ƒã€‚。。。。
å†è¯´GPT-4.5。。。。。
若是说o3是ç†å·¥ç§‘å¦éœ¸ï¼Œï¼ŒGPT-4.5就是文科天æ‰ã€‚。。。。
这是许多用户心ä¸ã€Œå†™ä½œæœ€è‡ªç„¶ã€çš„æ¨¡åï¼Œï¼Œæ–‡å—æœ‰æ¸©åº¦ã€æœ‰èЂ奿„Ÿã€æœ‰çµé‚。。。。。
X用户Striver的评价被普é转å‘:直到今天,,4.5ä»ç„¶æ˜¯æœ€å¥½çš„写作模å。。。。。o3æ˜¯çº¯ç²¹çš„åŽŸç”ŸæŽ¨ç†æ¨¡å。。。。。5系列至今都没能匹é…这两个模åä¸€ç»æ‹¥æœ‰çš„工具。。。。。
这就是为什么退役新闻一出,,谈论区炸了。。。。。
䏿˜¯æ¼æ€’,,是ä¸èˆã€‚。。。。
用户纪念的ä¸ä½†æ˜¯åŠŸæ•ˆï¼Œï¼Œè€Œæ˜¯ä¸€ç§ã€Œç›¸å¤„的感å—ã€â€”—就åƒä½ ä¹ æƒ¯äº†ä¸€ä¸ªåŒäº‹çš„åšäº‹æ°”概,,çªç„¶è¢«è§å‘Šä»–è¦èµ°äº†ï¼Œï¼Œæ›¿æ¢è€…能力å¯èƒ½æ›´å¼ºï¼Œï¼Œä½†è°äººé»˜å¥‘没了。。。。。
退的是èœå•ï¼Œï¼Œä¸æ˜¯èƒ½åŠ›
这里有个值得细å“的细节:退役仅é™ChatGPT的网页和App端,,API完全ä¸å—å½±å“。。。。。
è¿™æ„味ç€å¼€å‘者ä¾ç„¶å¯ä»¥é€šè¿‡API挪用o3å’ŒGPT-4.5,,ä¼ä¸šåº”用ä¸ä¼šæ–。。。。。
这里的逻辑很清晰:ChatGPT的界é¢å°±é‚£ä¹ˆå¤§ï¼Œï¼Œæ¨¡å列表ä¸å¯æ— é™è†¨èƒ€ã€‚。。。。留ç€ä¸€å †ä½¿ç”¨çއæžä½Žçš„æ—§æ¨¡å,,既å 资æºï¼Œï¼Œåˆç–散用户注é‡åŠ›ã€‚ã€‚ã€‚ã€‚ã€‚
还记得GPT-4o退役时的数æ®å—??????其时日å‡åªæœ‰0.1%的用户还在选它。。。。。
o3å’ŒGPT-4.5的使用率或许率更低——它们早就被è—进了「显示更多模åã€çš„æŠ˜å èœå•里了。。。。。
GPT-5.6:æ¢é˜²å·²ç»åœ¨è·¯ä¸Š
OpenAI为什么敢这么干??????由于替æ¢è€…ä¸ä½†å·²ç»å°±ä½ï¼Œï¼Œå¹¶ä¸”看上去还更强。。。。。
GPT-5.5在4月23日上线,,是OpenAI现在最强的果真旗舰。。。。。GPT-5.5 Instant在5月5日跟进,,æˆä¸ºChatGPT新默认模å。。。。。
但更值得关注的是GPT-5.6。。。。。
æ³„éœ²ä¿¡æ¯æ˜¾ç¤ºï¼Œï¼ŒGPT-5.6将接纳「åŒç‰ˆæœ¬ã€æˆ˜ç•¥ï¼šæ ‡å‡†ç‰ˆä¸»æ”»å¤šæ¥æŽ¨ç†èƒ½åŠ›çš„é£žè·ƒï¼Œï¼ŒPro版则定ä½ä¸ºæ›´å¼ºçš„æ·±åº¦æ€ç´¢æ¨¡å。。。。。
æœ‰ç ”ç©¶èŒå‘˜é€éœ²ï¼Œï¼Œå†…éƒ¨å·²ç»æœ‰äººæŠŠ5.6çš„æ£€æŸ¥ç‚¹çœ‹æˆæ—¥å¸¸è°ƒè¯•工具在用。。。。。
算一笔时间账:GPT-5.5是4月23æ—¥å‘的,,5.6的检查点5月下旬就在内测,,若是6月尾果真宣布,,两代旗舰之间的è·ç¦»å°†åŽ‹ç¼©åˆ°çº¦èŽ«60天。。。。。
这个节å¥ï¼Œï¼Œå·²ç»æœ€å…ˆé 近「月度è¿ä»£ã€äº†ã€‚。。。。
退掉o3å’Œ4.5ï¼Œï¼Œæ£æ˜¯ä¸ºäº†ç»™è¿™ç§é€ŸçŽ‡è…¾å‡ºè·‘é“。。。。。用户å¯èƒ½è¿˜æ²¡é¡ºåº”5.5,,5.6å°±è¦æ¥äº†ã€‚。。。。
模åçš„ã€Œç”Ÿå‘½å‘¨æœŸã€æ£åœ¨æ€¥å‰§ç¼©çŸâ€”—今天的GOAT,,明天就是Yesterday's News。。。。。
但「更强ã€è¿™å¼ 效果å•
ä½ æ•¢ä¿¡å—??????
故事到这里,,原æ¥å¯ä»¥æ”¶å°¾äº†ï¼šæ—§çދ退ä½ï¼Œï¼Œæ–°çŽ‹ç™»ä½ï¼Œï¼Œè¿ä»£æé€Ÿï¼Œï¼Œå¤©ä¸‹å¤ªå¹³ã€‚。。。。
但就在宣布退役的第二天,,OpenAI干了一件很是åå¸¸çš„äº‹â€”â€”æœ‰æ•°å®£å¸ƒäº†ä¸€ç¯‡ç¡¬æ ¸é•¿æ–‡ï¼Œï¼Œé—®é¢˜å¤§æ„æ˜¯ã€Šä»€ä¹ˆæ‰æ˜¯å€¼å¾—信任的第三方评估》。。。。。
长文系统拆解AI模å跑分的「潜规则ã€ï¼Œï¼Œå¹¶ä¸”直言:许多评估报告里的亮眼数å—,,基础说明ä¸äº†çœŸå®žèƒ½åŠ›ã€‚ã€‚ã€‚ã€‚ã€‚
è¿™å³æ˜¯æ˜¯è‡ªå·±æŽ€äº†æ¡Œå。。。。。
OpenAIæŒ‡å‡ºï¼Œï¼Œç„¦ç‚¹é—®é¢˜åœ¨äºŽï¼šå‰æ²¿æ¨¡åæ—©å°±ä¸æ˜¯ã€Œä½ 问我ç”ã€çš„谈天机械人了,,它们会用工具ã€ä¼šè®°ä¸Šä¸‹æ–‡ã€ä¼šå¤šæ¥è‡ªä¸»è¡ŒåŠ¨ã€‚ã€‚ã€‚ã€‚ã€‚
但大宗第三方评估还åœç•™åœ¨ã€Œç»™æ¨¡å出é“题ã€çœ‹å®ƒç”å¾—å¯¹å·®æ± ã€çš„阶段。。。。。
真æ£å†³è®®æ•ˆæžœå´Žå²–çš„ï¼Œï¼Œå¾€å¾€ä¸æ˜¯æ¨¡å自己,,而是那套é…套的测试框架(harness)。。。。。
harness是什么??????
简朴说就是「科场情形ã€â€”—å›åœ°ã€å·¥å…·ã€è§„则ã€èƒ½ä¸å¯é‡è¯•,,全算在内。。。。。
统一个å¦ç”Ÿï¼Œï¼Œåœ¨åº•稿纸都ä¸ç»™çš„科场和å…è®¸æŸ¥èµ„æ–™çš„ç§‘åœºé‡Œï¼Œï¼Œæ•ˆæžœè™½ç„¶çº·æ§æ ·ã€‚。。。。AI模åä¹Ÿä¸€æ ·ã€‚ã€‚ã€‚ã€‚ã€‚
最近Opus 4.8的争议就是活课本。。。。。
Datacurveçš„DeepSWEå®¡è®¡å‘æ˜Žï¼Œï¼ŒClaude Opus 4.6å’Œ4.7在SWE-Bench Pro上凌驾12%的通过案例属于「作弊ã€â€”—模å直接从Docker容器的.git历å²é‡Œç¿»å‡ºæ ‡å‡†è°œåº•,,贴进自己的补ä¸ã€‚。。。。
这一行为å 了Opus 4.7通过率的约18%ã€4.6的约25%。。。。。唬;;å角褰嗲樾é,,Opus 4.7从高ä½è·Œåˆ°54%,,GPT-5.5稳å70%榜首。。。。。
æ›´è’å”的是åé¢ã€‚。。。。
Anthropic自己也认å¯ï¼Œï¼Œ4.8的代ç ç¼ºé™·æ¼æŠ¥çŽ‡é™åˆ°4.7的四分之一。。。。。
å¿ å®ž=低分,,作弊=é«˜åˆ†â€”â€”è¿™å°±æ˜¯ç›®ä»Šè·‘åˆ†æ¸¸æˆæœ€è’å”çš„åœ°æ–¹ã€‚ã€‚ã€‚ã€‚ã€‚ä¸æ˜¯æŸä¸ªæ¨¡åä¸å¿ 实,,而是科场把åŽé—¨ç•™åœ¨é‚£é‡Œäº†ï¼Œï¼Œä¼šæŽ¢ç´¢æƒ…形的模å自然会找到它。。。。。
OpenAIè¿™ç¯‡é•¿æ–‡æ‹†å¾—æ›´ç‹ ã€‚ã€‚ã€‚ã€‚ã€‚
它说,,评估必需先说清自己在测什么:能力上é™ã€æ¸…é™é˜²æŠ¤ã€ç…§æ—§æ¨¡åæ¯”ç…§ï¼Ÿï¼Ÿï¼Ÿï¼Ÿï¼Ÿï¼Ÿä¸‰ç±»ä¸»å¼ å®Œå…¨å·®åˆ«ã€‚ã€‚ã€‚ã€‚ã€‚
ç„¶åŽç”¨æ•°æ®å¼€åˆ€ï¼šGPT-5.5å¼€å¯compactionåŽï¼Œï¼Œç½‘络é¶åœºè§£å‡ºçŽ‡ä»Ž69.2%飙到92.3%;;;;英国AISI把token预算从1000ä¸‡åŠ åˆ°1亿,,效果最高æå‡59%且还没触顶。。。。。
翻译æˆäººè¯ï¼šä½ 给模å一把瑞士军刀它能拆机械,,åªç»™ä¸€æ ¹ç‰™ç¾å®ƒè¿žå¿«é€’盒都撬ä¸å¼€ã€‚。。。。
分数失真更离谱。。。。。METR夿Ÿ¥å‘明GPT-5.4å·ç§°ã€Œ13å°æ—¶ã€çš„自主能力,,ç€å®žæ˜¯é’»äº†æƒ…形误差,,修æ£åŽè…°æ–©åˆ°çº¦6å°æ—¶ã€‚。。。。
Apollo的测试则显示,,GPT-5.5åœ¨ã€Œè—æ‹™æ¡ä»¶ã€ä¸‹52%çš„æ ·æœ¬æ³›èµ·äº†è¯„ä¼°æ„识——有些直接在头脑链里写「这是一个sandbagging评估ã€ã€‚。。。。
嘴上没摆烂,,脑å里已ç»çŸ¥é“自己在考试。。。。。
OpenAI总结了五大评估å‘ï¼šå¥–åŠ±ä½œå¼Šã€æ‹’ç”ã€æ±¡æŸ“ã€å题ã€è—拙。。。。。
一个漂亮的分数,,å¯èƒ½æ˜¯æ¨¡å真强,,也å¯èƒ½æ˜¯é¢˜æ³„了ã€è§„则åäº†ã€æ¨¡å钻空åäº†ï¼Œï¼Œæˆ–è€…â€”â€”å®ƒå¯Ÿè§‰è‡ªå·±åœ¨è¢«è€ƒï¼Œï¼Œå±…å¿ƒæ”¶ç€æ¼”。。。。。
AI进入系统竞争
回到退役这件事。。。。。
当o3è¿™æ ·çš„ã€ŒGOATã€éƒ½èƒ½è¯´é€€å°±é€€ï¼Œï¼ŒOpenAI背åŽçš„底气是「5.6更强ã€ï¼›ï¼›ï¼›ï¼›å½“GPT-4.5è¿™æ ·çš„ã€Œçµé‚写手ã€è¢«30天åŽä¸‹æž¶ï¼Œï¼Œç†ç”±æ˜¯ã€Œ5.5å·²ç»è¶³å¤Ÿå¥½ã€ã€‚。。。。
但OpenAI自己刚刚告诉全天下:决议è°å¼ºè°å¼±çš„é‚£å¼ æ•ˆæžœå•,,自己就å¯èƒ½æ˜¯è¢«åšè¿‡æ‰‹è„šçš„。。。。。
这是在说一个更深层的事实——在模åè¿ä»£è¶Šæ¥è¶Šå¿«ã€ç”Ÿå‘½å‘¨æœŸè¶Šæ¥è¶ŠçŸçš„今天,,简朴看一个Benchmarkæ•°å—就下结论的时代,,已ç»ç«£äº‹äº†ã€‚。。。。
真æ£çš„æ¯”拼,,ä¸åœ¨äºŽæŸä¸ªè·‘åˆ†è¡¨ä¸Šè°æŽ’ç¬¬ä¸€ï¼Œï¼Œè€Œåœ¨äºŽç³»ç»Ÿèƒ½åŠ›ã€è¯„ä¼°æ¡†æž¶çš„é€æ˜Žåº¦ã€ä»¥åŠè¿ä»£é€ŸçŽ‡è‡ªå·±ã€‚ã€‚ã€‚ã€‚ã€‚
o3å’ŒGPT-4.5çš„é€€å½¹ï¼Œï¼Œæ ‡è®°ç€ä¸€ä¸ªæ—¶ä»£çš„è½å¹•。。。。。
但更值得关注的,,是下一个时代的游æˆè§„则æ£åœ¨è¢«é‡å†™ï¼šæ¨¡åæ¢å¾—æ›´å¿«ï¼Œï¼Œè¯„ä¼°è¦æ±‚更真,,用户的顺应窗å£è¶Šæ¥è¶ŠçŸã€‚。。。。
å‚考资料:
https://x.com/kimmonismus/status/2060399002231660928https://openai.com/index/trustworthy-third-party-evaluations-foundations/
编辑:所罗门
@林万辰:立即博综合,,媒体:国际足è”ç‹®å大å¯é½¿æžä»·é’±æ§è§†@陈建德:二手车商说新能æºè½¦å‡ºæ–°æ¯”用é¥è¿˜å¤š
@黄秋å‰ï¼šç¼…甸爆å‘地动 仰光震感显ç€
çƒé—¨æŽ’行
- 1 yobo体育app下载官网
- 2 raybet雷竞技
- 3 新利手机
- 4 2297国际游戏
- 5 优越会电竞
- 6 开元真人官网
- 7 北京pc蛋蛋平台
- 8 博鱼体育app官方
- 9 lc8乐橙平台