|
查看: 331|回复: 1
|
Claude算力暗降67%、偷偷“假装思考”?AMD实锤揭开Anthropic底牌
[复制链接]
|
|
|
🎥 这是你分享的 YouTube 视频的分析:
### 📌 视频核心内容(概要)
这支由 **Alan Chen** 发布的视频标题为 *“算力暗降67%、偷偷‘假装思考’?AMD实锤揭开Anthropic底牌:你花200美金买的AI,其实在摸鱼”*,主题是围绕 AI 模型(主要是 **Anthropic 的 Claude 系列**)在性能和“算力消耗策略”方面受到争议的最新讨论。([youtube.com][1])
根据当前可查到的资讯,这个视频大体在讨论以下几个点:
---
### 🧠 1. **“算力暗降 67%” 的说法来源**
* 有一个流传的观点称某次更新后,Anthropic 的 Claude 模型*推理深度减少了约 67%* ,从而导致整体表现下降。这个数字最早来自 AMD 内部一个对 Claude Code 使用数据的分析,被一些开发者和用户引用并传播。([Kuai Media][2])
---
### 📉 2. **性能下降 vs 产品策略**
* 支持该观点的人认为,默认模型行为从高推理深度调整为“中等”,导致模型在复杂任务上处理能力看起来变弱。也被一些人戏称为“AI 收缩通缩(AI shrinkflation)”,即价格没变但感觉性能下降。([Kuai Media][2])
* 另一方面,据开发者和产品团队的说法,这些变化并不是“偷偷降低模型能力”,而是产品层面的默认推理设置调整,目的是为了减少延迟和成本,同时保留更高推理模式供高级用户手动开启。([The Cryptonomist][3])
---
### 🔧 3. **争议的焦点**
视频和相关讨论中主要的争议点包括:
* **是否真的被“降级”**:有用户和部分开发者用统计数据说模型变“傻了”,但模型厂商和一些专家则认为这是误解或界面层面的变化,而不是核心 AI 减少能力。([The Cryptonomist][3])
* **默认策略 vs 自愿配置**:有人抱怨默认配置不合理,不如以前高默认能力;而厂商指出可以手动提升推理强度。([DEV Community][4])
---
### 🗣️ 4. **这背后反映的更大问题**
视频不仅仅停在是否“降级”,它其实反映了几个更宽泛的行业讨论:
🔹 **AI 产品透明度**
用户对 AI 能力下降的直觉与厂商解释之间存在沟通差异。
🔹 **性能 vs 成本权衡**
高推理深度能提升表现,但会消耗更多算力/成本;产品常在这之间取平衡。
🔹 **用户感知的体验差异**
特别是在工程类、编码类任务中,即使模型核心能力没变,默认行为或界面设置改动也可能让人感觉“性能退化”。
---
### 📊 总体评价
这个视频属于一种热点争议的解读 —— **它试图将一系列技术性变化包装成“暗降/降智潮流”,带有一定主观性和放大争议成分**。现实情况可能更复杂,既有真实的产品调整,也有用户感知和数据分析之间的解释差异。([The Cryptonomist][3])
---
如果你想更深入理解视频讲的技术细节,比如具体的数据是如何统计的、这些分析是否严谨,我也可以帮你进一步拆解其中的技术论点。
[1]: https://www.youtube.com/watch?v=vSoP3V-CSLw&utm_source=chatgpt.com "算力暗降67%、偷偷“假装思考”?AMD实锤揭开Anthropic底牌 ..."
[2]: https://www.kuai.media/news/2026/04/15/780117.html?utm_source=chatgpt.com "算力暗降67%、偷偷“假装思考”?AMD实锤揭开Anthropic底牌"
[3]: https://en.cryptonomist.ch/2026/04/13/claude-code-performance/?utm_source=chatgpt.com "Claude code performance under scrutiny after viral 67% ..."
[4]: https://dev.to/adioof/claude-code-got-67-dumber-amds-ai-director-had-the-telemetry-to-prove-it-42gh?utm_source=chatgpt.com "Claude Code Got 67% Dumber. AMD's AI Director Had ..."
|
|
|
|
|
|
|
|
|
|
|
发表于 3-5-2026 11:33 PM
来自手机
|
显示全部楼层
今年 2 月,全球頂尖的開發者集體經歷了一場長達 50 天的「煤氣燈效應」。
當 AI 寫出的程式碼破綻百出、同一個 Bug 怎麼修都修不好時,工程師們的第一反應都是嘆口氣:「或許是我的問題,是我沒把指令下對。」
但 AMD AI 部門的資深總監 Stella Laurenzo 沒有妥協。她調出團隊的開發日誌,用 234,760 次 API 呼叫的鐵證,扒開了 Claude 的黑盒子。數據顯示,這不是人類的幻覺,而是 AI 真的「被降智」了:
* 思考深度被腰斬: AI 的推理字數從 2,200 字暴跌到 720 字。
* 全局觀念喪失: 以前修改程式碼前會仔細讀懂 6.6 個關聯檔案,後來變成只看 2 個檔案就盲目瞎改。
* 成本恐怖反噬:因為 AI 變笨,工程師只能不斷重試、重問。原本幾百美金的 API 帳單,被這種無效的來回除錯硬生生燒到了 $40,000 美金。
笨的 AI,比聰明的 AI 昂貴得多。
在數據的逼問下,Anthropic 終於在 4 月 23 日發布了官方「驗屍報告」,承認系統外圍的配置出了三個致命漏洞,而且完美躲過了所有內部測試:
1. 「金魚腦」Bug(持續 15 天):思考快取的清除邏輯寫錯了。原本是一小時清一次,變成「每一輪對話都清空」。Claude 變成只有三秒記憶,你一追問,它就忘記自己上一秒為什麼這樣寫。
2. 效能暗降(持續 34 天):為了不讓使用者覺得介面卡頓,官方悄悄把預設的思考強度從 High 降到了 Medium。他們為了追求表面上的延遲降低,犧牲了底層的邏輯深度,卻沒有告訴任何人。
3. 字數限制:系統提示詞被誤塞了一句「回應不超過 100 字」,導致模型為了精簡而略過重要細節,程式品質直接下滑。
這起事件最讓人不寒而慄的,不是 Bug 本身,而是它「不可回溯的破壞力」。
對於熟悉量化交易與高頻數據處理的人來說,這就像是一個完美的夢魘:想像你跑著一個穩定獲利的策略,但資料供應商悄悄改了某個欄位的定義。你的程式沒報錯、回測還是綠燈、資金水位看起來很正常,但 Alpha 已經在無形中流失。幾個月後你才發現,本金已經燒掉了一大塊。
這就是過去 50 天依賴 Claude Code 的開發者所面臨的真實處境。
當我們在打造高度依賴 AI Agent 的自動化工作流,或是開發極度要求精準的交易終端機 UI 時,我們對底層模型有著絕對的信任。但就在這 50 天內,在 Claude 處於「失憶且缺乏全局觀」的狀態下,有多少架構決策?有多少帶有隱患的 Commit 被 Merge 進了正式環境?
你的 Prompt 沒變,你的架構沒變,
但你腳下的地基,已經被偷偷換成了流沙。 |
|
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|