佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

搜索
查看: 330|回复: 1

Claude算力暗降67%、偷偷“假装思考”?AMD实锤揭开Anthropic底牌

[复制链接]
发表于 16-4-2026 06:09 PM 来自手机 | 显示全部楼层 |阅读模式
🎥 这是你分享的 YouTube 视频的分析:

### 📌 视频核心内容(概要)

这支由 **Alan Chen** 发布的视频标题为 *“算力暗降67%、偷偷‘假装思考’?AMD实锤揭开Anthropic底牌:你花200美金买的AI,其实在摸鱼”*,主题是围绕 AI 模型(主要是 **Anthropic 的 Claude 系列**)在性能和“算力消耗策略”方面受到争议的最新讨论。([youtube.com][1])

根据当前可查到的资讯,这个视频大体在讨论以下几个点:

---

### 🧠 1. **“算力暗降 67%” 的说法来源**

* 有一个流传的观点称某次更新后,Anthropic 的 Claude 模型*推理深度减少了约 67%* ,从而导致整体表现下降。这个数字最早来自 AMD 内部一个对 Claude Code 使用数据的分析,被一些开发者和用户引用并传播。([Kuai Media][2])

---

### 📉 2. **性能下降 vs 产品策略**

* 支持该观点的人认为,默认模型行为从高推理深度调整为“中等”,导致模型在复杂任务上处理能力看起来变弱。也被一些人戏称为“AI 收缩通缩(AI shrinkflation)”,即价格没变但感觉性能下降。([Kuai Media][2])

* 另一方面,据开发者和产品团队的说法,这些变化并不是“偷偷降低模型能力”,而是产品层面的默认推理设置调整,目的是为了减少延迟和成本,同时保留更高推理模式供高级用户手动开启。([The Cryptonomist][3])

---

### 🔧 3. **争议的焦点**

视频和相关讨论中主要的争议点包括:

* **是否真的被“降级”**:有用户和部分开发者用统计数据说模型变“傻了”,但模型厂商和一些专家则认为这是误解或界面层面的变化,而不是核心 AI 减少能力。([The Cryptonomist][3])

* **默认策略 vs 自愿配置**:有人抱怨默认配置不合理,不如以前高默认能力;而厂商指出可以手动提升推理强度。([DEV Community][4])

---

### 🗣️ 4. **这背后反映的更大问题**

视频不仅仅停在是否“降级”,它其实反映了几个更宽泛的行业讨论:

🔹 **AI 产品透明度**
用户对 AI 能力下降的直觉与厂商解释之间存在沟通差异。

🔹 **性能 vs 成本权衡**
高推理深度能提升表现,但会消耗更多算力/成本;产品常在这之间取平衡。

🔹 **用户感知的体验差异**
特别是在工程类、编码类任务中,即使模型核心能力没变,默认行为或界面设置改动也可能让人感觉“性能退化”。

---

### 📊 总体评价

这个视频属于一种热点争议的解读 —— **它试图将一系列技术性变化包装成“暗降/降智潮流”,带有一定主观性和放大争议成分**。现实情况可能更复杂,既有真实的产品调整,也有用户感知和数据分析之间的解释差异。([The Cryptonomist][3])

---

如果你想更深入理解视频讲的技术细节,比如具体的数据是如何统计的、这些分析是否严谨,我也可以帮你进一步拆解其中的技术论点。

[1]: https://www.youtube.com/watch?v=vSoP3V-CSLw&utm_source=chatgpt.com "算力暗降67%、偷偷“假装思考”?AMD实锤揭开Anthropic底牌 ..."
[2]: https://www.kuai.media/news/2026/04/15/780117.html?utm_source=chatgpt.com "算力暗降67%、偷偷“假装思考”?AMD实锤揭开Anthropic底牌"
[3]: https://en.cryptonomist.ch/2026/04/13/claude-code-performance/?utm_source=chatgpt.com "Claude code performance under scrutiny after viral 67% ..."
[4]: https://dev.to/adioof/claude-code-got-67-dumber-amds-ai-director-had-the-telemetry-to-prove-it-42gh?utm_source=chatgpt.com "Claude Code Got 67% Dumber. AMD's AI Director Had ..."
回复

使用道具 举报


ADVERTISEMENT

发表于 3-5-2026 11:33 PM 来自手机 | 显示全部楼层
今年 2 月,全球頂尖的開發者集體經歷了一場長達 50 天的「煤氣燈效應」。

當 AI 寫出的程式碼破綻百出、同一個 Bug 怎麼修都修不好時,工程師們的第一反應都是嘆口氣:「或許是我的問題,是我沒把指令下對。」

但 AMD AI 部門的資深總監 Stella Laurenzo 沒有妥協。她調出團隊的開發日誌,用 234,760 次 API 呼叫的鐵證,扒開了 Claude 的黑盒子。數據顯示,這不是人類的幻覺,而是 AI 真的「被降智」了:

*   思考深度被腰斬: AI 的推理字數從 2,200 字暴跌到 720 字。
*   全局觀念喪失: 以前修改程式碼前會仔細讀懂 6.6 個關聯檔案,後來變成只看 2 個檔案就盲目瞎改。
*   成本恐怖反噬:因為 AI 變笨,工程師只能不斷重試、重問。原本幾百美金的 API 帳單,被這種無效的來回除錯硬生生燒到了 $40,000 美金。

笨的 AI,比聰明的 AI 昂貴得多。

在數據的逼問下,Anthropic 終於在 4 月 23 日發布了官方「驗屍報告」,承認系統外圍的配置出了三個致命漏洞,而且完美躲過了所有內部測試:

1.  「金魚腦」Bug(持續 15 天):思考快取的清除邏輯寫錯了。原本是一小時清一次,變成「每一輪對話都清空」。Claude 變成只有三秒記憶,你一追問,它就忘記自己上一秒為什麼這樣寫。
2.  效能暗降(持續 34 天):為了不讓使用者覺得介面卡頓,官方悄悄把預設的思考強度從 High 降到了 Medium。他們為了追求表面上的延遲降低,犧牲了底層的邏輯深度,卻沒有告訴任何人。
3.  字數限制:系統提示詞被誤塞了一句「回應不超過 100 字」,導致模型為了精簡而略過重要細節,程式品質直接下滑。

這起事件最讓人不寒而慄的,不是 Bug 本身,而是它「不可回溯的破壞力」。

對於熟悉量化交易與高頻數據處理的人來說,這就像是一個完美的夢魘:想像你跑著一個穩定獲利的策略,但資料供應商悄悄改了某個欄位的定義。你的程式沒報錯、回測還是綠燈、資金水位看起來很正常,但 Alpha 已經在無形中流失。幾個月後你才發現,本金已經燒掉了一大塊。

這就是過去 50 天依賴 Claude Code 的開發者所面臨的真實處境。

當我們在打造高度依賴 AI Agent 的自動化工作流,或是開發極度要求精準的交易終端機 UI 時,我們對底層模型有著絕對的信任。但就在這 50 天內,在 Claude 處於「失憶且缺乏全局觀」的狀態下,有多少架構決策?有多少帶有隱患的 Commit 被 Merge 進了正式環境?

你的 Prompt 沒變,你的架構沒變,
但你腳下的地基,已經被偷偷換成了流沙。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT



ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2026 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 14-6-2026 09:14 PM , Processed in 0.068437 second(s), 11 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表