

進入 2026 年,全球半導體市場最先感受到的寒意來自存儲領域。根據多家市場研究機構的報告,存儲芯片價格的上漲已近乎"失控"。
根據 Counterpoint Research 與 TrendForce 的數據,繼 2025 年第四季度價格暴漲 50% 之后,DRAM 與 NAND Flash 芯片的價格預計在 2026 年第一季度將繼續上揚 40% 至 50%。
這一極端的價格壓力迅速從上游傳導至終端。以消費市場為例,部分主流 DDR5 內存條的價格自 2025 年下半年以來漲幅已超過三倍 。
對這個現象深度溯源,其實是 AI 基礎設施,特別是大模型訓練與推理對高帶寬內存(HBM)和高性能存儲的"虹吸效應"所致。
晶圓廠將產能優先分配給利潤更高的 AI 相關存儲產品,擠壓了傳統 DRAM 和 NAND 的供給,一場覆蓋全行業的"算力稅"已經拉開序幕。
但存儲上揚只是序章,漲價輪盤上新近轉來的,是 CPU。一、算力稅第二波,CPU 漲價
長期以來被視為成熟市場的 CPU,在 2025 年下半年開始出現異動,并在 2026 年初徹底爆發。
資本市場的反應最為敏銳。截至 2026 年 1 月 21 日,芯片巨頭英特爾(Intel)股價觸及 54.25 美元,創下自 2022 年 1 月以來的新高,年初至今累計漲幅高達 44.74% 。它的競爭對手 AMD 股價同樣錄得七連漲。

在中國市場,國產 CPU 的代表龍芯中科和海光信息股價分別在 1 月 21 日創下 20% 漲停和上漲超 13% 的驚人記錄。
這一系列現象的背后,供給側的產能瓶頸是顯而易見的。

根據 TrendForce 2026 年 1 月的供應鏈監測報告,臺積電(TSMC)的 N2 與 N3 到 2027 年的產能,也已被蘋果、英偉達(NVIDIA)及博通(Broadcom)等巨頭瓜分。
由于高端 GPU 與定制 ASIC 在單晶圓產出價值(Revenue per Wafer)上相較傳統 CPU 享有溢價,代工廠在產能分配優先級上存在明顯的盈利傾向。
這種資源向高毛利產品的傾斜,直接削減了消費級與企業級處理器的晶圓配額。與此同時,先進封裝技術(如 CoWoS-L/S)的瓶頸成為次生阻礙,IDC 分析指出,由于 CoWoS 產能利用率在 2025 年第四季度便已突破 100%,導致即便前端晶圓完成刻蝕,后端封裝的積壓也使 CPU 出貨周期從正常的 8-10 周大幅延長至 24 周以上。
這種產能壓力在英特爾的內部生態中體現得更為極致。隨著其 18A 工藝進入量產高峰期,英特爾不僅需要保障自身酷睿(Core)與至強(Xeon)系列的供應,還需履行向微軟、亞馬遜等外部 Foundry 客戶的代工承諾,導致英特爾核心節點的產能利用率已攀升至 120%-130% 的超負荷狀態。
摩根大通最新的研報指出,這種"極限超載"已迫使英特爾將部分非核心組件轉移至聯電(UMC)等二線代工廠,但依然無法完全抵消先進制程供應的缺口。
然而,供給受限僅僅是故事的一半,真正重塑市場格局的,樂魚體育官方網站是來自需求側的結構性劇變。
而推高需求側的關鍵詞,就是智能體。
二、需求側,智能體創造"域外 CPU "新需求
智能體能夠自主規劃任務、調用工具、記憶歷史步驟,并在執行過程中實時調整策略來解決問題,人們通過這種方式來彌補單純大模型在上下文感知、幻覺問題以及實時信息獲取方面的不足。
在它的架構中,在大模型的推理工作之外,還增加了決策編排器,還會使用網頁搜索、抓取、Python 解釋器、上下文數據庫等外部工具。
也就是說,整個智能體的工作負載中,AI 計算任務只是一部分,還有很大部分是通用計算。

在智能體運行任務中,CPU 的核心優勢體現在對工具處理的適配能力、資源利用的靈活性以及對多種應用場景的兼容性。CPU 能夠高效運行許多無法部署在 GPU/TPU/NPU 上的計算任務和外部程序工具,例如網頁搜索、Python 執行、精確向量 / 數據搜索等。

這類任務處理在智能體任務總量中總耗時(Latency)占比很大。要知道,CPU 還支持多線程和多進程并行,天然可以根據負載特征進行動態調整。
為了進一步深度分析,我們需要引入兩個概念:域內 CPU 和域外 CPU。

所謂域內 CPU,指的是 GPU 服務器中所配的 CPU,金沙電玩傳統上來講,裝在 GPU 模組的服務器主機被稱為機頭,域內 CPU 指的就是機頭里的 CPU。它的主要任務是解決內存相關問題和數據調度,確保 GPU 任務均衡、合理、高效。
所謂域外 CPU,指的是整個任務系統中,GPU 服務器以外的集群中的其他 CPU。
從系統視角來看,如果把整個智能體應用(Agentic AI)看成一個系統,根據上面的分析我們就知道,僅僅就 CPU 而言,起到性能決定性因素的,實際上是來自于域外 CPU。
{jz:field.toptypename/}首先是極高的 Latency 占比。在典型的 Agent 工作負載中,運行在 CPU 上的任務處理(如數據庫檢索、代碼執行和搜索摘要)占據了任務總 Latency 的 80~90%。也就是說,系統運行時的大部分耗時都是域外 CPU 在處理任務,而不是消耗在 AI 芯片的推理上。

其次是復雜的計算模式。域外 CPU 需要處理大量非 AI 原生任務,比如說搜索、爬蟲、抓網頁,比如說運行 Python 腳本,還有排序和摘要算法。
還有并發和能效比。在大規模批處理場景下,由于核心負載和同步開銷,動態能耗會上升。域外 CPU 的多核性能和調度能力和智能體服務的經濟效率強相關。

三、傳統的 CPU,新的增量市場
IDC 預計,活躍 Agent 的數量將從 2025 年的約 2860 萬,快速攀升至 2030 年的 22.16 億,年復合增長率達到 139%。年執行任務總數將從 2025 年的 440 億次暴漲至 2030 年的 415 萬億次,年復合增長率高達 524%。年度 Token 消耗量預計從 2025 年的 0.0005 PetaTokens 暴增至 2030 年的 152,667 PetaTokens,年復合增長率高達 3418%。
這些數據揭示了一個關鍵趨勢:單個 Agent 承擔的任務復雜度、決策鏈路長度以及對實時性的要求都在指數級增長。
這將直接轉化為對"域外 CPU "算力的海量需求。
Meta 近期斥資數十億美元收購通用 AI Agent 初創公司 Manus,這是 Meta 成立以來第三大收購,僅次于 WhatsApp 和 Scale AI。這一舉動充分說明了產業界對 Agent 應用前景的看好。
根據 Gartner 發布的《2025 年十大戰略技術趨勢》報告,智能體 AI(Agentic AI)被列為年度首要趨勢,預測到 2028 年,全球約 33% 的企業級軟件應用將集成智能體功能,而這一比例在 2024 年尚不足 1%。
企業端的采納率數據進一步驗證了這一增長的確定性。Capgemini 研究報告顯示,2025 年企業對智能體及多智能體系統(MAS)的利用率已達 21%,較 2024 年的 10% 實現了翻倍增長。
同時,PwC 對 300 余位高管的調研顯示,88% 的受訪企業表示正因智能體帶來的生產力紅利而增加 AI 預算,平均 ROI 已達到 1.7 倍。Cloudera 的最新數據則顯示,96% 的 IT 決策者計劃在 2026 年前進一步擴大智能體的部署規模。
這種近乎一致的擴張意愿,提升了智能體的使用需求。
這是新的增長邏輯,也就會在資本市場帶來新的增長故事。

基于當前 AI 技術和應用的發展趨勢,智能體這一波推起來的通用 CPU 需求,不僅增長速度快,而且還是有持續性的。

這一趨勢還處于早期階段,但增長勢頭已經不可阻擋。按照任務總延遲來計算,域外 CPU 的需求增加不比 GPU/AI 芯片少。
如前文所說,Intel 的產能利用率據說已經達到 120~130%,而 AMD 主要靠 TSMC,前面已經提到,TSMC 的先進工藝產能盡量給了更 fancy 的 GPU,稍次一點的產能現在也已經滿載,提升空間也不大。已經有消息表明,2026 全年 intel 和 AMD 的 CPU 配額已經被預定完畢。
同屬于 X86 陣營的海光,是否可以為行業提供充足的供應,就考驗著中國半導體供應鏈的韌性了。

在這樣的情況下,CPU 價格在未來一段時間內怎么能輕易降下來?

備案號: