Stacked GDDR
定義
Stacked GDDR(堆疊式 GDDR)是來源主張中的中階高頻寬記憶體方案:把傳統 GDDR(Graphics Double Data Rate)晶片以垂直方式堆疊,試圖在容量、頻寬、成本與封裝複雜度之間取得比 HBM 更低成本、比一般 GDDR 更高密度的折衷。
AI 推論角色
來源把 Stacked GDDR 定位在 HBM 與一般 GDDR 之間,可能用於 LLM 推論中的 KV cache、模型權重讀取與批次處理。它不是最熱資料層的首選,但若成本與產能優於 HBM,可能在部分推論 accelerator 中承接中階容量需求。
來源主張(待核驗)
- 初期設計約 4 層堆疊。
- 頻寬低於 HBM3E 約 1.2TB/s,但成本僅為 HBM 的部分比例。
- 原型可能於 2027 年問世,初期聚焦 AI 加速器而非消費顯示卡。
- Micron Technology 正積極開發此技術。
主要不確定性
- 是否有正式產品路線圖、標準或客戶平台。
- 熱管理與堆疊良率是否足以支撐資料中心部署。
- 與 HBF、CXL Memory、HBM 容量提升相比,實際 TCO 是否具優勢。
相關頁面
來源
中等量產難度
來源把 Stacked GDDR 歸為中等難度:可借用既有 GDDR 生態與封裝經驗,封裝複雜度低於 HBM,但堆疊良率、原型時程與平台採用仍未成熟。它更像 HBM 與傳統 GDDR 之間的中階推論方案。
作為中階推論記憶體
來源把堆疊式 GDDR 放在 HBM 與低成本記憶體之間的中階推論場景,可能服務中低功耗 inference。此點延續既有 AI推論記憶體替代技術,但具體供應商、量產時程與平台採用仍需核驗。