Stacked GDDR

定義

Stacked GDDR(堆疊式 GDDR)是來源主張中的中階高頻寬記憶體方案:把傳統 GDDR(Graphics Double Data Rate)晶片以垂直方式堆疊,試圖在容量、頻寬、成本與封裝複雜度之間取得比 HBM 更低成本、比一般 GDDR 更高密度的折衷。

AI 推論角色

來源把 Stacked GDDR 定位在 HBM 與一般 GDDR 之間,可能用於 LLM 推論中的 KV cache、模型權重讀取與批次處理。它不是最熱資料層的首選,但若成本與產能優於 HBM,可能在部分推論 accelerator 中承接中階容量需求。

來源主張(待核驗)

  • 初期設計約 4 層堆疊。
  • 頻寬低於 HBM3E 約 1.2TB/s,但成本僅為 HBM 的部分比例。
  • 原型可能於 2027 年問世,初期聚焦 AI 加速器而非消費顯示卡。
  • Micron Technology 正積極開發此技術。

主要不確定性

  • 是否有正式產品路線圖、標準或客戶平台。
  • 熱管理與堆疊良率是否足以支撐資料中心部署。
  • HBFCXL Memory、HBM 容量提升相比,實際 TCO 是否具優勢。

相關頁面

來源

中等量產難度

來源把 Stacked GDDR 歸為中等難度:可借用既有 GDDR 生態與封裝經驗,封裝複雜度低於 HBM,但堆疊良率、原型時程與平台採用仍未成熟。它更像 HBM 與傳統 GDDR 之間的中階推論方案。

作為中階推論記憶體

來源把堆疊式 GDDR 放在 HBM 與低成本記憶體之間的中階推論場景,可能服務中低功耗 inference。此點延續既有 AI推論記憶體替代技術,但具體供應商、量產時程與平台採用仍需核驗。