Cerebras Systems
摘要
Cerebras Systems 是來源中提到的專用 AI 加速器公司,主張其 Wafer-Scale Engine / WSE 架構以晶圓級處理器提供高記憶體頻寬與低資料搬移延遲,可能適合長序列 LLM 推論。
來源主張 / 待核驗
- WSE-3 電晶體數、記憶體頻寬與 LLM 長上下文推論優勢。
- 其架構是否能在 production serving 中降低 KV Cache 傳輸延遲。
- 客戶採用、雲端可用性、模型支援與成本曲線。
Cerebras Systems 是來源中提到的專用 AI 加速器公司,主張其 Wafer-Scale Engine / WSE 架構以晶圓級處理器提供高記憶體頻寬與低資料搬移延遲,可能適合長序列 LLM 推論。