FFI8805 Pro
Flowforest工業級 AI 加速器

FFI8805 Pro

全 CIM 存算一體 AI 邊緣推理引擎

專為工業自動化、車載系統與醫療設備設計的全 CIM 存算一體 AI 加速器,透過記憶體內運算實現極致能效比。

2 TOPS
AI 算力
<0W
功耗
0 GB
記憶體
29°C
工作溫度
核心技術

三大核心優勢

FFI8805 Pro 採用全 CIM 存算一體架構,無需額外處理器即可實現工業級邊緣智能。

全 CIM 存算一體架構

所有運算均在 SRAM-CIM 陣列內完成,消除資料搬移瓶頸,實現極致能效比與低功耗推理。

8 TOPS
CIM 算力
<1W
推理功耗

工業級可靠性

-40°C 至 105°C 寬溫設計,TEE 安全啟動,符合工業 EMC 標準。

105°C
最高工作溫度
TEE
安全隔離

階層式記憶體

SRAM + 2GB LPDDR5 雙層記憶體架構,支援大型模型的權重分層載入。

2 GB
LPDDR5
51.2 GB/s
記憶體頻寬

全 CIM 存算一體架構

FFI8805 Pro 採用純 CIM 架構,所有 AI 運算直接在記憶體內完成,無需額外的 RISC-V 或 NPU 協處理器。

CIM 推理核心

雙 SRAM-CIM 陣列,支援 CNN/Transformer/SLM 多種模型的記憶體內推理。

8-bit MAC · 8 TOPS · <1W

CIM 推理引擎

透過 CIM 陣列原生支援 INT4/INT8 量化語言模型推理,無需外掛處理器。

INT4/INT8 · CIM 原生推理 · <1W

統一記憶體

2GB LPDDR5 統一記憶體,專用於 CIM 模型權重與推理緩衝。

51.2 GB/s · 雙通道 · ECC
架構對比

全 CIM vs 傳統 NPU 架構

FFI8805 Pro 採用全 CIM 存算一體設計,將計算直接嵌入記憶體陣列,從根本上消除資料搬移瓶頸。以下是與傳統 RISC-V + NPU 架構的關鍵指標對比。

FFI8805 Pro(全 CIM)

存算一體架構

功耗 (TDP)< 3W TDP
推理延遲< 1ms
能效比8 TOPS/W
晶片面積22mm²
記憶體頻寬51.2 GB/s

傳統 RISC-V + NPU

傳統分離式架構

功耗 (TDP)5–15W
推理延遲5–10ms
能效比2–4 TOPS/W
晶片面積80–120mm²
記憶體頻寬25.6 GB/s

消除記憶體牆

計算在記憶體內部完成,無需資料搬移

極低功耗

TDP < 3W,能效比達 8 TOPS/W

簡化系統設計

無需額外 RISC-V 或 NPU,降低 BOM 成本

極緊湊封裝

晶片面積僅 22mm²,適合空間受限場景

數據來源與參考文獻

[1] ISSCC 2024 — SRAM-CIM 存算一體架構功耗與效能對比研究

[2] IEEE JSSC 2023 — 存算一體與傳統 NPU 架構能效比分析

[3] Nature Electronics 2023 — 計算存儲融合架構的能效比與面積優勢研究

以上數據基於公開學術研究與內部測試結果,實際效能可能因工作負載與環境條件而異。

CIM 技術白皮書

深入了解全 CIM 存算一體架構的技術原理、效能對比數據與應用場景分析。留下 Email 即可在白皮書上線時立即收到通知。

您的 Email 僅用於白皮書上線通知,我們不會將其用於其他用途。

詳細規格

會員專屬技術資料

登入即可查看完整規格表、基準測試與應用場景。