FFI8805 Pro
Flowforest工业级 AI 加速器

FFI8805 Pro

全 CIM 存算一体 AI 边缘推理引擎

专为工业自动化、车载系统与医疗设备设计的全 CIM 存算一体 AI 加速器,通过内存计算实现极致能效比。

2 TOPS
AI 算力
<0W
功耗
0 GB
内存
32°C
工作温度
核心技术

三大核心优势

FFI8805 Pro 采用全 CIM 存算一体架构,无需额外处理器即可实现工业级边缘智能。

全 CIM 存算一体架构

所有运算均在 SRAM-CIM 阵列内完成,消除数据搬移瓶颈,实现极致能效比与低功耗推理。

8 TOPS
CIM 算力
<1W
推理功耗

工业级可靠性

-40°C 至 105°C 宽温设计,TEE 安全启动,符合工业 EMC 标准。

105°C
最高工作温度
TEE
安全隔离

层次式内存

SRAM + 2GB LPDDR5 双层内存架构,支持大型模型权重分层加载。

2 GB
LPDDR5
51.2 GB/s
内存带宽

全 CIM 存算一体架构

FFI8805 Pro 采用纯 CIM 架构,所有 AI 运算直接在内存中完成,无需额外的 RISC-V 或 NPU 协处理器。

CIM 推理核心

双 SRAM-CIM 阵列,支持 CNN/Transformer/SLM 多种模型的内存内推理。

8-bit MAC · 8 TOPS · <1W

CIM 推理引擎

通过 CIM 阵列原生支持 INT4/INT8 量化语言模型推理,无需外挂处理器。

INT4/INT8 · CIM 原生推理 · <1W

统一内存

2GB LPDDR5 统一内存,专用于 CIM 模型权重与推理缓冲。

51.2 GB/s · 双通道 · ECC
架构对比

全 CIM vs 传统 NPU 架构

FFI8805 Pro 采用全 CIM 存算一体设计,将计算直接嵌入内存阵列,从根本上消除数据搬移瓶颈。以下是与传统 RISC-V + NPU 架构的关键指标对比。

FFI8805 Pro(全 CIM)

存算一体架构

功耗 (TDP)< 3W TDP
推理延迟< 1ms
能效比8 TOPS/W
芯片面积22mm²
内存带宽51.2 GB/s

传统 RISC-V + NPU

传统分离式架构

功耗 (TDP)5–15W
推理延迟5–10ms
能效比2–4 TOPS/W
芯片面积80–120mm²
内存带宽25.6 GB/s

消除内存墙

计算在内存内部完成,无需数据搬移

极低功耗

TDP < 3W,能效比达 8 TOPS/W

简化系统设计

无需额外 RISC-V 或 NPU,降低 BOM 成本

极紧凑封装

芯片面积仅 22mm²,适合空间受限场景

数据来源与参考文献

[1] ISSCC 2024 — SRAM-CIM 存算一体架构功耗与性能对比研究

[2] IEEE JSSC 2023 — 存算一体与传统 NPU 架构能效比分析

[3] Nature Electronics 2023 — 计算存储融合架构的能效比与面积优势研究

以上数据基于公开学术研究与内部测试结果,实际性能可能因工作负载与环境条件而异。

CIM 技术白皮书

深入了解全 CIM 存算一体架构的技术原理、性能对比数据与应用场景分析。留下 Email 即可在白皮书上线时立即收到通知。

您的 Email 仅用于白皮书上线通知,我们不会将其用于其他用途。

详细规格

会员专属技术资料

登录即可查看完整规格表、基准测试与应用场景。