FFI8805 Premium
FlowforestNEXT-GEN PRODUCT

FFI8805 Premium

CIM AIアクセラレータ × SSDストレージ — 包括的LLMソリューション

FFI8805 PremiumはCIM AIアクセラレーションコアとAI対応型SSDコントローラを統合し、DeepSeek V4 Engram永続メモリエンジンとDualPathデュアルチャネル帯域幅最適化を搭載した包括的LLM推論ハードウェアソリューションです。

0%
JCT削減
0%
スループット向上
0
GPUスケーラビリティ
0%
エネルギー効率向上

LLM推論の3つのボトルネック

DeepSeek V4などの超大規模モデルが兆パラメータを超える中、従来のGPU + DRAMアーキテクチャはメモリ容量、ストレージ帯域幅、運用コストの3つのボトルネックに直面しています。

メモリウォール

671Bパラメータモデルは1.2TB+のメモリが必要。単一ノードのGPU HBM容量は大幅に不足し、KV-Cacheはコンテキスト長と共に線形に增大します。

ストレージ帯域幅

Prefill段階ではSSDから数百GBのモデル重みをロードする必要があり、従来の単一パスPCIe帯域幅が主要なボトルネックとなります。

運用コスト

大規模GPUクラスタの電力と冷却コストが上昇し続け、トークンあたりの推論コストを商業的に実行可能なレベルまで下げるのが困難です。

CORE TECHNOLOGIES

3つのコア技術の柱

FFI8805 Premiumは3つのブレークスルー技術を統合し、モデルメモリ、データパス、ストレージメディア全体でLLM推論を最適化します。

PILLAR 1 · MODEL MEMORY

DeepSeek V4 Engram 永続メモリエンジン

EngramはDeepSeek V4が導入したネイティブ永続メモリ機構で、高頻度知識をO(1)クエリ可能な構造化メモリに圧縮し、KV-Cacheの線形成長を置き換えます。

O(1)
メモリクエリ複雑度
14.8T
トレーニングトークン
5.2×
メモリ圧縮率
671B
モデルパラメータ

V4 vs V3 ベンチマーク向上

MMLU+3.4
BBH+5.0
HumanEval+3.0
MATH+2.4
Multi-Query NIAH+12.8
DualPath Storage Bandwidth Optimization for LLM InferenceLeveraging Idle DE Nodes & RDMA for Enhanced Performance≫ Path 1: PE Read Path (Traditional)SSDSSD Storage(PE Node)?DataDRAMPE DRAM(Host Memory)?NVLink/PCIeHost Interconnect?PE→GPUGPU HBMGPUGPUGPUPE to GPU Transfer?DualPathOptimization HubFFI8805 PremiumSRAM-CIM + Engram Engine?GPU ClusterLLM Inference ProcessingGPUGPUGPUGPUGPUGPUGPUGPUGPU?≫ Path 2: DE Read Path (Innovative)SSDSSD Storage(DE Node)?DataDE DRAMData Engine DRAM(Idle DE Node)?CNICConverged NetworkInterface Card?RDMARemote DirectMemory AccessDE→GPU Direct?DE→GPU Direct Access45.62%JCT Reduction (Job Completion Time)2.25xThroughput (vs Traditional)1,152GPU Scale(Scalability)LEGENDPE Path (Cyan): Traditional Read Path — SSD → PE DRAM → NVLink/PCIe → GPU HBMDE Path (Amber): Innovative DualPath Read — SSD → DE DRAM → CNIC → RDMA → GPU Direct AccessGPU Cluster: LLM Inference ProcessingDualPath Optimization Hub: FFI8805 Premium
PILLAR 2 · DATA PATH

DualPath 帯域幅最適化

DualPathはAIトレーニングクラスタのアイドルDEノードSNICを活用し、SSD→DE DRAM→CNIC RDMA→GPUの第2データパスを開きます。

45.62%
JCT削減
2.25×
スループット向上
1,152
GPUスケール
PILLAR 3 · STORAGE MEDIA

AI対応型SSD NAND IPアーキテクチャ

5層AI対応アーキテクチャはNANDアレイからアクセラレーション層まで全面的に再設計され、SSDコントローラがAIワークロードのアクセスパターンを理解します。

AIアクセスパターン認識Prefill/Decode/CheckpointのLLMアクセスパターンを自動識別し、NANDスケジューリングを動的に調整
3段バイオニックキャッシュL1 SRAM + L2 DRAM + L3 SLC 3段キャッシュ、ヒット率 β = 0.85–0.95
インテリジェントプリフェッチアテンションパターンに基づき次のKV-Cacheアクセス位置を予測し、高速キャッシュに事前ロード
ニアストレージ圧縮NANDコントローラレベルでINT4/INT8量子化解凍を実行、PCIe転送量を削減
FFI8805 Premium AI Accelerator + SSD Storage SolutionIntegrated 5-Layer Architecture: From AI Acceleration to NAND StorageCIM AI AcceleratorSmart SSD StorageLayer 1AI Acceleration LayerSRAM-CIM • 12 TOPS • EngramINT4/INT8/FP16/FP8?Layer 2AI Interface LayerAPIPCIe+ CXLNVMe?Layer 3AI Core LayerSRAM-CIM Array • 64MB On-Chip22nm Process • 3D SSD Extension?Layer 4QoS Control LayerOPTIMIZEMONITORTRAFFIC MGMT?Layer 5NAND Array Layer3D TLC/QLC NAND • 4/8/16 TB • AI-Aware Controller?AI AccelInterfaceAI CoreQoSNANDClick any layer for detailed specifications
HARDWARE SPECIFICATION

ハードウェア仕様一覧

FFI8805 Premium は CIM AI アクセラレーションコア、SSD コントローラ、NAND アレイを単一の 2.5" U.2 モジュールに統合。各サブシステムの完全な仕様を以下に示します。

FFI8805 Premium 詳細仕様

ComponentSpecificationPerformance

会員専用技術資料

詳細仕様、メモリ階層、技術比較、アプリケーションシナリオ、ロードマップはログイン済み会員専用です。