源神收官！DeepSeek第五彈解讀，榨乾SSD全部性能！

2月28日，今年2月份的最後一天，也是DeepSeek開源周的最後一天，發佈了兩個項目，分別是3FS文件系統，以及利用3FS和DuckDB構建的輕量級數據處理框架Smallpond！今天也是我連續第五天，用通俗語言給大家帶來DeepSeek開源項目的最新解讀。

01 DeepSeek第五彈有多強？

昨天DeepSeek一口氣放了三個項目，今天再來最後的兩個項目，幾乎是毫無保留地將V3/R1的所有訓練、推理細節全部開源，3FS可以將固態硬盤SSD榨乾到極致，根據DeepSeek官方測試，180節點集羣中的聚合讀取吞吐量爲6.6TB/s，25節點集羣中GraySort基準測試的吞吐量爲3.66TB/分鐘，每個客戶端節點的KVCache查找峯值吞吐量超過40GB/s。

DeepSeek-V3/R1模型中幾乎所有關於訓練數據預處理、數據集加載、嵌入向量搜索和KV Cache查找的工作，都涉及到了3FS！第二個工具Smallpond搭配3FS配套使用，讓 DuckDB 這類單機分析工具可直接處理 PB 級數據，也是首個開源的高性能並行文件系統，前幾天的代碼庫幾乎都是爲了MoE專家模型和英偉達Hopper GPU設計，今天的代碼主要是數據處理框架和分佈式文件系統，接下來我們還是一步步剖析每個代碼庫的具體內容。

02 什麼是分佈式文件系統

3FS全稱爲Fire-Flyer File System是DeepSeek團隊專爲人工智能高性能計算（AI-HPC）設計的分佈式並行文件系統，主要用來解決AI訓練和推理中的大規模數據訪問與處理瓶頸，像MoE專家模型這類架構，模型的參數量達到千億規模，DeepSeek用3FS來榨乾固態硬盤的所有性能，提供接近理論極限的吞吐量，降低數據加載對GPU計算時間的佔用。

3FS系統名字聽起來高大上，但其實說白了，就是一個超級厲害的數據存儲和訪問系統，想象一下，你在網上買了一大堆東西，快遞公司得把這些東西從倉庫快速送到你家。傳統的文件系統就像普通的快遞公司，一次只能送一個包裹，路線固定速度慢。而3FS就像一個超級快遞系統，有成千上萬個快遞員同時出動，而且路線最優，能同時處理無數個包裹，速度快到飛起。

具體放在大模型訓練中，3FS是一個高性能的分佈式並行文件系統，首先解釋“分佈式並行”。DeepSeek將大模型的數據分散存儲在很多臺機器上，這些機器同時工作，共同處理數據的存儲和訪問，這樣一來數據的讀寫速度就大大提升，邏輯思路非常簡單，DeepSeek聲明在180個節點的集羣（也就是180臺機器連在一起）上，3FS的讀取速度能達到6.6 TiB/s，1 TiB就是1024 GB。

GPU集羣的峯值吞吐量

設計上面，3FS充分利用了高速SSD（固態硬盤）和RDMA網絡（一種超高速網絡技術）的性能，這些都是現代數據中心裏的標配硬件，3FS能把它們的潛力發揮到極致，首先3FS可以直接繞過CPU內核，通過RDMA技術實現數據從存儲節點網卡直達到計算節點內存，減少內存拷貝和延遲，通過KVCache功能緩存歷史計算結果，提供40+ GiB/s的峯值吞吐量，降低推理成本。

其實，3FS這項技術還不止是用於AI，遊戲開發等需要數據加載的領域，同樣也可以適用，分佈式架構可以保證數據強一致性的同時支持多節點併發讀寫，這一點可用於多人遊戲全球服務器同步、實時玩家狀態更新等場景，與AI分佈式訓練中參數同步的底層邏輯類似，AI領域的研發與遊戲屆研發一直都是互補的關係，像2012年誰也沒想到英偉達顯卡+CUDA成爲打開ImageNet神經網絡的關鍵鑰匙。技術的歷史總是螺旋上升，而跨界火花的迸發往往在不經意間改寫行業規則，甚至改變整個世界。

KVCache客戶端讀取吞吐量

03 什麼是“小水池”？

第二個項目SmallPond直譯就是小水池，DeepSeek開發並開源的一個輕量級數據處理框架，專爲高效處理大規模數據而設計，簡單來說，SmallPond 是一個能幫你快速加載、處理和保存數據的“神器”，特別適合 AI 相關的任務，比如數據預處理、模型訓練時的加載和保存，以及推理時的優化，DeepSeek取名小水池是希望讓數據處理像用水一樣簡單。

SmallPond 基於 3FS 文件系統和 DuckDB（一個高效的嵌入式數據庫引擎）構建，主打輕量級，不需要複雜的後臺服務，想用就啓動，用完就關閉，使用起來非常靈活，在一個由 50 個計算節點和 25 個存儲節點組成的集羣上，SmallPond 能在 30 分鐘內完成 110.5 TiB 的排序任務，平均每分鐘處理 3.66 TiB 的數據。

這種“閃電俠”般的速度，得益於 SmallPond 與 3FS 文件系統的高效集成，能夠充分利用 3FS 的高速數據訪問能力。儘管爲AI而生，SmallPond的輕量化特性也有機會在其他領域大施拳腳，比如遊戲開發需要實時加載4K材質庫，開放世界地圖需要動態流式加載，這些都很依賴數據加載速度。

04 收官日的創新點

今天是DeepSeek開源周的最後一天，3FS文件系統和Smallpond數據處理框架，延續了DeepSeek一貫的務實風格，專注於解決AI訓練和推理中的實際問題，而不是追求花哨的噱頭，今天另一個新聞是OpenAI發佈了殘血版的GPT-4.5，主打情商問答，無推理功能，首發還閹割，在社區直接成了大家玩梗的對象，技術是藏着掖着，連性能都沒辦法一口氣釋放出來，完全沒有當年GPT-3.5發佈時天下第一的氣勢。

當然，缺點就是DeepSeek連續五天的代碼庫越來越硬核，熱度其實越來越低，這幾天雷軍全網刷屏，營銷號熱度都轉向雷軍了。但是DS在業界內已經把活菩薩的人設立住了，無論是3FS的高速數據存取，還是Smallpond的輕量級處理能力，DeepSeek都提供了詳細的文章和代碼，在社區內積極解答問題，沒有一點神祕感，這種透明和務實的態度，不僅贏得了社區的尊重，也推動了AI技術的實際進步。

相比OpenAI的營銷導向，DeepSeek五天的項目可以說沒有任何炫目的噱頭，而是通過技術積累和對問題的深刻理解，展現了DeepSeek在AI領域的領先地位。相比OpenAI的營銷導向，DeepSeek的務實精神顯得尤爲可貴，也讓人更加期待他們在未來的表現，當前DeepSeek-R1的餘溫尚未消散，多方信息透露DeepSeek-R2將在不久的未來發布，屆時很有可能打出多模態+技術開源的組合拳，逼迫OpenAI、微軟、谷歌、Meta這些巨頭一起卷，如今AI競爭可能不僅僅是算力軍備競賽，更是創新性的效率革命，誰能手握創新的鑰匙，誰就能笑到最後。