高中禁止補課?威聯通NAS部署AI教輔知識庫,發揮滿血DeepSeek算力

近段時間以來,"高中禁止補課"的浪潮席捲全國。有些家長嘴上說着支持減負,心裏卻難免要犯嘀咕,沒了補習班,那孩子作業遇到難題怎麼辦?

全靠家長輔導?那別說微積分了,光是歷史年份和化學週期表,都沒準能把一些家長逼得啞口無言。

雖然我家孩子還小,不過可有不少同事遇到了這個問題,平時在單位聊天時也沒少討論。

作爲10年NAS老玩家,家裏NAS都有好幾臺,我自然而然想到了一個曲線救國的思路——

能否利用NAS在本地存儲教輔資料,再配合頂尖大模型DeepSeek-R1-671B滿血版的強悍推理能力,打造一臺24小時在線的智能家教?

這樣二者配合,就能同時解決NAS算力不夠強,以及AI大模型容易出現幻覺的問題。就算比不上真人教師的輔導水平,但再怎麼說也能幫忙做個查缺補漏、提煉思路的活兒不是?

於是乎最近仔細研究了一番,摸索出了這套AI教輔知識庫的具體部署方案,今天就以我手頭這臺威聯通(QNAP)TS-464C2爲例,爲大家演示詳細的操作步驟:

一、Dify是什麼?

這套本地AI知識庫的部署思路,是以威聯通NAS上安裝的Dify爲核心的。這款軟件是目前特別火的開源 LLM 應用開發平臺,目前在GitHub上已經有了8萬多顆星:

Dify的主要特色是界面非常直觀,並且功能很強,結合了AI工作流、RAG檢索、Agent 智能體、模型管理等功能,無縫集成了幾十家AI算力提供商的對接方式,可以輕鬆構建生成式AI應用,易用性極佳。

二、威聯通NAS部署Dify詳細流程

1.下載Dify代碼包

Dify在NAS端的安裝方式與普通的拉取方式不太一樣,需要首先去GitHub頁面中克隆代碼庫。

考慮到國內特有的網絡環境,這裏比較推薦大家直接用PC瀏覽器下載代碼壓縮包,然後解壓縮進行後續操作。

如下圖所示,進入Dify的代碼界面後,直接點擊綠色的“Code"按鈕,然後選擇Download ZIP即可將代碼包下載到電腦上。

解壓縮後如下圖所示,我們直接進入docker文件夾進行後續操作。

2.修改環境變量

進入docker文件夾,我們需要將下圖中的.env.example文件移除.example後綴,重新命名爲.env,然後使用記事本或者NotePad++之類的軟件將其打開。

這裏我圖省事兒,直接用記事本將其打開,接下來我們需要修改幾個設置項。

首先搜索UPLOAD_FILE關鍵字,找到下圖中的UPLOAD_FILE_SIZE_LIMIT和UPLOAD_FILE_BATCH_LIMIT參數。

UPLOAD_FILE_SIZE_LIMIT參數表示單次上傳的文件大小,默認只有15MB,這裏我們將其修改爲1500,這樣就很充裕了。

UPLOAD_FILE_BATCH_LIMIT參數表示單次可以批量上傳的文件數量,默認爲5個,這裏大家根據自己需求選擇即可,我是設置爲50個。

接下來,搜索“BODY_SIZE"關鍵字,找到NGINX_CLIENT_MAX_BODY_SIZE參數,這是Dify允許上傳保存的文件總大小,默認只有15MB,太小了,這裏隨手給它多加幾個0即可:

接着,繼續搜索“******_NGINX_PORT"關鍵字,下圖紅框圈出的兩個參數,分別代表反向代理後,我們訪問Dify的端口。

默認情況下,http的訪問端口是80,https的訪問端口是443,這倆端口都太敏感了,不建議使用,最好能根據個人需求修改掉。比如我自己就將二者分別修改爲了8080和8443.

爲了避免等會兒部署時候出現差錯,這裏最好在dify-main/docker/volumes中再手動創建一些文件夾,分別是:

  • 1.db/data

  • 2.redis/data

  • 3.weaviate

  • 4.app/storage

  • 5.certbot/conf/live

  • 6.certbot/www

3.威聯通NAS部署Dify

將.env文件修改保存,並且新建幾個文件夾後,接下來我們就將Dify代碼庫下的整個docker文件上傳至NAS裏,例如我就按照習慣將其上傳到了威聯通TS-464C2的Container文件夾中,並將其重新命名爲dify。

由於Dify的部署過程會拉取至少8個docker映像,而現在國內是不方便正常訪問docker hub的,所以最好提前在威聯通的Container Station中提前設置一下docker鏡像加速服務器(相關教程可以參考NAS領域大佬@羊刀仙的文章,講解的非常詳細):

然後在NAS的控制檯——網絡和文件服務——Telnet/SSH頁面中,臨時啓用NAS的SSH功能:

接着,我們使用putty之類的SSH工具登錄NAS的局域網IP地址,輸入用戶名和密碼,再使用CD命令進入我們剛纔上傳的docker文件夾:

使用ls命令確認一下文件夾無誤後,我們直接輸入docker compose up -d命令,自動部署Dify。

在拉取好幾個鏡像之後,回到威聯通的Container Station中,可以看到若干運行着的容器:

至此,不出意外的話,Dify已經在NAS上部署完成了,接下來咱們就來看看如何使用Dify利用本地資料,配合DeepSeek-R1的API搭建本地知識庫。

三、如何使用Dify

還記得我們剛纔在.env文件中配置的******_NGINX_PORT參數嘛?這就是我們用來訪問Dify的端口了。

比如我將其設置爲了8080,然後NAS的局域網地址是192.168.10.55,這時候就可以用下面的網址進入Dify:

http://192.168.10.55:8080

首次登錄Dify時,會要求我們自行設定郵箱、用戶名和密碼,這也是之後我們進入管理頁面的憑據。

首先咱們得點擊右上角進入設置選項,來設置一下系統使用的AI模型。由於Dify集成了許多在線API服務預設,這就讓我們的配置過程相當方便了。稍微往下拉一拉,我們在安裝模型供應商這裏,選擇安裝深度求索或者硅基流動。

如果大家只是用Dify進行AI模型對話的話,那使用深度求索官方的API服務效果最好。

不過由於我們在部署知識庫的過程中還需要對上傳的文件進行Embedding(嵌入)向量化處理,這個過程中不僅需要DeepSeek-R1,還需要專門的嵌入式模型,所以就使用了可以同時提供多個模型算力的硅基流動。

使用方式也很簡單,將我們在硅基流動中生成的API粘貼到下圖中的框裏就可以了:

粘貼API後,就可以設置系統默認的模型了。推理模型我習慣用Pro開頭付費版的DeepSeek-R1,要比免費版的效果好得多,然後Embedding(嵌入式)模型和Rerank(重排序)模型分別選了支持8K的BAAI/bge-m3和BAAI/bge-reranker-v2-m3。另外這裏也不用看到付費倆字就擔心,我充值至今1個多月了,沒事兒就用DeepSeek聊天,到現在好像才花了六七塊錢的Token。

接下來我們回到Dify主頁面,點擊上方中央的“知識庫”按鈕,開始搭建本地知識庫。Dify的知識庫來源可以是本地的TXT、PDF、DOCX等文件,也可以是在線網頁的內容,這裏我就以官方的電子版高中歷史教材爲例,批量上傳5個文件。

點擊“下一步”後,進入文本分段與清洗設置頁,這裏個人比較推薦選擇高質量的索引方式:

再往下拉,建議使用效果更好的混合檢索方式,最後點擊保存:

靜靜等待上傳的文件都完成檢索後,就可以對其進行調用了。

使用知識庫的方法也很簡單,我們在Dify的主頁首先選擇新建一個智能助手:根據下圖箭頭的提示,添加剛纔建立的知識庫、確認推理模型是否正確,再點擊發布更新:

然後在Dify主頁左側的工作區就能看到它了,接下來選擇開啓新對話,就能根據我們知識庫中已有的數據,結合DeepSeek-R1強大的思考能力,來回答學習中的問題了:

這裏簡單嘗試了一下,提問美國獨立戰爭發生的背景和結果,回答得還是挺像樣的:

其實Dify的功能還有很多很多,不過限於篇幅,本次就先簡單介紹到這裏了。大家用威聯通NAS部署後,還能再多多自行摸索研究,真的能大大提高學習和工作的效率。

最後需要多說一句,使用Dify搭建知識庫時要切記一點,Dify似乎並沒有像RAGFLOW一樣集成OCR功能,所以用來搭建知識庫的數據最好原始就是文字版,或者通過OCR數據清洗後,以便AI模型能夠正常調用。

所以如果是搭建教輔知識庫的話,個人建議還是儘量去下載官方原版的電子文件,以中小學教材爲例,包括配圖中的文字都能夠選擇,數據質量極高,而且這些電子教材資源可以在一些公衆號裏獲取下載鏈接,善用百度的話其實並不難找。

總結

目前在傳統NAS領域,基本上就是威聯通和羣暉這兩家臺企大廠在左右互搏,華碩(愛速特)雖然也算臺系NAS御三家之一,不過市佔率還是照着兩位大哥差了一些。

相較而言,羣暉是老牌大廠,由於黑羣暉培養了大批隨時可能轉正的潛在用戶羣,所以即便價格昂貴,但是市佔率還是更高。不過羣暉的問題在於硬件配置方面一直擠牙膏,在2025年的新機還在使用J4125處理器,這你敢信?頗有種讓人哭笑不得的感覺。

而威聯通在性價比方面則明顯更勝一籌,同配置、性能下,威聯通的機型往往能比羣暉便宜幾百上千元。雖然QTS系統的操作確實略有些繁複,但該有的專業功能都能提供,習慣了之後也沒啥不好的。

像我這臺威聯通TS-464C2,採用了Intel N5095 四核四線程處理器+8GB內存的配置,4+2盤位的足夠家庭和小工作室使用,相較前代產品還升級了可擴展內存插槽和鎖止硬盤位,售價只有2000元出頭,算是性價比相當相當高了,日常要推薦一波。

而具體到AI時代的應用來說,個人感覺NAS這種設備一般要7x24h運行,用來配合各種AI大模型搭建隨時待命的智能服務,是最適合不過了。

就比如今天爲大家分享這套方案,通過NAS本地大容量存儲功能特性,配合在線的AI大模型API運算力,就是非常典型的優勢互補案例,同時調用算力的成本基本也是白菜價。

而且我們放寬思路,利用NAS,不僅僅可以用來輔導孩子學習,還可以搭建烹飪、養生、甚至工作資料等等各種知識庫,這些都能大大提高我們的生活質量和工作效率,應用場景是真的廣闊。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com