爲什麼DeepSeek必須開源

OpenAI遠未過時,DeepSeek依舊任重道遠

現在大家應該都聽說過DeepSeek了。它是那個訓練出R1開源推理模型的中國AI實驗室,R1的表現與OpenAI的o1不相上下,但它是用較爲普通的硬件,以極低的成本完成訓練的

DeepSeek之所以能夠做到這一點,是因爲它採用了一種創新的訓練方法,比OpenAI、Anthropic以及其他資金雄厚的競爭者使用的訓練方式更高效。那麼,爲什麼DeepSeek會選擇開源呢?

從表面上看,這似乎違背了所有商業課本中教的常識:如果你通過創新打造了一個市場領先的產品,而且成本低廉,你應該利用這一優勢進行盈利。至少可口可樂不會把自己的配方開源,對吧?

但在大型語言模型(LLM)的世界裏,這種做法並不罕見。現在看來,DeepSeek幾乎必須選擇開源,隨着時間的推移,開源模型將變得越來越主流。

爲什麼DeepSeek必須開源

DeepSeek的情況十分特殊。作爲一家中國公司,它可能讓一些企業在與其合作時感到不安,尤其是在涉及一些User Data時,更別提需要遵守HIPAA或SOC2認證的情況了。

總之,中國的AI在西方市場可能會受到懷疑,但開源模型則能立刻建立相互之間的信任。通過託管或者使用像Together AI這樣的AI供應商提供的開源模型,就可以完美化解上述問題。

同時也是爲了在西方市場站穩腳跟,DeepSeek不得不將其模型開源。但這不僅僅是一個經濟決策,它也是一種文化決策。用最近比較流行的一句話來說:“開源不僅僅是一種技術行爲,它也是一種文化行爲。”

開源公司(至少在初期)必須做到以小博大。正是因爲DeepSeek必須面對出口控制問題,無法使用像Nvidia H100和GB10等先進芯片,它纔不得不找到更高效的訓練模型的方式。

OpenAI、Meta、Google等公司擁有數十億美元的資金、龐大的計算資源和世界級的分發渠道。它們不需要尋找更高效的模型訓練方式,因爲它們的昂貴解決方案就是唯一選擇。事實上,如果能夠讓LLM的構建更容易且更便宜,這反而會削弱它們的競爭優勢。

然而,這一切已經發生了變化。

模型的商品化

現在幾乎每週都有新發布的GPT-4級別的LLM。我在使用的AI應用中,根本分不清我到底是在使用LLaMa、GPT、Claude還是Mistral模型。從我的個人經驗和基準測試來看,它們的表現幾乎不相上下。

OpenAI依舊是行業的領導者。它們是首個發佈推理模型的公司,也是首個發佈GPT-4的公司。但如今,模型正在逐漸商品化,值得思考的是,是否值得爲OpenAI API支付高額費用,尤其是在開源模型已經有了很好的表現時。

DeepSeek或許就是這個現象最典型的例子。OpenAI的o1每百萬輸出標記收費60美元,而DeepSeek的R1通過Together AI平臺,每百萬輸出標記僅需7美元。

如果最終用戶根本無法察覺兩者的差異,那爲什麼要付出更多呢?尤其在基礎設施領域,這一點尤爲重要。

基礎設施領域,開源最終勝出

使用開源和專有軟件之間往往存在一個權衡:開源軟件便宜且更具可定製性,但由於需要自己維護,它會佔用更多資源,並且需要一定的技術知識。而專有軟件則更貴,但提供了更順暢(儘管更僵化)的體驗。

對於很多產品類別來說,這種權衡並不值得大多數公司去做。你不想因爲自託管的Notion替代品出現故障而丟失所有的知識庫。

然而,基礎設施總是定製的,它始終需要你的參與。即便是專有的Oracle數據庫,也需要大量的工作來設置和維護。這也是爲什麼開源數據庫越來越受歡迎的原因。

專有軟件的優勢(不需要維護、不需要技術知識等)在基礎設施領域的作用遠不如其它領域。實際上,情況正好相反:越是技術性強的產品,越適合用戶(工程師)使用開源軟件,因爲他們可以審覈代碼庫。

這也是我們選擇將Lago作爲開源公司構建的原因。我們知道,無論你是自己構建,還是選擇供應商,計費系統都會變得非常複雜,工程師們更傾向於使用Lago。

LLM也一樣。要構建任何有用的產品,你無論如何都要進行大量的定製化提示和工程調整,那不如選擇DeepSeek的R1,而不是OpenAI的o1。

這也是爲什麼開源基礎設施公司那麼多,而開源消費品公司幾乎沒有成功的原因。

但這意味着專有AI已經結束了嗎?

OpenAI遠未過時

關於DeepSeek的R1或其他開源模型會讓OpenAI過時的說法,完全不準確。首先,OpenAI一直是市場的領先者,無論是在LLM(如GPT-4)還是推理模型(如o1)上。

沒有OpenAI的模型,就沒有DeepSeek的R1和許多其他模型(因爲LLM的蒸餾技術)。這確實引發了一個問題,那就是,如果你提供了突破性的技術,而其他公司以更低的價格推出類似的產品,那麼構建新的前沿模型是否仍然值得呢

不過,R1也可能會促使那些資金雄厚的老牌公司重新審視自身的效率,並推動他們尋找更高效的方式,當他們同時擁有效率和世界一流的資源時,其創造性價值將會是難以估量的。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com