DeepSeek繼2025年1月20日發(fā)布DeepSeek-R1引發(fā)業(yè)內(nèi)對(duì)開源AI的廣泛關(guān)注和熱烈討論后,又將2月最后一周作為開源周“連放大招”,公開V3/R1的核心代碼和系統(tǒng)架構(gòu)等重磅內(nèi)容。在全球開發(fā)者驚嘆并對(duì)DeepSeek下一代模型充滿期待的同時(shí),業(yè)界也出現(xiàn)了對(duì)開源AI如何保持競(jìng)爭(zhēng)力、如何推進(jìn)商業(yè)化等的擔(dān)憂或質(zhì)疑。本文嘗試通過(guò)理清與分析開源AI的定義、意義和商業(yè)模式等,解答上述問(wèn)題。
開源AI定義與DeepSeek開放程度
AI模型有別于傳統(tǒng)軟件,其不僅包括代碼,還涉及數(shù)據(jù)、參數(shù)和權(quán)重等,因此開源AI的定義并不像開源軟件般清晰,目前尚未形成統(tǒng)一認(rèn)知。不過(guò),LF AI&DATA 基金會(huì)1和開源倡議組織(OSI)2024年陸續(xù)提出了模型開放性框架(MOF)和開源AI定義(OSAID)1.0,為DeepSeek等是否屬于開源AI提供參考。
1.依據(jù)MOF,DeepSeek-V3/R1尚未達(dá)到最開放層級(jí)
模型開放性框架(MOF)由LF AI&DATA 基金會(huì)于2024年4月發(fā)布,用于客觀評(píng)估和分類機(jī)器學(xué)習(xí)模型的完整性和開放性。
MOF定義了Ⅲ、Ⅱ、Ⅰ等三個(gè)開放范圍逐步擴(kuò)展的層級(jí)。Ⅲ級(jí)-開放模型要求開放模型架構(gòu)、參數(shù)、技術(shù)報(bào)告等組件,幫助用戶使用、分析和構(gòu)建模型,但限制了用戶對(duì)開發(fā)過(guò)程的深入了解。Ⅱ級(jí)-開放工具要求在Ⅲ級(jí)的基礎(chǔ)上,開放訓(xùn)練和推理代碼等,幫助開發(fā)者更深入地理解模型工作原理,以及將模型部署至不同的環(huán)境和應(yīng)用。Ⅰ級(jí)-開放科學(xué)要求在Ⅱ級(jí)的基礎(chǔ)上,開放數(shù)據(jù)集和研究論文等,確保研究者能夠完全訪問(wèn)和復(fù)現(xiàn)AI模型的各個(gè)方面。目前,智源Aquila-VL-2B模型已通過(guò)MOF評(píng)估I級(jí)。
DeepSeek-V3/R1開放了模型參數(shù)、技術(shù)報(bào)告、部分訓(xùn)練和推理代碼等,大致處于MOF的Ⅱ級(jí),能夠良好地滿足使用者和開發(fā)者的需求,但距離“最開放”仍有空間。
表1 MOF分級(jí)與DeepSeek-V3/R1開放情況

注:根據(jù)公開信息整理,供參考。
2. 依據(jù)OSAID 1.0,DeepSeek-V3/R1尚不屬于開源AI
開源AI定義(OSAID)1.0是由OSI于2024年10月提出的全球首個(gè)開源AI標(biāo)準(zhǔn),要求開源AI 必須提供完整的源代碼、模型參數(shù)信息和訓(xùn)練數(shù)據(jù)信息等三個(gè)關(guān)鍵組成部分。其中,對(duì)于訓(xùn)練數(shù)據(jù)信息,不要求提供數(shù)據(jù)集本身,但要求提供數(shù)據(jù)來(lái)源和出處、數(shù)據(jù)處理方法、如何獲取或許可這些數(shù)據(jù)以及確保具備相關(guān)技能的人能夠使用相同或類似的數(shù)據(jù)重建出實(shí)質(zhì)等效的系統(tǒng)。
同時(shí),OSAID 1.0要求開源 AI 必須保證用戶擁有“可以出于任何目的使用該 AI 模型、無(wú)需征得許可即可修改模型、可以自由地研究系統(tǒng)的工作原理、可以自由分享和傳播”等四項(xiàng)權(quán)利。
根據(jù)上述定義,對(duì)于三個(gè)關(guān)鍵組成部分,DeepSeek-V3/R1已開放模型參數(shù)信息和核心代碼,基本未開放訓(xùn)練數(shù)據(jù)信息,因此尚不能稱為開源AI。對(duì)于用戶權(quán)利,DeepSeek-R1代碼和模型開源采用“非常寬松”的MIT協(xié)議,允許用戶自由使用、修改、復(fù)制、分發(fā)和進(jìn)行商業(yè)活動(dòng),滿足OSAID 1.0要求;DeepSeek-V3代碼開源采用MIT協(xié)議,模型開源采用基于OpenRAIL2自建的DeepSeek許可證,從負(fù)責(zé)任的角度會(huì)對(duì)用戶行為進(jìn)行一定約束,或與“出于任何目的使用該 AI 模型”相悖。
此外,Llama、Stable Diffusion、Mistral等以開源宣傳自己的模型亦因未公開訓(xùn)練數(shù)據(jù)信息、限制商業(yè)用途等被OSAID 1.0排除在開源AI之外。
開源AI意義與DeepSeek競(jìng)爭(zhēng)力
盡管依據(jù)開源AI定義,DeepSeek不能算做完全意義上的開源,但從開發(fā)者與企業(yè)的實(shí)際反應(yīng)來(lái)看,其已充分詮釋“以共享促創(chuàng)新”的開源精神,仍可視為現(xiàn)階段開源AI的代表。
1.開源是“做大蛋糕”的重要手段
高透明度且易于獲取的開源軟件有助于降低企業(yè)認(rèn)知、采購(gòu)、使用和管理IT技術(shù)的成本。根據(jù)交易成本理論,企業(yè)更傾向于選擇交易成本低的技術(shù),為通過(guò)開源推進(jìn)技術(shù)普及奠定了經(jīng)濟(jì)學(xué)基礎(chǔ)。DeepSeek迅速滲入金融、醫(yī)療、能源等各個(gè)行業(yè)的盛況,則充分證實(shí)了這項(xiàng)理論。因此,開源可帶動(dòng)市場(chǎng)整體規(guī)模擴(kuò)張,并讓貢獻(xiàn)者有機(jī)會(huì)分得更大蛋糕。
2.生態(tài)和信任是DeepSeek等開源AI的競(jìng)爭(zhēng)力
DeepSeek開放模型參數(shù)與技術(shù)報(bào)告等后掀起全球復(fù)現(xiàn)熱潮,如伯克利團(tuán)隊(duì)30美元成本復(fù)刻R1-Zero、港科大團(tuán)隊(duì)使用8K樣本在7B模型上復(fù)刻R1/R1-Zero等,并均取得不俗效果,說(shuō)明AI模型即使僅開放模型,已存在被迅速追平的可能,進(jìn)一步開放代碼和數(shù)據(jù)等將削弱更多先發(fā)優(yōu)勢(shì)。
不過(guò),開源從生態(tài)和信任等方面為貢獻(xiàn)者帶來(lái)新的競(jìng)爭(zhēng)優(yōu)勢(shì)。一是可借助外部力量加速迭代與創(chuàng)新;二是有助于品牌傳播和形象提升,進(jìn)而吸引更多用戶和人才,如微軟2014年起開源開發(fā)環(huán)境.NET“籠絡(luò)”開發(fā)者,為其云業(yè)務(wù)推廣創(chuàng)造有利條件;三是高透明度更易贏得市場(chǎng)信任,特別是AI大模型作為以數(shù)據(jù)驅(qū)動(dòng)的復(fù)雜黑盒模型,安全問(wèn)題是客戶主要顧慮之一,通過(guò)開源幫助客戶理解模型內(nèi)部機(jī)制可在一定程度上緩解擔(dān)憂。
開源AI商業(yè)模式
開源AI的商業(yè)模式與同樣推崇共享的互聯(lián)網(wǎng)類似,即流量變現(xiàn)。
1.產(chǎn)品層面的“流量變現(xiàn)”:以廣告和增值服務(wù)為主
廣告是開源項(xiàng)目獲取收入最直接的方式。知名開源前端框架Vue在官網(wǎng)、說(shuō)明文檔和社交媒體賬號(hào)中為各級(jí)贊助商提供廣告位,贊助商級(jí)別越高,廣告位越醒目。如鉑金贊助商(2000美元/月)可獲Vue官網(wǎng)首頁(yè)和側(cè)邊欄、以及發(fā)布于GitHub的說(shuō)明文檔中的明顯logo展示位;金牌贊助商(500美元/月)可獲Vue官網(wǎng)首頁(yè)和GitHub說(shuō)明文檔中的大號(hào)logo展示位。
增值服務(wù)為開源項(xiàng)目提供更為豐富的變現(xiàn)方法。一是“+技術(shù)服務(wù)”。例如,紅帽贊助Linux操作系統(tǒng)開源項(xiàng)目fedora,并在fedora經(jīng)廣泛驗(yàn)證后選取適合企業(yè)與商業(yè)用戶的部分附加技術(shù)支持形成商業(yè)版RHEL;谷歌開源容器管理工具Kubernetes后推出Kubernetes托管服務(wù)GKE;HuggingFace作為開源AI平臺(tái),在免費(fèi)提供模型和數(shù)據(jù)等的同時(shí),也提供數(shù)據(jù)托管、API調(diào)用和模型定制等收費(fèi)服務(wù)。二是“+付費(fèi)組件”。例如,谷歌開源Android,但將Android與收取授權(quán)費(fèi)用的谷歌移動(dòng)服務(wù)(GMS)綁定。
目前,DeepSeek除了開源V3/R1等一系列模型,對(duì)V3/R1也按token消耗量收取API調(diào)用費(fèi),即已通過(guò)“+技術(shù)服務(wù)”變現(xiàn),未來(lái)可能拓展出廣告、會(huì)員、高級(jí)功能等更多收費(fèi)方式。
2. 公司層面的“流量變現(xiàn)”:提高估值
隨AI模型逐漸成為新一代基礎(chǔ)軟件,其公司的估值方式可借鑒互聯(lián)網(wǎng)平臺(tái)公司,將用戶規(guī)模、用戶增速和獲客成本等作為核心依據(jù)。開源可有效促進(jìn)用戶規(guī)模增長(zhǎng)及獲客成本降低,進(jìn)而提振估值。Databricks通過(guò)開源大數(shù)據(jù)處理引擎Spark迅速打響品牌,之后又陸續(xù)貢獻(xiàn)Delta Lake和MLflow等著名開源項(xiàng)目,2024年以620億美元的估值成為全球估值最高的非上市大數(shù)據(jù)公司;DeepSeek-R1開源并出圈后,DeepSeek公司估值中位數(shù)已達(dá)數(shù)百億美元,最高估值甚至達(dá)到1500億美元。
對(duì)運(yùn)營(yíng)商的建議
面向開源AI新趨勢(shì),建議運(yùn)營(yíng)商主動(dòng)擁抱,加強(qiáng)企業(yè)戰(zhàn)新規(guī)劃與開源的銜接,以重點(diǎn)專項(xiàng)為牽引,深化對(duì)開源AI的持續(xù)跟蹤,強(qiáng)化工具集研發(fā)、軟硬協(xié)同優(yōu)化等自主創(chuàng)新,細(xì)化標(biāo)桿企業(yè)案例研究,如谷歌生來(lái)具備開源基因并持續(xù)貢獻(xiàn)、紅帽依托開源構(gòu)筑商業(yè)閉環(huán)成長(zhǎng)壯大、微軟及時(shí)調(diào)整“與開源為敵”的態(tài)度成功轉(zhuǎn)型等,探索與推進(jìn)適合自身業(yè)務(wù)與能力的開源AI商業(yè)模式。