4月1日,在2025賽迪論壇創(chuàng)新驅(qū)動分論壇上,哈爾濱工業(yè)大學(xué)商學(xué)院教授、香港中文大學(xué)(深圳)深圳數(shù)據(jù)經(jīng)濟(jì)研究院客座教授馬濤發(fā)表了《DeepSeek技術(shù)路線與創(chuàng)新淺析》的主題演講,深入探討DeepSeek的技術(shù)創(chuàng)新與能力,分析其在AI領(lǐng)域的最新進(jìn)展及對產(chǎn)業(yè)的影響。
DeepSeek作為國內(nèi)領(lǐng)先的人工智能模型,其技術(shù)創(chuàng)新得到了業(yè)內(nèi)廣泛關(guān)注。根據(jù)DROP、FRAMES、LongBench v2等多項(xiàng)測評結(jié)果,DeepSeek-V3準(zhǔn)確率和響應(yīng)速度均優(yōu)于GPT-4o和Claude-3.5-Sonnet,這是國內(nèi)大模型技術(shù)第一次在綜合能力上達(dá)到國際領(lǐng)先水平。
同時,DeepSeek在處理數(shù)學(xué)、工具使用、指令遵循等復(fù)雜邏輯推理任務(wù)時,表現(xiàn)出更強(qiáng)的理解能力和推理能力。這意味著,中國的技術(shù)仍在持續(xù)進(jìn)化,能夠應(yīng)對更多復(fù)雜的任務(wù)。
增強(qiáng)AI領(lǐng)域的國際話語權(quán)
DeepSeek目前已經(jīng)形成了多種類型的大型模型,包括通用模型(DeepSeek V3)、復(fù)雜推理模型(DeepSeek R1)等。特別是在復(fù)雜推理任務(wù)上,DeepSeek R1首次公開了深度思考模型的訓(xùn)練過程。其在數(shù)學(xué)、代碼和推理任務(wù)上的表現(xiàn)可以與OpenAI的o1模型相媲美,這標(biāo)志著我國在復(fù)雜推理模型的研發(fā)上取得了巨大進(jìn)展。
馬濤表示,國內(nèi)復(fù)雜推理模型進(jìn)展迅速,迅速追趕國外TOP模型,但在綜合能力上仍有差距,尤其OpenAI發(fā)布的o1-preview,在復(fù)雜問題的求解能力上名列前茅,國內(nèi)大模型在中文問題上的表現(xiàn)優(yōu)勢并不明顯。
馬濤指出,DeepSeek在模型架構(gòu)和訓(xùn)練方法上進(jìn)行了多個創(chuàng)新。首先,通過優(yōu)化模型架構(gòu)顯著降低大模型訓(xùn)練和推理的成本。此外,DeepSeek還采用了混合精度訓(xùn)練(FP8 Training),并引入了群體相關(guān)的策略優(yōu)化算法(GRPO),這使得大模型的訓(xùn)練更加高效。
在計算平臺的優(yōu)化方面,DeepSeek實(shí)現(xiàn)了任務(wù)級分時調(diào)度共享AI算力,支持在上千個計算節(jié)點(diǎn)上穩(wěn)定運(yùn)行,且日常算力占用率超過95%。通過這種方式,DeepSeek能夠根據(jù)資源需求和集群狀態(tài)進(jìn)行動態(tài)管理,以確保計算平臺的高效利用。
開源策略是DeepSeek技術(shù)發(fā)展的一個重要支撐。通過開源,DeepSeek不僅加速了技術(shù)創(chuàng)新,還有效推動了AI技術(shù)標(biāo)準(zhǔn)的落地。2024年,DeepSeek R1的開源模型受到了全球開發(fā)者的廣泛關(guān)注,GitHub數(shù)據(jù)表明,DeepSeek R1的開源熱度居高不下,吸引了大量開發(fā)者的參與。
值得一提的是,DeepSeek通過開源的方式,不僅促進(jìn)了AI生態(tài)的成熟化發(fā)展,還有效降低了研發(fā)門檻,推動了大模型的快速應(yīng)用落地。許多海外AI芯片企業(yè)和云服務(wù)商(如亞馬遜云和微軟Azure)紛紛宣布支持DeepSeek R1模型,進(jìn)一步增強(qiáng)了其在全球AI領(lǐng)域的話語權(quán)。
推動AI產(chǎn)業(yè)的多元化發(fā)展
DeepSeek的技術(shù)不僅影響了國內(nèi)AI產(chǎn)業(yè)的發(fā)展,還在全球范圍內(nèi)產(chǎn)生了深遠(yuǎn)的影響。截至2025年2月,DeepSeek的全球累計下載量已經(jīng)接近4000萬次,位居全球各大AI模型前列。相比之下,ChatGPT的下載量為4100萬,而豆包的下載量約為570萬。更令人驚訝的是,DeepSeek在發(fā)布20天內(nèi)就超越了包括ChatGPT和豆包在內(nèi)的多個AI助手,成功登頂中美免費(fèi)APP下載排行榜。
馬濤提到,隨著DeepSeek在各類平臺的廣泛應(yīng)用,它已經(jīng)成為了一個公共品,為全球開發(fā)者提供了強(qiáng)大的技術(shù)支持。許多國內(nèi)外企業(yè)紛紛接入并支持DeepSeek作為其AI技術(shù)的核心。通過大模型的應(yīng)用,企業(yè)能夠提升自身產(chǎn)品的智能能力,推動技術(shù)創(chuàng)新。
隨著AI技術(shù)的快速發(fā)展,市場對于大模型的需求日益增長,特別是在企業(yè)數(shù)據(jù)隱私和安全的背景下,DeepSeek也在推動私有化部署的趨勢。超過35家大型企業(yè)和技術(shù)公司(如華為、百度)紛紛發(fā)布了DeepSeek的一體機(jī)產(chǎn)品,推動了大模型在醫(yī)療、金融、教育等多個行業(yè)的深度應(yīng)用。
在全球范圍內(nèi),DeepSeek正在通過技術(shù)創(chuàng)新推動AI產(chǎn)業(yè)的多元化發(fā)展。盡管美國在基礎(chǔ)研究、芯片設(shè)計和頂尖人才數(shù)量上仍占據(jù)優(yōu)勢地位,但我國在部分領(lǐng)域,尤其是在大模型技術(shù)和應(yīng)用方面,已經(jīng)實(shí)現(xiàn)了超越。
馬濤表示,DeepSeek的成功證明了我國在全球AI格局中逐漸占據(jù)了重要的位置。未來,我們應(yīng)該持續(xù)推動技術(shù)創(chuàng)新,強(qiáng)化產(chǎn)業(yè)鏈的合作,以實(shí)現(xiàn)我國在全球AI領(lǐng)域的技術(shù)領(lǐng)先地位。盡管目前DeepSeek在大模型技術(shù)上取得了顯著進(jìn)展,但實(shí)現(xiàn)AGI(通用人工智能)和ASI(超人工智能)的目標(biāo)仍需要更多的技術(shù)創(chuàng)新。未來,隨著DeepSeek不斷推動開源生態(tài)和技術(shù)標(biāo)準(zhǔn)的制定,AI行業(yè)將迎來更多的創(chuàng)新突破。