DeepSeek
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,中文簡稱為深度求索,是一家專注于先進大語言模型(LLM)及相關技術研發的試驗與發展型企業。該公司由量化資管領域的知名巨頭幻方量化于2023年7月17日創立,注冊地位于浙江省杭州市拱墅區環城北路169號匯金國際大廈西1幢1201室,法定代表人為裴湉。
2024年1月5日,DeepSeek正式推出了其首個大型模型——DeepSeek LLM。同年5月,該公司宣布開源第二代MoE大模型DeepSeek-V2,憑借其卓越的性能與親民的價格,DeepSeek贏得了“AI界拼多多”的綽號。12月26日,DeepSeek宣布DeepSeek-V3模型的首個版本正式上線并同步開源。
進入2025年,DeepSeek于1月20日正式發布了DeepSeek-R1模型,該模型在性能上與OpenAI的GPT-1正式版不相上下。1月31日,DeepSeek R1 671b作為英偉達NIM微服務的預覽版在build.nvidia.com平臺上發布。2月,DeepSeek-R1、V3、Coder等系列模型相繼上線國家超算互聯網平臺。同時,DeepSeek的日活躍用戶數于2月1日突破3000萬大關,創下了達成這一里程碑的最快記錄。
截至2025年2月2日,DeepSeek已攀升至140個國家蘋果App Store下載排行榜的首位,并在美國的Android Play Store中也位居榜首。截至2月9日,DeepSeek App的累計下載量已超過1.1億次,周活躍用戶規模最高接近9700萬。2月21日,DeepSeek宣布將陸續開源5個代碼庫。2月26日,該公司開源了DeepGEMM。次日,DeepSeek發布了其“開源周”第四日的內容,即優化的并行策略。據IndiaTimes于3月31日報道,DeepSeek在2月錄得了5.247億次新的網站訪問量,超越了ChatGPT,在整體規模上仍位列第三。4月30日,DeepSeek在AI開源社區Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的模型。然而,7月根據國際半導體研究機構Semianalysis的最新報告,DeepSeek的全球用戶使用率從2025年1月的50%急劇下降至7月的3%,官網訪問量在2月至5月期間也下滑了63%。
發展歷程 編輯本段
早期發展階段
于2023年4月,幻方量化正式發布公告,宣告其全面進軍人工智能技術領域,并宣布成立獨立的科研實體——深度求索公司。同年7月17日,DeepSeek在杭州市拱墅區市場監督管理局順利完成注冊登記。8月2日,公司注冊資本調整至1000萬元,并完成章程備案手續,同時投資人變更為寧波程恩企業管理咨詢合伙企業(有限合伙),企業類型變更為其他有限責任公司。2023年10月,DeepSeek成功完成由幻方量化主導的Pre-A輪融資,所獲資金主要用于大型語言模型的研發及團隊規模的擴張。
進入2024年,DeepSeek于1月5日正式推出首個大型語言模型DeepSeek LLM,該模型擁有670億參數,基于一個包含2萬億token的中英文數據集進行訓練。同年5月,DeepSeek宣布開源第二代基于混合專家(Mixture of Experts, MoE)架構的大型語言模型DeepSeek-V2。該模型在性能上與GPT-4Turbo相當,但成本僅為GPT-4的百分之一,因此被業界譽為“AI界的拼多多”。
2024年9月5日,DeepSeek官方更新了API支持文檔,并宣布將DeepSeek Coder V2與DeepSeek V2 Chat兩個模型合并,升級為全新的DeepSeek V2.5模型。API用戶可通過deepseek-coder或deepseek-chat接口訪問新模型,該模型在寫作任務及指令遵循等方面進行了顯著優化。11月20日,DeepSeek宣布推理模型DeepSeek-R1-Lite預覽版正式上線。同年12月26日,DeepSeek宣布DeepSeek-V3首個版本正式上線,并同步開放源代碼。
模型熱度飆升
2025年1月11日,DeepSeek官方App正式面世,并同步登陸iOS與安卓應用市場。緊接著,1月20日,DeepSeek隆重推出DeepSeek-R1模型,該模型在數學運算、代碼生成及自然語言推理等任務上的表現,已媲美OpenAI o1正式版。1月24日,據國外大模型排名Arena顯示,DeepSeek-R1在基準測試中躍升至全類別大模型第三位,尤其在風格控制類模型(StyleCtrl)分類中,與OpenAI o1并列榜首,其競技場得分高達1357分,略勝一籌于OpenAI o1的1352分。
至1月27日,DeepSeek應用在蘋果應用商店免費APP下載排行榜上,成功登頂15個國家和地區。同時,在美國區域,DeepSeek從1月26日的第六位躍居至首位,超越了ChatGPT、Meta旗下的社交媒體Threads,以及Google Gemini、Microsoft Copilot等美國科技巨頭的生成式AI產品,實現了中國應用在中國及美國蘋果App Store同時占據榜首的歷史性突破。
1月31日,DeepSeek R1 671b版本作為英偉達NIM微服務預覽版,在build.nvidia.com平臺發布。該微服務在單個英偉達HGX H200系統上,每秒最高可處理3872個token。開發人員得以對API進行測試與實驗,預計該API將很快作為英偉達AI Enterprise軟件平臺的一部分,以可下載的NIM微服務形式正式推出。
進入2月,DeepSeek-R1、V3、Coder等系列模型,陸續上線國家超算互聯網平臺。截至2月2日,DeepSeek應用迅速占據140個國家蘋果App Store下載排行榜首位,并在美國Android Play Store同樣奪得榜首。然而,2月6日,因服務器資源緊張,DeepSeek暫停了API服務充值,直至同月25日方重新開放。
4月4日,DeepSeek攜手清華大學研究團隊,聯合發布了題為《獎勵模型的推理時Scaling方法及其在大規模語言模型中的應用》的學術論文,提出了自我原則點評調優(SPCT)與元獎勵模型(Meta Reward Model)兩項核心技術,為提升大語言模型(LLM)推理能力提供了創新性的方法論。該論文已在arXiv平臺公開(https://arxiv.org/abs/2504.02495 ),相關代碼與部分模型權重正逐步開源。
開源代碼庫
2025年2月21日,DeepSeek正式對外宣布,將分階段公開其五個核心代碼庫。緊接著,在2月24日,該公司啟動了備受矚目的“開源周”活動,并率先推出了針對Hopper GPU特別優化的FlashMLA代碼庫。該解碼內核以高效MLA架構為核心,專為處理復雜多變長度的序列數據而設計。
2月26日,Deepseek繼續其開源步伐,正式公布了DeepGEMM代碼庫。隨后,在2月27日上午10點05分,DeepSeek發布了“開源周”第四日的重大進展:一系列優化的并行策略,涵蓋DualPipe這一創新的雙向管道并行算法,該算法旨在V3/R1訓練中實現計算與通信的高效重疊。同時,還推出了EPLB,一種專為V3/R1設計的專家并行負載均衡解決方案。此外,DeepSeek還慷慨地分享了其訓練和推理框架的性能分析數據,旨在為開源社區提供深入了解通信與計算重疊策略及其底層實現細節的寶貴資源。
2月28日,作為“開源周”的壓軸之日,DeepSeek宣布開源其全數據訪問加速引擎——3FS(Fire-Flyer文件系統)。3FS作為一款高性能的并行文件系統,全面支持V3/R1版本中的訓練數據預處理、數據集高效加載、檢查點的保存與重載,以及推理階段的向量嵌入搜索和KVCache快速查找功能。
進入4月30日,DeepSeek在AI開源社區的標桿平臺Hugging Face上,發布了一款名為DeepSeek-Prover-V2-671B的先進模型。該模型采用了更為高效的safetensors文件格式,并支持多元化的計算精度,從而極大提升了模型訓練與部署的速度和資源利用率。其參數規模高達6710億,或可視為2024年發布的Prover-V1.5數學模型的重大升級版。同日,Deepseek還推出了DeepSeek-Prover-V2-7B(增強版)模型,以及配套的DeepSeek-ProverBench數據集。DeepSeek-Prover-V2-671B在MiniF2F-test數據集上展現了卓越的性能,通過率高達88.9%,專注于形式化定理證明領域。結合DeepSeek-Prover-V2-7B模型在子目標搜索方面的優化,以及ProverBench基準數據集的發布,DeepSeek正有力推動數學AI領域的蓬勃發展。
業務拓展 編輯本段
2025年3月,杭州深度求索人工智能基礎技術研究有限公司正式提交了多枚DeepSeek Chat商標的注冊申請,其國際分類涵蓋了教育娛樂、廣告銷售等多個領域。截至3月17日,相關商標的注冊申請狀態仍處于審核階段。同年4月1日,該公司,作為DeepSeek的關聯企業,所申請的“一種廣度數據采集的方法及其系統”專利獲得公布。
業務數據
據某權威AI產品榜單統計,DeepSeek應用在上線后的短短20天內,日活躍用戶數(DAU)迅速攀升至2215萬。2025年2月8日,根據QuestMobile的數據,DeepSeek在1月28日的日活躍用戶數首次超越豆包,并在2月1日成功突破3000萬大關,創造了應用史上達成此里程碑的最快記錄。截至2月9日,DeepSeek App的累計下載量已超過1.1億次,周活躍用戶規模最高接近9700萬。其中,1月20日至1月26日期間,該應用的周下載量達到226萬次,而次周的下載量更是飆升至6300萬次,環比增長超過2700%。3月31日,IndiaTimes報道指出,DeepSeek在2月期間錄得了5.247億次新的網站訪問量,超越了ChatGPT,盡管在整體規模上仍位列第三。然而,7月時,根據國際半導體研究機構Semianalysis的最新報告,DeepSeek的全球用戶使用率已從2025年1月的50%顯著下降至7月的3%,官網訪問量在2月至5月期間也下滑了63%。另一家AI模型集成平臺Poe的統計數據顯示,其核心模型R1的使用率在2月至4月間減半,從7%跌至3%。進入2025年二季度,DeepSeek的月均下載量從第一季度的8111.3萬大幅下降至2258.9萬,降幅高達72.2%。
定價收益模式
DeepSeek API的定價策略為:每百萬輸入Tokens收費1元,每百萬輸出Tokens收費2元。該優惠期截至北京時間2025年2月8日24:00。優惠結束后,價格調整為每百萬輸入Tokens 2元,每百萬輸出Tokens 8元。而deepseek-reasoner模型自上線起即采用每百萬輸入Tokens 4元,每百萬輸出Tokens 16元的計費標準。2月26日,DeepSeek API開放平臺宣布實施錯峰優惠定價策略,每日優惠時段為北京時間00:30至08:30,其余時間則按標準價格計費。在優惠時段內,API調用價格大幅下調:DeepSeek-V3降至原價的50%,DeepSeek-R1更是降至25%。
合作機構概覽
2025年3月,上海消防與DeepSeek攜手,針對三類特定場景展開了深入應用。在日常辦公類政務應用場景中,DeepSeek憑借其快速文本分析能力,精準識別警情關鍵信息,為科學高效的決策提供了有力支撐。在數據治理專項工作應用場景中,DeepSeek的深度學習和數據分析算法在數據分類標注、清洗去重、關聯整合等三大主攻方向上發揮了強大作用,有效融合了分散在不同系統和部門的數據,為消防業務提供了全面且準確的數據支持。在網絡安全AI智能體應用場景中,DeepSeek的數據分析和模式識別能力被應用于訓練“網絡安全智能體”,使其能夠及時識別異常行為和潛在的入侵威脅,有效防范網絡攻擊對消防業務造成的影響。
獲得榮譽 編輯本段
2025年5月11日,DeepSeek入選2025福布斯中國人工智能科技企業TOP50。
附件列表
詞條內容僅供參考,如果您需要解決具體問題
(尤其在法律、醫學等領域),建議您咨詢相關領域專業人士。
如果您認為本詞條還有待完善,請 編輯
上一篇 紅果短劇 下一篇 小米汽車業務爆發式增長:二季度收入突破206億元