2025年8月21日,DeepSeek正式發布了DeepSeek-V3.1,官方稱其為“邁向Agent(智能體)時代的第一步”。
DeepSeek-V3.1是首款“混合推理”模型,一個模型可同時支持推理模式和非推理模式(自主切換)。用戶可通過官方App或網頁端的“深度思考”按鈕切換這兩種模式。
該模型共有671B參數,激活參數37B,上下文128k。在軟件工程基準測試中,全方位碾壓DeepSeek-V3-0324和DeepSeek-R1-0528。在人類的最后考試HLE中,拿下了29.8的高分,在數學、知識問答、編程等任務中,也全面超越DeepSeek-R1-0528。
DeepSeek-V3.1-Think推理速度比DeepSeek-R1-0528更快,經過思維鏈壓縮訓練后,輸出token減少了20%-50%,但各項任務平均表現與DeepSeek-R1-0528持平,回答質量相媲美,思考效率大幅提升。
模型的工具使用、智能體任務有了顯著提升,多步推理能力強化,復雜搜索也可輕松應對。它還可以支持多種Code Agent框架,開發者能夠自己搭建智能體。目前能處理超過100種語言,尤其對亞洲語言和資源較少語種的運用進行了優化。
隨著DeepSeek-V3.1發布,其API接口也同步升級,deepseek-chat對應非思考模式,deepseek-reasoner對應思考模式,上下文均擴展為128K。同時,API Beta接口支持strict模式的Function Calling,并增加了對Anthropic API格式的支持。官方還宣布從2025年9月6日凌晨起,調整DeepSeek開放平臺API接口調用價格,并取消夜間時段優惠。