DeepSeek-V3.1正式发布:思考时间变短,但API调用价格涨了

音符科技网

界面新闻记者 | 宋佳楠

DeepSeek用户没能等到传闻中的R2模型,但V3.1版先来了。

8月21日,界面新闻从DeepSeek官方公众号获悉,其最新大语言模型DeepSeek-V3.1正式发布。此时距离DeepSeek-V3-0324推出已过去5个月时间。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。如果仅从命名来看,DeepSeek-V3.1更像是前一代DeepSeek-V3模型的小版本迭代。

DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。用户可通过官方App或网页端的“深度思考”按钮切换这两种模式。

官方数据显示,与DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间内给出答案,且经过思维链压缩训练,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务的平均表现与R1-0528持平。R1-0528是DeepSeek于今年5月发布的旗舰推理模型DeepSeek R1的升级版本。

R1-0528与V3.1-Think的token消耗量对比图

同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

通过Post-Training(后训练,大语言模型训练流程中的关键阶段)优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1相较以往模型进步明显。

社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了Anthropic的Claude 4 Opus等多个知名模型,且完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

随着V3.1发布,DeepSeek也同步调整了API接口调用价格,并取消夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens(此前V3为2元/百万tokens);输出价格调整为12元/百万tokens(此前V3为8元/百万tokens)。

DeepSeek-V3.1 API调用价格

值得注意的是,DeepSeek还在评论区中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。

此前有第三方数据显示,DeepSeek用户使用率和官网流量回落。据之一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

DeepSeek(深度求索)是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

截至目前,DeepSeek推出了DeepSeek-V3、DeepSeek-R1等模型,具备混合专家架构(MoE)、多头潜在注意力(MLA)等技术优势,在数学推理、代码生成等任务上表现出色,且训练和推理成本较低。其部分模型采用MIT许可开源(一种广泛使用的开源软件许可证),已在金融、医疗等领域落地应用。

文章版权声明:除非注明,否则均为音符科技网 wap.luzhiwang.com原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 大成徐彦朋友圈回应新基金空仓
  • 高永平获准担任长安银行首席信息官
  • 诺信大涨7.7%,此前报告盈利与营收均超预期
  • 奇富、信也、乐信净利大增,助贷业“重资本”模式卷土重来
  • 北方国际:上半年归母净利润3.09亿元,同比下降42.71%
  • 中再产险:中再巨灾公司注册资本增至2.76亿元
  • 600028,拟分红超100亿元!还有这些公司要分红→
  • 囤积倒卖网红餐厅预约号,三人被公安机关依法行政处罚
  • 风华高科:上半年归母净利润1.67亿元,同比下降19.50%
  • 康龙化成:上半年归母净利润7.01亿元,同比下降37%
  • 泽连斯基:俄对乌再次发动大规模空袭
  • 中国经济怎么看、怎么干?人民日报7个关键字说透了
  • 开盘:美股周四小幅低开 市场聚焦财报与鲍威尔讲话
  • 上海一小区附近骚气冲天!15分钟8个人干这事,违停也要上“露天公厕”
  • 快手高管解读Q2财报:对视频生成大模型场景和变现充满信心
  • 1650亿立方米!我国又一大型页岩气田诞生
  • 突发!美国两栖舰“新奥尔良”号在冲绳燃起大火,今上午未扑灭,可能报废
  • 俄外长:俄不能接受外国军队出现在乌克兰
  • 鲍威尔在历次杰克逊霍尔全球央行年会上说了什么?
  • 扎根、共生、传承——广东“小芳”的墨脱情缘
  • 上半年新业务价值增14%,友邦保险称“中国是最重要的市场”
  • 美国上周失业救济申请人数超预期 费城制造业产出疲软
  • 7月银行业被罚超2亿元!有银行收到千万元“天价罚单”
  • 夜读|走过岁月的咖啡屋
  • 长沙所有门店被曝关闭,网红火锅朱光玉回应:为代理商个例
  • “天价药”有救了!商保创新药目录呼之欲出,健康险风口来了?
  • “天价离婚案”落幕!
  • 人民网三评“外卖大战”之三:谁会赢,怎么赢?
  • 红十字国际委员会:以色列接管加沙城计划“难以容忍”
  • 突发!白宫宣布:欧盟将取消对美国所有工业品关税,美国对汽车、半导体芯片等欧盟商品征关税最高15%
  • 汽车关税将有条件降至15%,美国与欧盟就贸易协定框架达成一致
  • 浙江嵊州一男子酒驾被拘留期间死亡,上级督察部门介入
  • 西安警方通报多人买王力宏演唱会门票被骗:嫌疑人已到案
  • 今天,这两类ETF上涨!
  • 欧洲烈酒生产商股价下跌 美欧声明未提针对该行业的关税减免
  • 蔚来汽车盘前上涨3.5%
  • 欧盟:将与美国继续商定进一步的关税削减
  • 美国上周首次申领失业救济人数为23.5万
  • 小鹏汽车盘前上涨5.8% 何小鹏增持小鹏汽车310万港股
  • 科大讯飞:上半年归母净亏损2.39亿元,亏损同比收窄
  • 目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码