[点晴永久免费OA]刚刚发布！DeepSeek新模型V3.1开源：五大技术能力飞跃，带你体验前沿科技！

zhenglin

2025年8月23日 17:57 本文热度 116

DeepSeek在官方群宣布：DeepSeek线上版本模型已升级至DeepSeek V3.1

上下文窗口从原有的64k扩展至128k，网页、App、小程序都可体验这一模型。

此外，DeepSeek还将App、网页端的“深度思考（R1）”字样改为了“深度思考”，有网友猜测这是融合推理模型与非推理模型的征兆，但DeepSeek官方尚未发布任何关于这一改动的消息。

▲左侧为旧版页面，右侧为新版页面

这一模型现已上传至Hugging Face，不过目前仅开源了未经指令微调的Base版本（基础模型），其配置文件、脚本代码和模型权重均可供下载。

与DeepSeek-V3-0324相比，模型参数量、张量类型没有明显变化。

▲上方为DeepSeek-V3-0324开源网页，下方为DeepSeek-V3.1-Base开源网页

开源地址：

这边在第一时间在网页端对新模型的能力进行了体验，从初步体验结果来看，这一模型在编程（尤其是前端能力）、物理定律理解、创意写作、数学、回答语气等方面都出现不同程度的提升和变化。

以下是体验的部分案例：

1、个人网站开发

我们向DeepSeek-V3.1发送了如下消息：“设计一个美观的个人博客网站，带有科技感，直接开发成可用网页。”

与DeepSeek-V3-0324相比，DeepSeek-V3.1写出的代码长度增加，开发耗时更久，不过，其最终交付的结果在完成度、美观性上有了一定提升。

可以看到，DeepSeek-V3.1打造的网页在布局上更为合理，重点清晰，对网站栏目也有更为丰富的规划，还配上了图片，虽然并未全部显示。

与之相比，DeepSeek-V3-0324此前生成的网页更为简单，特效也没有DeepSeek-V3.1打造的网页丰富。

我们让DeepSeek-V3.1复现了Chrome浏览器断网时的小恐龙游戏，2分钟左右模型完成了开发。

从页面的画风、游戏规则上来看，这一小游戏与原版差别不大，但是小恐龙的外观并未准确还原，游戏障碍的生成、跳跃的方式（无法“二段跳”）导致可玩性较差。

小众历史问题能较好地考察模型在幻觉方面的表现——如果没有足够的信息，模型会不会直接胡编乱造？

智东西曾向DeepSeek-V3-0324提出“布须曼人喝牛奶吗”的问题，这涉及非洲南部的一个少数民族。

当被问及同样的问题时，DeepSeek-V3.1与上代模型有了明显区别，其回答内容的信息量进一步增加，提供了更多细节。

在经过事实核查后，DeepSeek-V3.1新增的细节基本都有事实印证，并非胡编乱造。

DeepSeek-V3.1在回答问题时，语气更为活泼、温暖，语言更通俗、口语化，先是肯定了用户的问题，然后再进行回答。

回答中提供了更多的背景情境，让解释更丰满、更有故事性。

DeepSeek-V3下结论时更加绝对和肯定，DeepSeek-V3.1则使用了更多条件性语句，更强调情况的复杂性和演变过程。

避免了非黑即白的结论，也可以说成为了“端水大师”。

总的来说，DeepSeek V3.1不仅在技术上取得了突破，还在用户体验上进行了多项优化，确保新功能能够被用户无缝使用。

1.无缝API升级

为了方便开发者升级到新版本，DeepSeek V3.1保持了与之前版本相同的API接口调用方式。这意味着开发者无需修改现有的代码，即可享受到新版本的长文本处理能力。

这一设计大大降低了升级成本，提升了用户的满意度。

2.多平台支持

DeepSeek V3.1支持官方网页、APP 和小程序等多种平台，用户可以根据自己的需求选择合适的方式进行体验。

无论是在桌面端还是移动端，用户都能享受到一致的、高效的长文本处理体验。

3.用户反馈与持续优化

根据用户的反馈，DeepSeek V3.1在长文本处理上的表现得到了广泛认可。用户表示，扩展的上下文长度使得在撰写长篇报告、进行长对话等场景下更加便捷，不再需要频繁地复制粘贴。

DeepSeek团队将继续根据用户反馈进行优化，进一步提升模型的性能和用户体验。

DeepSeek V3.1的发布标志着NLP领域在长文本处理上取得了重要进展。其创新的混合稀疏注意力机制和优化的计算策略，为处理超长文本提供了新的解决方案。

该文章在 2025/8/23 17:59:55 编辑过

关键字查询

正在查询...