在人工智能领域持续高速发展的当下,模型的迭代升级成为推动技术进步与应用拓展的关键力量。2025 年 9 月 22 日晚间,DeepSeek 团队带来了令人瞩目的消息 —— 全新的 DeepSeek-V3.1-Terminus 模型正式上线,并且迅速开源,在业内激起千层浪。这一版本被官方赋予了特殊意义,其名称 “Terminus” 在拉丁语中意为终点、界限,似乎预示着 DeepSeek-V3.1 系列在技术成熟度与性能表现上达到了新的高度。

深度优化,攻克前期棘手难题
自今年 8 月 DeepSeek-V3.1 首次亮相后,用户在使用过程中反馈了一些影响体验的严重问题。其中,最为突出的是 API 调用时模型会毫无征兆地随机输出 “极”“極”“extreme” 等字样,这一异常情况犹如一颗 “不定时炸弹”,极大地干扰了正常使用流程。特别是在涉及编程任务时,若代码中混入这些莫名字符,编译失败的概率直线上升,导致项目进度受阻。
针对这一顽疾,DeepSeek 研发团队全力攻坚。智东西在第一时间对 DeepSeek-V3.1-Terminus 进行实测,尝试利用此前网传极易触发该 Bug 的 “高危” 提示词,如要求模型编写 Go 语言代码、处理版本号相关任务以及时间相关指令等。令人欣喜的是,在一系列严格测试下,DeepSeek-V3.1-Terminus 稳如泰山,未出现一次字符异常输出,表明这一困扰用户多时的 Bug 已被成功修复。
与此同时,DeepSeek-V3.1 在多语言处理方面也饱受诟病。海外 Reddit 论坛上有用户反映,在进行小语种翻译时,模型常常会将中文、英文、俄文等多种语言混乱拼凑,出错文本比例有时高达 5%,这对于一款致力于全球化应用的模型而言,无疑是亟待解决的问题。为验证修复成果,智东西向 DeepSeek-V3.1-Terminus 抛出了一项挑战:将 “人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战” 这句话翻译成 7 种小语种。模型迅速给出回应,翻译结果准确无误,且语言风格自然流畅,并未出现语言混杂的乱象,有力证明了 DeepSeek-V3.1-Terminus 在多语言处理能力上已实现质的飞跃。
能力进阶,编程与搜索智能体表现卓越
除了修复关键 Bug,DeepSeek-V3.1-Terminus 在核心能力层面的进化同样可圈可点,尤其是在编程和搜索智能体领域,展现出了更为强大的实力。
在编程任务测试中,智东西要求模型模拟小球弹跳效果。DeepSeek-V3.1-Terminus 不负众望,生成的网页以简约风格呈现,却精准还原了重力与摩擦力作用下小球的运动轨迹,动画效果流畅自然,碰撞细节处理得当。要达成如此逼真的模拟效果,模型不仅需要精通编程语法,更要对物理学原理有着深刻理解,能够将抽象的物理知识转化为具体的代码逻辑,这一成果充分彰显了 DeepSeek-V3.1-Terminus 在跨学科知识融合与应用方面的深厚功底。
而在搜索智能体能力测评中,智东西设定了一个颇具挑战性的任务:推荐几款适合新手在阳台盆栽种植、生长速度快、可生食且对儿童安全的植物。DeepSeek-V3.1-Terminus 迅速响应,给出的答案条理清晰、内容详实。它不仅精准筛选出符合所有条件的植物品种,还对每种植物的特性、种植要点以及潜在风险进行了详细说明,信息来源可靠,经人工核查均准确无误,整体回答的可读性极强。这一过程中,模型展现出了出色的信息检索、交叉验证以及整合提炼能力,能够在海量信息中快速定位关键内容,并以用户易于理解的方式呈现,为用户提供了极具价值的参考。

性能提升,基准测试数据亮眼
从官方公布的基准测试对比数据来看,DeepSeek-V3.1-Terminus 在非 Agent 类测试项目中,相较于前作 DeepSeek-V3.1 实现了 0.2%-36.5% 不等的性能提升。尽管在个别测试中成绩略有下滑,但整体表现呈现出显著进步。尤其在 HLE(人类终极测试)中,DeepSeek-V3.1-Terminus 的优势尽显。该测试聚焦于专家级高难度知识,以及模型的多模态理解与深度推理能力,模型在此项测试中的大幅提升,进一步印证了其在复杂任务处理上的卓越能力。
在 Agent 测评环节,DeepSeek-V3.1-Terminus 同样表现出色,在网页浏览、简单问答以及多项编程测试中,均实现了小幅度但意义重大的性能提升,输出效果相较于之前版本更加稳定可靠,为用户带来了更为流畅、高效的使用体验。
目前,DeepSeek 官方 App、网页端、小程序以及 DeepSeek API 模型已全面同步更新为 DeepSeek-V3.1-Terminus 版本,广大用户可即刻体验这一全新模型带来的强大功能与优质服务。开源地址也已正式公布,分别为https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus以及https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus,这一开源举措无疑将进一步推动人工智能领域的技术交流与创新发展,让更多开发者基于该模型进行二次开发,探索更多应用可能性。
随着 DeepSeek-V3.1-Terminus 的发布,我们有理由期待,在人工智能技术与应用的广阔天地中,它将如同一颗璀璨新星,持续照亮前行的道路,为行业带来更多惊喜与变革。而 DeepSeek 团队是否会在年底如约推出备受期待的 Agent 模型,又将为我们带来怎样的新突破,让我们拭目以待。
发表回复