bg
搜索
简
APP
主页 > 会员 > 国际视野

DeepSeek

文 文 文

DeepSeek V3小更新 中文写作和搜索等4能力强化

(北京26日综合电)中国研发的AI软体24日公布V3小更新版本“-V3-0324”,官方报告显示,新版本在推理能力、前端开发能力、中文写作能力和中文搜索能力均有所强化。

V3-0324虽被局限在小版本更新,但在代码生成能力的提升令使用者印象深刻,用户只需关闭深度思考模式,就能体验新版本,而API接口和使用方式保持不变。

《网易新闻》报导,报告显示,推理能力的提升主要体现在新版V3模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench),表现均有提高,特别是在数学、代码类相关评测集上取得超过GPT-4.5、Claude-Sonnet-3.7的得分成绩。


(示意图)

据了解,在推出的两个模型中,R1偏推理模型,V3则较为适合日常对话,在小更新里,V3也有了推理能力的强力升级,使用者可根据问题难度,复杂问题用R1,日常对话用新版V3,将算力资源与任务需求更加契合,避免不必要的计算浪费。

除了代码能力,新版本V3在中文能力也有明显增强,特别是中长篇文本创作上的结构更佳完整,逻辑更为严密,实用性因此大幅提升。

此外,在联网搜索场景下,报告生成能力也有显著提升,模型能够从网路资讯中提取关键内容,生成详实准确的报告,并以清晰美观的排版呈现。

官方报告强调,此次更新与之前的-V3使用同样的base模型,仅改进“后训练方法”,并借鉴了-R1模型训练过程中的强化学习技术,代表着纯RL路线的再一次的验证和公示,在对手们继续闭源并使用“唯一混合模型”这样的概念“博眼球”之际,将持续藉由开源,提供业内公开的高效迭代思路。

文:《网易新闻》

高兴
高兴
惊讶
惊讶
愤怒
愤怒
悲伤
悲伤
关怀
关怀

DeepSeek

相关文章

韩监管机构:DeepSeek曾将用户信息 转至境外!

广东首季度GDP不达标 浙江DeepSeek助力增6%

动新闻|关于Deepseek掌舵人梁文锋 你可能不知道的事

动新闻|AI当道|当DeepSeek觉醒 会是怎样的局面?

博鳌报告:DeepSeek冲击华尔街 提振全球对中国科创能力信心

宣称基于中国晶片 蚂蚁集团:实现AI突破!

mywheels