最近,由钉钉团队研发的深度研究系统「Dingtalk-DeepResearch」在国际权威评测中取得突破性成绩,在 DeepResearch Bench 测试中以 48.49 分位居全球第二、国内第一,超越 OpenAI、Claude 等主流系统。
多场景落地,实现复杂任务智能处理
该系统已成功应用于制造业、供应链等复杂场景,能够在复杂异构表格、多阶段推理与多模态生成任务中保持行业领先的准确性与稳健性,帮助企业高效处理多模态数据,实现智能化升级。
钉钉深度研究系统的这一进展,首次实现了国际顶级基准与实际生产落地的双重突破,标志着中国企业级 AI 技术迈入国际第一梯队。
多智能体架构,支持深度协同研究
Dingtalk-DeepResearch 的核心是设计了一种面向真实企业场景的多智能体深度研究框架,将深度研究生成、异构表格解析与推理、多模态报告生成有效整合在同一系统中。
这一设计就像把具备不同专业能力的团队成员整合到一个系统中:有的擅长分析表格数据,有的负责生成报告,有的协调工具调用。通过三层架构设计(任务导向的智能体层、核心引擎层、数据层),能够支持对复杂任务的并行处理与多阶段推理,例如将包含多重嵌套与合并单元格的工厂生产表格,自动解析并转化为结构清晰、洞察深刻的分析报告。
持续进化机制,实现自适应学习
为应对企业场景的动态变化,该框架通过熵引导、记忆感知的在线学习机制使智能体能够持续演进,就像员工可通过反复实践提升技能,而无需人工干预。该机制保障系统能自动从历史互动中归纳经验,逐步适应不同企业的业务流程与用户操作风格。
例如,当用户多次修改 AI 输出的报告格式后,系统会自主学习并记忆用户对格式、风格及关键点的偏好,在后续生成中主动对齐用户需求。在钉钉企业级 AI 平台中,这种经个性化调优的偏好可以作为一种能力沉淀并共享给团队乃至整个公司,实现组织知识的复用与增效。
闭环评估体系,确保输出质量可靠
为确保生成内容的准确性与可靠性,Dingtalk-DeepResearch 内建了 DingAutoEvaluator 评估系统。该系统会对生成的每一份报告进行多维度「质量检验」,涵盖数据准确性、逻辑连贯性、工具使用规范等。一旦发现问题,系统会自动将相关案例反馈至训练流程以优化模型,形成一套从生成、评估到优化的持续改进闭环。
已在多行业稳定应用,创造实际价值
目前,Dingtalk-DeepResearch 已在多个真实业务场景中稳定应用并创造价值。在供应链领域,系统能快速分析跨部门的复杂表格数据,为采购策略提供智能化建议;在制造业,它能将设备运行的原始数据自动转化为可视化分析报告,为故障预测与维护提供决策支持。所有核心功能均通过国际基准测试验证,确保了技术的可靠性与领先性。
钉钉 CTO 朱鸿表示:「Dingtalk-DeepResearch 通过结合自适应优化和多模态推理,形成一个可灵活部署的企业级 AI 框架,旨在处理复杂且不断演进的真实业务任务。该技术正加速在 AI 搜索、AI 表格、自动化工作流、Agent 平台等产品中落实,让前沿 AI 技术更贴近实际生产需求,为企业提供真正创造价值的 AI。」
We dedicated to serving clients with professional DingTalk solutions. If you'd like to learn more about DingTalk platform applications, feel free to contact our online customer service or email at

Bahasa Melayu
English
اللغة العربية
Bahasa Indonesia
ภาษาไทย
Tiếng Việt
简体中文 