CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?


一直以来,大模型在自然语言处理领域表现出色,犹如文科领域的佼佼者,但在处理复杂数值计算和逻辑推理任务时,却常常力不从心,被视为 “偏科生”。不过,随着技术的不断演进,大模型在理科能力方面取得了显著进步,展现出更加全面的能力。

在数值计算和比较任务中,大模型正在努力提升准确性。回顾去年,跬智信息(Kyligence)在相关中提出了一系列颇具挑战性的问题,如 “9.9 和 9.11 哪个大?”“A 公司和 B 公司营收哪个高?” 以及 “高出多少百分比,精确到 4 位小数以上?” 这些问题对大模型的数学运算和逻辑判断能力构成了不小的考验。

到了 2025 年,在简单数值比较问题上,无论是开源还是闭源大模型,都能给出准确答案,这无疑是一个积极的信号。然而,当面对高精度数值计算要求,如精确到 4 位小数以上时,多数大模型仍存在明显不足,暴露出其在复杂计算任务上的局限性。

大模型的 “幻觉” 问题,是数据及分析场景应用中面临的主要挑战之一。在数据匮乏或信息不明确的情况下,大模型容易生成与事实不符的内容,这在对数据准确性和可靠性要求极高的金融、零售等领域尤为突出,使得这些行业在应用大模型技术时格外谨慎。

为了评估大模型在实际业务场景中的表现,我们使用一家公司包含 1000 行的销售数据进行测试,这些数据涵盖商机所有者、阶段、开始时间、商机跟进天数、来源等关键信息。针对“哪个行业的客户平均预计金额最高?”“哪些阶段的商机丢失率最高?”“销售中谁的成交率最高?” 以及 “不同阶段的商机数量分别是多少?” 等问题,Kyligence AI 智能体和 DeepSeek – R1 给出了不同的答案。

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

部分1000行样例数据

问题一

哪个行业的客户平均预计金额最高?

Kyligence

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

DeepSeek

问题二

哪些阶段的商机丢失率最高?

Kyligence

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

DeepSeek

问题三

销售中谁的成交率最高?

Kyligence

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

DeepSeek

问题四

不同阶段的商机数量分别是多少?

Kyligence

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

DeepSeek

其中,Kyligence AI 智能体的回答全部准确,而 DeepSeek – R1 的回答则均出现错误这一结果直观地反映出不同智能体在处理复杂业务数据时的能力差异,也凸显了用指标知识库结合大模型提升准确性和可靠性的重要性

Kyligence AI 采用了多智能体架构,在 DeepSeek 大模型的基础上,集成了指标知识库和文档知识库,辅助以 RAG、NL2Metric、归因分析、数据解读、报告生成等工具,实现了数据分析与 AI 大语言模型的深度融合。一方面可以在语言处理上直接使用 DeepSeek 获得极佳的推理能力,另一方面在数据处理上结合指标知识库和指标引擎,获得数据准确性和可靠性。Kyligence AI 支持私有化部署方案以及华为云等云平台部署方案,助力用户快速构建集 “智能问数”“知识管理” 和 “决策建议” 于一体的数据智能体,为企业提供高效的数据洞察和决策支持。

总体来说,Kyligence AI 智能体取得了一系列成果:

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

数值计算准确性:跬智信息提供的大模型服务 Kyligence AI 能够持续提供准确、可靠的数值计算和回答,这源于 Kyligence 在统一数据语义、大模型计算增强等技术上的突破。其做法是接管了大模型中的数值计算,但不改变大模型其他解答思路。通过准确地控制和引导大模型的输出,特别是在计算部分,使得大模型在计算准确度和精度方面可以被严肃应用场景所信任

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

数据 + 知识总结:借助 DeepSeek 强大的推理能力与 Kyligence 指标知识库,Kyligence 实现了数据的精准处理,并结合行业知识生成深入的业务洞察与切实可行的行动建议,帮助企业做出更明智的决策。

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

内容仿写成个性化总结报告:基于 DeepSeek 技术,Kyligence 能够生成更贴合用户需求的个性化内容,有效提升用户体验和工作效率。

准确、安全、可靠的数据是企业应用 AI 的基石。在大模型技术飞速发展的当下,这些优质数据更是推动大模型不断突破的关键动力。尽管大模型技术目前仍面临不少挑战,但其进步速度令人瞩目。展望未来,大模型将成为得力助手,在金融、医疗、教育等众多领域发挥重要作用,帮助我们攻克各种难题。Kyligence 也将携手合作伙伴,依托坚实的数据基础,持续探索大模型的更多应用场景,带来更多意想不到的惊喜!

体验 Kyligence AI 数据智能体,你可通过扫码二维码点击下方“阅读原文”提交需求!如需了解更多企业级 Data+AI 方案,可关注 Kyligence 订阅号或联系 info@kyligence.io。

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

关于 Kyligence

CIO 集体焦虑的“AI 信任危机”,DeepSeek 如何突破落地难题?

跬智信息(Kyligence)由 Apache Kylin 创始团队于 2016 年创办,是领先的 Data+AI 公司,为企业客户提供大数据、指标平台、AI 智能体等产品和解决方案,以 AI 赋能全民用数,帮助企业充分利用数据价值,加速数智化转型。

Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制造、零售、医疗等行业客户,包括建设银行、平安银行、浦发银行、北京银行、宁波银行、太平洋保险、中国银联、上汽、长安汽车、星巴克、安踏、李宁、阿斯利康、UBS、MetLife 等全球知名企业,并和微软、亚马逊云科技、华为、安永、德勤等达成全球合作伙伴关系。Kyligence 获得来自红点、宽带资本、顺为资本、斯道资本、Coatue、浦银国际、中金资本、歌斐资产、国方资本等机构多次投资。

点击「阅读原文」了解更多

© 版权声明
THE END
喜欢就支持一下吧
点赞78 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片