Archer证实在法规变更管理方面,专用AI全面超越通用大模型:验证准确率95%、提速80倍、降本92%
===2026/7/2 18:56:59===
25%
0%
失败或超时
31%
0%
模型自身的置信度绝不能等同于合规控制。在通用大模型标注为高置信度的答案中,仍有35%是错误的。这种准确率上的鸿沟,正是负责任地部署智能体AI的先决条件,因为自动化运行的智能体,其可靠性完全取决于其底层判定的准确度。唯有经过验证、源头可追溯且由专家监管的答案,才能确保AI智能体在整个企业级架构中得到安全部署。这正是AI治理的核心所在,也是Archer致力于提供的关键架构层。
Archer首席产品与技术官Kayvan Alikhani表示:“在合规领域,快捷、廉价却错误的答案毫无价值,而无法追溯源头的答案则是一场灾难。Archer的专用型AI实现了超95%判定的实时验证。这正是让企业能够在不失去结果控制权的情况下,扩展智能体AI的基础。”
速度:实时验证答案
根据测试要求,通用大模型的处理流程在5秒的超时限制内,平均每条响应需耗时约4秒。而Archer Evolv在处理重复查询时,仅需约五百分之一秒即可交付经过验证的日期,速度提升了约80倍。对于需要紧跟监管日程步伐的AI智能体和合规分析师而言,这正是并驾齐驱与沦为效率瓶颈之间的天壤之别。
成本:一个持久且经过验证的知识库,而非按需推理
通用模型的处理流程在面对每一次请求时都要重新计算答案,对之前找到的结果毫无记忆。而Archer Evolv则在数据摄入时仅计算一次,并将验证后的结果写入可扩展且由专家监管的知识库中进行持久化存储,从而能以极低的成本和延迟满足未来的每一次查询。当法规发生修订时,Evolv会主动捕捉这一变更,重新进行验证并对更新后的答案进行版本化管理。因此,系统交付的任何内容都绝不存在滞后。以一个包含500份文件的语料库为例,若每份文件每月被查询12次,通用流程需要进行6,000次计算判定,而Evolv仅需500次。Archer Evolv由此避免了约92%的推理调用,这种结构性成本优势还会随着业务量的增长而进一步扩大。
上下文语境让这一切成为可能
Archer
=*=*=*=*=*=
当前为第2/4页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页