logo
Vectara发布基于升级版Hughes幻觉评估模型的事实一致性评分,以提高生成式人工智能响应的透明度
===2024-3-27 13:56:36===
发布时间:2024-03-27 13:44 Vectara在其无服务器RAGaaS平台上推出了由其广受欢迎的开源Hughes幻觉评估模型提供支持的事实一致性评分,这一业内首创通过提供详细的准确性和幻觉评估,提高了人工智能响应的透明度和用户控制能力。
加州帕罗奥多--(美国商业资讯)--广受信赖的生成式人工智能产品平台Vectara宣布为所有生成式响应加入基于开创性Hughes幻觉评估模型(HHEM)进化版本的事实一致性评分(FCS),HHEM是Hugging Face上排名第一的幻觉评估模型,自去年11月发布以来已获得超过10万次的下载量。与之相关的大模型幻觉率排行榜现已成为大型语言模型(LLM)衡量其平均事实一致性的行业标准。Vectara的端到端检索增强生成即服务(RAGaaS)平台作为行业首创,通过提供实时端到端RAG可观察性,为生成式人工智能响应透明度设定了新标准。这一创新指标为Vectara RAGaaS平台内汇总响应的事实一致性提供了前所未有的可见性,使用户能够根据详细的准确性评分设置个性化的响应可接受度阈值。

市场上LLM的平均幻觉率从3%至16.2%不等,其响应中存在的未知不准确性风险仍是一个主要问题,阻碍了这一强大技术在企业中的广泛应用。Vectara通过提供事实一致性评分,对生成的响应是否是幻觉的可能性进行评分,从而为企业降低了这种不确定性。只有采用标准化、科学计算的方法对响应进行分级,企业才能负责任地将生成式人工智能引入到关键业务应用中。用户能够根据详细的准确性评分设置响应可接受度阈值,从而使产品团队能够根据自己的偏好灵活处理这些信息。

Vectara的事实一致性评分是生成式人工智能的开创性工具,为实时幻觉检测设定了新基准,并具有卓越的性能、可负担性和速度,标志着在信任方面的重大飞跃。其高效性和有效性使企业能够将生成式人工智能部署到关键产品用例中,而不必担心幻觉响应可能导致的责任风险。

Vectara的事实一致性评分使开发人员有能力完善和增强从内部问答系统到与终端消费者的互动质量等各种应用。该评分的优势在于其校准性,使其可直接解释为概率,例如,0.98分表示事实一致性概率为98%。这与许多当代的机器学习分类器形成了鲜明对比,后者无视校准,从而牺牲了清晰度和直接可解释性。

Yobi应用程序创始
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页