查看内容

TII推出FalconReasoning：全球顶尖70亿参数AI模型，性能超越更大规模模型
===2026/1/7 12:02:49===

效且高效地进行推理。该模型设定了一个新的帕累托边界，即性能的最佳平衡点，在这个平衡点上，速度的提升不会以牺牲质量为代价。

最佳基准测试

在竞争激烈的基准测试中，Falcon H1R 7B取得了卓越的成绩：

数学：AIME-24测试得分达88.1%，超越了ServiceNow AI的Apriel 1.5 (15B) (86.2%)——这证明了紧凑型7B模型可与规模更大的系统相媲美，甚至超越。

代码与代理任务：准确率达68.6%，在80亿参数以下模型中表现最佳，并在LCB v6、SciCode Sub和TB Hard基准测试中得分更高。Falcon H1R的得分为34%，高于中国的DeepSeek R1-0528 Qwen 3 8B (26.9%)，甚至超过了Qwen3-32B (33.4%) 等更大规模的竞争者。

通用推理：展现出强大的逻辑推理和指令执行能力，性能与微软Phi 4 Reasoning Plus (14B) 等规模更大的模型相当或接近，而参数量仅为后者的一半。

效率：在批量64时，单GPU峰值性能达每秒1500个令牌，凭借混合Transformer-Mamba架构，其速度几乎达到中国Qwen3-8B的两倍——在保持准确性的同时，实现了更快的可扩展性能。

“该模型是世界一流研究和工程的成果，展现了科学的精确性与可扩展设计的完美结合。”TII人工智能与数字研究中心首席研究员Hakim Hacid博士表示，“我们很自豪能够推出这样一个模型，帮助社区构建更智能、更快速、更易用的AI系统。”

开源与社区驱动

秉承TII对AI透明度和协作的承诺，Falcon H1R 7B以开源模型形式发布，并采用Falcon TII许可证。全球的开发者、研究人员和机构可通过Hugging Face访问该模型，并获取完整的技术报告，其中详细介绍了训练策略和在关键推理基准测试中的表现。

此次新版本的发布建立在TII Falcon项目全球成功的基础之上。Falcon模型自问世以来，一直位列全球顶级AI系统之列，前四代在其各自类别中均取得了全球第一的排名。历经多次迭代升级之后，Falcon在性
=*=*=*=*=*=
当前为第2/3页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页