阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆

公司 文传商讯

基于全新混合式架构,模型在较小的参数规模下可实现更高的准确率与卓越的性能

此次发布凸显阿拉伯联合酋长国加快挺进高性能语言模型赛道,全面参与全球人工智能领先力量竞争的战略布局

阿拉伯联合酋长国阿布扎比–(美国商业资讯)– Technology Innovation Institute(TII)——阿布扎比先进技术研究委员会(Advanced Technology Research Council,ATRC)旗下的应用研究机构——正式发布Falcon-H1 Arabic。这是一款基于混合式Mamba-Transformer架构全新打造的大型语言模型,标志着对以往Transformer架构路线的根本性突破。凭借卓越的综合性能,Falcon-H1 Arabic已在Open Arabic LLM Leaderboard(OALL)上确立其作为当前全球表现最优阿拉伯语AI模型的领先地位。

这一里程碑式的进展使Falcon-H1 Arabic确立为目前市场上表现最为领先的阿拉伯语人工智能模型。该模型在参数规模显著更小的情况下,依然全面超越多款体量数倍于己的同类模型,在准确率、上下文理解能力及语言表征等核心维度上均达到业界最先进水平。

阿联酋总统顾问、先进技术研究委员会(ATRC)秘书长Faisal al Bannai阁下表示:“Falcon-H1 Arabic彰显了我们持续推进的战略承诺,即进一步巩固阿拉伯联合酋长国作为全球先进技术与负责任人工智能枢纽的领先地位。通过打造真正契合本地区语言与文化特征的模型,我们正在推动更具可及性、更贴近实际、并能在社会层面产生深远影响的创新实践。这一成果充分印证了TII在人才储备与科研实力方面的深厚积淀。”

在今年早些时候发布的Falcon-Arabic系列模型获得广泛积极反响、并清晰反映出市场与开发者社区对高质量阿拉伯语大型语言模型的迫切需求之后,TII进一步深化相关研发,推出全新的Falcon-H1 Arabic模型家族。该系列提供3B、7B及34B三种参数规模,旨在灵活适配不同算力条件与多元化应用场景。Falcon-H1 Arabic在数据质量、阿拉伯语方言覆盖、长上下文处理稳定性以及数学推理能力等方面实现显著提升,使模型在实际应用中展现出更高的准确性、可靠性与语境感知能力,全面提升对阿拉伯语的理解深度与应用价值。

TII首席执行官Najwa Aaraj博士表示:“Falcon-H1 Arabic的推出,建立在我们多年持续推进阿拉伯语人工智能基础研究的坚实成果之上,并精准回应了包括开发者和企业在内的社区核心需求。通过在模型架构、数据质量及长上下文推理能力方面不断迭代升级,我们正在构建关键性技术能力,释放阿拉伯语在教育、医疗、治理、企业等多个领域的全新应用潜能。该模型是我们履行使命的重要里程碑——即打造世界一流的人工智能技术,既服务本地区发展,也为全球进步贡献力量。”

基准测试结果

在OALL Leaderboard这一覆盖多维度阿拉伯语理解与推理能力的权威评测榜单中,Falcon-H1 Arabic以全面领先的性能表现脱颖而出,清晰确立其行业领跑地位:

  • 3B模型:平均得分达61.87%,较主流4B级竞品高出10个百分点,显著领先包括Microsoft的Phi-4 Mini在内的同级模型。
  • 7B模型:平均得分71.47%,全面超越所有约10B参数规模模型,包括卡塔尔的Fanar-1-9B以及沙特阿拉伯的HUMAIN ALLaM 7B。
  • 34B模型:得分高达75.36%,性能表现进一步突破,甚至超越多款70B以上参数规模的超大模型,包括中国的Qwen2.5 72B以及META的Llama-3.3 70B。

除在OALL榜单上展现领先优势外,Falcon-H1 Arabic系列模型在多项更具针对性的专业基准测试中同样取得卓越成绩,包括:(i)3LM,用于评估STEM领域的推理能力;(ii)ArabCulture,用于衡量文化与语境理解水平;以及(iii)AraDice,专注于阿拉伯语方言理解与识别能力。

综合各项评测结果,此次成果标志着阿拉伯语人工智能领域迎来关键性突破。Falcon-H1 Arabic不仅在通用及专项基准测试中全面超越多款参数规模数倍于己的模型,更在语言理解深度、推理能力与计算效率等核心维度上实现质的飞跃,树立了全新的行业标杆。由此,Falcon-H1 Arabic确立为迄今开发完成的最具能力与通用性的阿拉伯语大型语言模型体系。

TII人工智能与数字研究中心(Artificial Intelligence and Digital Research Centre,AIDRC)首席研究员Hakim Hacid 表示:“这一模型充分体现了我们打造阿拉伯语人工智能的核心理念——不仅在技术上更为先进,更能够在真实应用场景中切实发挥价值。通过在效率、理解深度以及语言覆盖范围上的持续提升,我们正在赋能人工智能系统,更好地支持本地区的机构、开发者与社区发展。”

该模型在上下文处理能力上实现重大跃升,支持最高256K tokens的超长上下文窗口,使模型能够在单次交互中高效处理大规模信息内容。实际应用中,用户可对冗长的法律文本、医疗记录、学术论文或企业级知识库进行连续、完整的分析,而不会出现语境中断或信息遗失——这一能力在此前同等规模的模型中尚属首次实现。

自2023年以来,TII的Falcon系列人工智能模型持续在多项区域性与全球性基准评测中位居首位。此次,Falcon-H1 Arabic在不同参数规模下全面领跑Open Arabic LLM Leaderboard,进一步巩固其领先优势。这一系列成绩充分体现了TII在打造具备主权属性、并可在全球最高技术舞台上竞争的人工智能能力方面的卓越实力,同时也有力推动了阿布扎比及更广泛的阿拉伯联合酋长国在阿拉伯语人工智能研究与创新领域的国际领导地位。

新一代模型现已通过TII对外开放的公共平台正式上线,用户可在其交互式体验环境(playground)中进行访问与试用:https://chat.falconllm.tii.ae。

来源:AETOSWire

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆(图片来源:AETOSWire)

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆(图片来源:AETOSWire)

✽本文转载自互联网,请读者仅作参考,并自行核实相关内容(BW)。

Wi-Fi 8突破传输限制,打造更稳定、低延迟的无线网络环境 美国加州圣何塞--(美国商业资讯)--全球无线测试解决方案提供商LitePoint宣布,与联发科技携手开发Wi-Fi 8技术测试方案。此次合作将协助产品开发商加速Wi-Fi 8产…
  • 公司
  • 3小时前
  • 文传商讯
本次战略收购为公司带来310余家企业客户及成熟的Ekara DEM平台,巩固ITRS作为金融服务及受监管企业领先可观测性平台的地位 伦敦--(美国商业资讯)-- ITRS是金融服务及受监管行业实时IT监测与可观测性解决方案的领先供应商。该公…
Lenovo Agentic AI为各类组织提供所需的治理、工具、建议和持续支持,助力其更快速、更智能地部署和管理生产就绪型AI智能体,将AI发展蓝图转化为可衡量的影响。 全新推出的三大Lenovo xIQ交付平台,通过提供让企业自信地扩展…
Siemens与NVIDIA正借助人工智能技术,重塑覆盖设计、工程、制造、生产、运营直至供应链的端到端工业全价值链 Siemens与NVIDIA将共同构建由人工智能加速的技术产品组合,涵盖人工智能原生电子设计、人工智能原生仿真以及人工智能驱…
公司概述血液腫瘤領域核心領導優勢、2026年多項資料催化劑、獨特的全球臨床開發快車道,以及持續卓越的財務表現 加州聖卡洛斯--(美國商業資訊)--全球性腫瘤公司BeOne Medicines Ltd. (NASDAQ: ONC; HKEX:…
  • 健康
  • 3小时前
  • 文传商讯
智能门店服务、原生人工智能零售助手与混合式人工智能服务,助力零售商减少运营中断时间,赋能一线团队,并实现实体店与数字商店的人工智能规模化部署。 纽约--(美国商业资讯)--每当线上商店出现故障、系统崩溃或一线员工缺乏即时应对工具时,零售商就…
先进的欺诈预防、多层验证和创新数据驱动型安全解决方案是Experian Ascend Platform的核心 加州科斯塔梅萨--(美国商业资讯)-- Experian今日宣布,公司在“IDC MarketScape:2025年全球金融服务身…
  • 公司
  • 2025-11-10
  • 文传商讯
阿布扎比,阿联酋--(美国商业资讯)--阿布扎比正式启动金融科技、保险、数字与另类资产(FIDA)产业集群,旨在加速下一代金融与投资解决方案的创新发展,并巩固酋长国作为全球资本枢纽的核心地位。 该产业集群由阿布扎比经济发展部(ADDED)和…
  • 公司
  • 2025-12-12
  • 文传商讯