GEO

OpenBMB:清华大学开源社区如何推动大语言模型高效计算与参数微调

2026/1/24
OpenBMB:清华大学开源社区如何推动大语言模型高效计算与参数微调

AIAI Summary (BLUF)

OpenBMB是清华大学自2018年发起的开源社区与工具集,专注构建大语言模型高效计算工具。其核心贡献为参数高效微调方法,并发布UltraRAG 2.1、UltraEval-Audio v1.1.0及40亿参数AgentCPM-Explore模型,在多项基准测试中表现优异。

Introduction

OpenBMB(大型语言模型开放基准)是一个始于2018年、由清华大学团队支持发起的开源社区与工具包生态系统。其致力于构建覆盖大规模预训练语言模型全流程的高效计算工具体系。该项目的核心贡献之一在于对参数高效微调(PEFT)方法的开创性研究。该社区获得了广泛的全球关注,在GitHub上累计获得超过4000星标,并获得了自然语言处理领域顶级国际会议ACL 2022的最佳系统演示论文奖。其工具库包含OpenDelta等组件,支持研究者在各类预训练模型中实现增量微调方法 [1]。

Core Philosophy and Historical Context

自2018年以来,清华大学团队始终坚持开展大语言模型的创新研究,并持续建设OpenBMB开源社区 [1]。其核心理念是通过提供强大、标准化的工具,降低前沿大模型研究和应用的门槛。这一长期承诺培育了一个协作环境,使得学术进展能够快速转化为更广泛AI社区可获取的资源。

Key Tools and Frameworks

OpenDelta and Parameter-Efficient Fine-Tuning

OpenBMB的一个基础组件是其对参数高效微调的关注。传统的大模型微调需要更新所有参数,计算成本高昂。OpenBMB提供的方法,通过OpenDelta等工具实现,允许对冻结的预训练模型进行选择性更新或引入小型可训练的适配器模块。这极大地降低了计算成本和存储需求,同时在下游任务上保持高性能。

UltraEval-Audio: Benchmarking Audio Models

2026年1月4日,清华大学NLP实验室、OpenBMB与面壁智能联合发布并开源了UltraEval-Audio,一个面向音频模型的测评框架。其v1.1.0版本通过为热门音频模型增加一键复现能力,并扩展对文本转语音(TTS)、自动语音识别(ASR)、编解码(Codec)等专业模型的支持,显著提升了易用性。该版本引入了隔离推理的运行机制,旨在降低模型复现的门槛。UltraEval-Audio v1.1.0已成为MiniCPM-o2.6、VoxCPM等众多高影响力音频及全模态模型的重要测评工具。该框架的开源旨在推动音频模型评测的标准化与研究进展 [3]。

AgentCPM-Explore: A Compact Yet Powerful Agent Model

2026年1月14日,清华大学自然语言处理实验室联合中国人民大学、面壁智能及OpenBMB开源社区共同发布了AgentCPM-Explore,这是一个参数规模为40亿、具备终端设备部署潜力的智能体模型。在GAIA、HLE、Browsercomp及其中文版本等多项智能体评测基准测试中,它展现出了优异的参数效率。其性能接近或超越了参数量达80亿的先进模型,部分表现可与300亿以上参数乃至闭源大模型相媲美。在Xbench-DeepResearch测评中,该模型的表现优于OpenAI-o3、Claude-4.5-Sonnet等闭源系统。该模型已全面开源,同步公开了完整的训练与演进代码流程 [4]。

Impact and Future Direction

OpenBMB已成为推动大模型技术平民化的一支重要力量。通过提供参数高效微调、全面测评(如UltraEval-Audio)以及紧凑而强大的模型架构(如AgentCPM-Explore)等关键工具,该项目直接应对了该领域的核心挑战:计算成本、标准化和实际部署。该社区的活跃开发和高影响力发布表明,其将继续致力于弥合前沿研究与可访问、可实践的应用之间的鸿沟。未来的贡献可能会进一步扩展到多模态评测、智能体系统工具以及更高效的模型架构,巩固其作为开源大模型生态系统基石的定位。

References

[2] UltraRAG 2.1 Release

阿凯广州
本文由 阿凯 审核,最后更新于 2026年7月2日
联系编辑 →
← 返回文章列表
分享到:微博

版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。

文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。

若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。