6月30日,百度负责开源文心大模子4.5系列模子开云「中国」Kaiyun官网登录入口,涵盖47B、3B激活参数的夹杂众人(MoE)模子,与0.3B参数的稠密型模子等10款模子,并结束预考验权重和推理代码的富饶开源。当今,文心大模子4.5开源系列已可在飞桨银河社区、HuggingFace等平台下载部署使用,同期开源模子API就业也可在百度智能云千帆大模子平台使用。早在本年2月,百度就已预报了文心大模子4.5系列的推出蓄意,并明确将于6月30日起负责开源。
文心大模子4.5系列开源模子
这次百度一次性推出10款文心大模子4.5系列开源模子,在零丁自研模子数目占比、模子类型数目、参数丰富度、开源宽松度与可靠性等要道维度上,均处于行业逾越位置。
据先容,文心大模子4.5开源系列针对MoE架构忽视了一种翻新性的多模态异构模子结构,适用于从大说念话模子向多模态模子的捏续预考验范式,在保捏致使升迁文本任务性能的基础上,显赫增强了多模态通晓智商,其优胜的性能主要收货于多模态夹杂众人模子预考验、高效考验推理框架和针对模态的后考验等要道工夫点。
此外,文心大模子4.5开源系列均使用飞桨深度学习框架进行高效考验、推理和部署。在大说念话模子的预考验中,模子FLOPs应用率(MFU)达到47%。践诺抵制暴露,其系列模子在多个文本和多模态基准测试中达到SOTA水平,尤其在请示遵照、寰宇知识驰念、视觉通晓和多模态推理任务上成果杰出。
在文本模子方面,文心大模子4.5开源系列基础智商强、事实准确性高、请示遵照智商强、推理和编程智商出色,在多个主流基准评测中越过DeepSeek-V3、Qwen3等模子。在多模态模子方面,文心大模子4.5开源系列领有超卓的视觉感知智商,同期忽闪丰富视觉学问,并结束了想考与非想考和洽,在视觉学问、多模态推理、视觉感知等主流的多模态大模子评测中优于闭源的OpenAI o1。此外,在轻量模子上,文心4.5-21B-A3B-Base文本模子成果与同量级的Qwen3颠倒,文心4.5-VL-28B-A3B多模态模子亦然当今同量级最佳的多模态开源模子,致使与更大参数模子Qwen2.5-VL-32B不相高下。
文心4.5预考验模子在主流基准测试中剖析优异
文心4.5-300B-A47B模子在主流基准测试中剖析优异
文心多模态后考验模子(赈济想考、关闭想考)在多个多模态基准测试中达到SOTA水平
据了解,文心大模子4.5开源系列权重按照Apache 2.0契约开源,赈济开展学术商议和产业应用。此外,基于飞桨提供开源的产业级树立套件,平日兼容多种芯片,裁汰模子的后考验和部署门槛。
看成国内最早插足AI研发的企业之一,百度在算力、框架、模子到应用的四层布局构建了昭着的AI全栈工夫上风。其中,飞桨是中国首个自主研发、功能丰富、开源通达的产业级深度学习平台,基于多年飞桨开源工夫与生态系统鸠合,这次文心大模子4.5开源系列同步升级发布文心大模子树立套件ERNIEKit和大模子高效部署套件FastDeploy,为文心大模子4.5系列及树立者提供开箱即用的器具和全历程赈济。
值得关心的是,这次文心大模子4.5系列开源后,百度 (BIDU.US开云「中国」Kaiyun官网登录入口,09888.HK)结束了框架层与模子层的“双层开源”,为行业诞生了新标杆。