腾讯混元20发布:AI大模型技术新突破

来源:bob官方体育 发布时间:2026-01-23 14:47:48 阅读: 1

  12月5日,腾讯正式对外发布了其自研AI大模型混元2.0(Tencent HY2.0),这是继Hunyuan-T1之后的一次重要升级。HY2.0在参数规模、推理能力及应用场景上均有显著提升,标志着腾讯在AI领域的持续创新与进步。

  HY2.0采用混合专家(MoE)架构,总参数高达406B,激活参数为32B,支持256K的上下文窗口。这种架构设计不仅提升了模型的推理能力和效率,更使得HY2.0在国内AI大模型领域中处于领头羊。根据腾讯的声明,HY2.0在文本创作、复杂指令遵循等实用场景中表现突出,展现了强大的应用潜力。

  在数据预训练和强化学习策略方面,HY2.0Think相较于前一版本有了显著改善。腾讯通过高质量的数据集以及Large Rollout强化学习,使得HY2.0在复杂推理场景中的表现稳居国内第一梯队。尤其是在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等权威测试中,HY2.0Think取得了卓越成绩,显示出其在数学和科学知识推理方面的强大能力。

  在指令遵循和多轮任务的能力上,HY2.0通过重要性采样修正技术,解决了训练和推理不一致的问题,实现了长窗口RL的高效稳定训练。此外,模型采用了多样化的任务沙盒和基于打分准则的强化学习,明显提升了在MultiChallenge等指令遵循任务中的表现。

  在代码和智能体能力方面,HY2.0构建了规模化的可验证环境及高质量合成数据,增强了模型在Agentic Coding及复杂工具调用场景下的实际应用能力。经过测试,HY2.0在SWE-benchVerified和Tau2-Bench等真实应用场景的智能体任务上表现出色,显示出其在实际应用中的广泛适用性。

  值得注意的是,HY2.0Think引入了精细的长度惩罚策略,有效平衡了思维链的效率与效果,避免了模型输出冗余信息,实现了计算资源的更高效分配。根据对比,HY2.0在IMO-AnswerBench、HMMT2025、ARC-AGI、Humanitys Last Exam(HLE)等权威推理任务中的表现,显示出在相似准确率下,HY2.0的token消耗明显低于其他模型,体现了其在智能密度上的行业领先水平。

  通过RLVR+RLHF双阶段的强化学习策略,HY2.0的输出质量有了显著提升,在文本创作、前端开发和指令遵循等实际应用场景中展现出明显的优势。与前版本相比,HY2.0在指令遵循方面的准确率有了明显提升,进一步巩固了其作为腾讯自研通用大模型的地位。

  未来,腾讯将持续对HY2.0进行迭代升级,着重关注代码、智能体、个性化风格和长程记忆等方向,全方面提升模型在实际应用中的表现。同时,有关技术和模型也将以开源形式向社区开放,逐步推动AI技术的发展与应用。

  目前,HY2.0已经率先在腾讯的元宝和ima等原生AI应用中接入,并在腾讯云上线API,用户都能够直接体验或接入部署。随着HY2.0的推出,腾讯在AI领域的创新步伐将持续加快,为各行业的智能化转型提供强有力的技术上的支持。返回搜狐,查看更加多