混元Hy3 preview实测：不追榜单的腾讯，开始“出卷子“了

张开发

• 2026/4/25 16:29:22 • 15 分钟阅读

分享文章

这周国产大模型扎堆发布阿里Qwen 3.6 Max、月之暗面Kimi 2.6、DeepSeek V4箭在弦上……混元Hy3 preview也在昨天亮相。作为腾讯首席AI科学家姚顺雨主导的第一代模型它的定位很明确不到榜单打分到真实世界解决问题。先看数据维度数据参数295B总量 / 21B激活上下文256K约20万字SWE-Bench53.0% → 74.4%提升40%价格输入1.2元/百万tokens / 输出4元/百万tokensSWE-Bench 74.4%是什么概念接近GLM-4.7的水平在国产模型里属于第一梯队。实测能做什么编程场景WorkBuddy实测3D金门大桥交互体验能跑但不够写实受工具限制游乐场经营小游戏能玩UI审美偏渐变紫复杂数据抓取可视化链路稳定但最后一公里有缺失办公场景PDF转HTML能准确定位信息但精美排版难深度研究报告数据来源权威可直接使用数据可视化调研时间长输出质量高日常聊天主打活人感不只会顺从会主动分析原因、给建议创意写作风格更个性化AI味降低腾讯的转向姚顺雨在内部会有个判断“模型过度追逐榜单成绩将打榜语料放入训练集数据被污染了。模型很会答题到了真实场景却不稳定。”这句话点破了行业痛点榜单衡量能力上限用户感知能力下限MMLU领先两个百分点用户几乎感知不到指令遵循稍差、格式不稳定体验断崖下降所以Hy3 preview不打榜了开始出卷子——解决真实世界的复杂问题。落地场景目前Hy3 preview已在元宝App / QQCodeBuddy / WorkBuddy腾讯文档企业微信内微盛·企微管家Claw企业微信场景对于企业微信用户**微盛·企微管家Claw**已经接入了Hy3 preview可以在客服、文档处理、数据分析场景中体验。写在最后Hy3 preview呈现的是一种过渡态特征Agent能力已具备但执行不够稳定技术方向验证了但工程优化还在路上榜单不打分了但真实场景的考验才刚开始腾讯的AI战略正在从追赶榜单转向解决问题。这条路走对了但还需要时间。月活数据是现实的豆包3.45亿、千问1.66亿、DeepSeek 1.27亿而元宝才5700万。但腾讯的筹码是微信生态——13亿用户的雪球滚起来谁也不知道会发生什么。

混元Hy3 preview实测：不追榜单的腾讯，开始“出卷子“了

最新文章

27届福建农林大学生物学考研初试复习资料｜611化学+821生物化学｜生科院与未来技术学院通用

宁夏大学化学工程与技术（081700）考研复试资料PDF合集｜含2012–2018真+2025最新备考指南

APKMirror客户端：3大核心功能如何重塑你的Android应用管理体验？[特殊字符]

2026浏览器指纹隔离技术深度对比与大规模集群部署性能优化实践

如何完整备份QQ空间记忆：GetQzonehistory免费开源工具实用指南

ShowUI：用Python快速构建Web界面的声明式UI库实践指南

推荐文章

《前沿洞察：AI 面试季、Agent 开发痛点与人机协作架构的未来》

别再插错线了！一张图看懂USB 2.0/3.0线序与颜色定义（附ZYNQ开发板实测）

别再只靠复位了！Xilinx FIFO IP核清空的三种实战方法（附Verilog代码）

如何在 CGO 中正确处理带 const char- 参数的 C 回调函数

JavaScript的Symbol.unscopables：影响with语句行为的属性

一次由Nginx的proxy_pass尾随斜杠引发的重定向循环

相关文章

如何为AMD 780M APU解锁2-3倍AI性能？ROCmLibs-for-gfx1103终极优化指南

企业内网必看：用U盘搞定Ubuntu服务器Docker离线部署（含依赖树分析）

OpenCode智能编程助手全面部署指南：从环境搭建到高级应用

大语言模型背后的秘密：从预训练到微调，揭秘LLM高效训练的核心技术（含QLoRA/ZeRO实战）

RBDdimmer：嵌入式AC相位调光库详解

新手零失败指南：利用快马ai轻松完成openclaw的ubuntu环境搭建

分享文章

更多文章

LabVIEW专栏：队列实战——从并行处理到数据流控制

CSS选择器高级用法：精准控制样式

Real Anime Z在AR应用中的价值：真实系二次元贴纸实时渲染适配方案

深入浅出聊聊“合并报表”这一概念

【独家首发】Docker官方未公开的WASM OCI扩展规范草案v0.3（附逆向解析的proto定义与go bindings源码）

题解：洛谷 P2540 [NOIP 2015 提高组] 斗地主加强版

git中，实用命令集合

终极指南：Switch大气层系统1.7.1完整安装与功能解锁

如何用Speechless免费Chrome插件永久备份微博记忆：终极PDF导出方案

AI Agent Benchmark全景解析：如何科学评测智能体的真实能力

ZED 2i传感器标定避坑指南：为什么你的Allan方差曲线不对？从数据采集到结果分析全解析

Youtu-Agent：基于开源大模型的高性能智能体框架实战指南