[点晴永久免费OA]手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
当前位置:点晴教程→点晴OA办公管理信息系统
→『 经验分享&问题答疑 』
腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。
这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。
新开源的4 个模型属于融合推理模型,具备推理速度快、性价比高的特点,用户可根据使用场景灵活选择模型思考模式——快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。 效果上,四个模型均实现了跟业界同尺寸模型的对标,特别是在语言理解、数学、推理等领域有出色表现,在多个公开测试集上得分达到了领先水平。 ![]() ![]() 这四个模型的亮点在于agent和长文能力,跟此前开源的Hunyuan-A13B模型一样,技术上通过精心的数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等agent能力上的表现,让模型实际应用中可以轻松胜任深度搜索、excel 操作、旅行攻略规划等任务。 此外,模型原生长上下文窗口达到了 256k,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》小说 ,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。 部署上,四个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多种量化格式均能够支持。 应用层面,四款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用,可用性和实用性经过了实践的检验,是真正实用的模型。
多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了业界领先的文生图、视频生成和 3D 生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到3000 个。上周,腾讯发布并开源混元3D世界模型1.0,这一模型一经发布即迅速登上Hugging Face趋势榜第二,下载量飙到近9k,混元3D世界模型技术报告还拿下了Hugging Face论文热榜第一。 开源是腾讯混元大模型长期坚持的方向,未来腾讯混元也将不断提升模型能力,继续积极拥抱开源,推出更多尺寸、更多模特的模型,加速产业落地和应用,与开发者和合作伙伴共建大模型开源生态。 官网体验地址:腾讯混元 Github: Hunyuan-0.5B:GitHub - Tencent-Hunyuan/Hunyuan-0.5B Hunyuan-1.8B:https://github.com/Tencent-Hunyuan/Hunyuan-1.8B Hunyuan-4B:https://github.com/Tencent-Hunyuan/Hunyuan-4B Hunyuan-7B:GitHub - Tencent-Hunyuan/Hunyuan-7B: Tencent Hunyuan 7B (short as Hunyuan-7B) is one of the large language dense models of Tencent Hunyuan HuggingFace: Hunyuan-0.5B:https://huggingface.co/tencent/Hunyuan-0.5B-Instruct Hunyuan-1.8B:https://huggingface.co/tencent/Hunyuan-1.8B-Instruct Hunyuan-4B:https://huggingface.co/tencent/Hunyuan-4B-Instruct Hunyuan-7B:https://huggingface.co/tencent/Hunyuan-7B-Instruct 阅读原文:原文链接 该文章在 2025/8/13 17:47:52 编辑过 |
关键字查询
相关文章
正在查询... |