• 我的订阅
  • 科技

腾讯推出 Hunyuan-Large 开源大模型

类别:科技 发布时间:2024-11-05 18:56:00 来源:卓越科技

IT之家11月5日消息,腾讯今日宣布推出Hunyuan-Large大模型,官方表示这是目前业界已经开源的基于Transformer的最大MoE模型,拥有3890亿总参数(389B)和520亿激活参数(52B)。

腾讯推出 Hunyuan-Large 开源大模型

腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hunyuan-A52B-Instruct和Hunyuan-A52B-Instruct-FP8。并发布了技术报告和训练推理操作手册,详细介绍了模型能力和训练与推理的操作。

其中模型技术优势如下:

高质量合成数据:通过合成数据增强训练,Hunyuan-Large能够学习到更丰富的表示,处理长上下文输入,并更好地泛化到未见数据

KV缓存压缩:采用分组查询注意力(GQA)和跨层注意力(CLA)策略,显著减少了KV缓存的内存占用和计算开销,提高了推理吞吐

专家特定学习率缩放:为不同专家设置不同的学习率,确保每个子模型都能有效地从数据中学习,并为整体性能做出贡献

长上下文处理能力:预训练模型支持高达256K的文本序列,Instruct模型支持128K的文本序列,显著提升了长上下文任务的处理能力

广泛的基准测试:在多种语言和任务上进行广泛实验,验证了Hunyuan-Large的实际应用效果和安全性

腾讯推出 Hunyuan-Large 开源大模型

▲Hunyuan-Large预训练模型与具有相似激活参数大小的Dense和MoE竞争对手相比

IT之家附相关链接如下:

论文:https://arxiv.org/pdf/2411.02265

Github:https://github.com/Tencent/Tencent-Hunyuan-Large

Huggingface:https://huggingface.co/tencent/Tencent-Hunyuan-Large

腾讯云:https://cloud.tencent.com/product/hunyuan

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-05 20:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源
2024-11-06 09:41:00
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...始人、前CEO王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、微软、字节等知名科技公司的AI顶尖人才组成
2023-10-30 15:02:00
腾讯云近日宣布,其自主研发的实用级大模型——腾讯混元大模型已首批通过备案,并将于近日正式上线并逐步向公众开放。据悉,腾讯混元大模型具有超千亿参数规模和预训练语料超2万亿token
2023-09-16 21:45:00
腾讯自研混元大模型亮相,将通过腾讯云对外开放
...入长跑期,从参数至上转向实用优先。在今天举行的2023腾讯全球数字生态大会上,腾讯混元大模型亮相,并宣布通过腾讯云对外开放。据悉,腾讯混元大模型是由腾讯全链路自研的通用大语言
2023-09-07 13:57:00
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源
2024-12-04 09:48:00
腾讯推出了一条大模型“高速公路”,大模型通信性能可提升10倍 | 最前线
...,达到了前所未有的高度,迫使基础设施经历一轮升级。腾讯云副总裁、腾讯云网络总经理王亚晨近日,腾讯云就首次对外完整披露自研高性能计算网络“星脉”,专门面向AI大模型训练。高性能
2023-06-30 15:28:00
腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5
腾讯混元大模型logo。“百模大战”新增又一巨头:腾讯官宣参战。9月7日,在2023腾讯全球数字生态大会上,腾讯正式发布混元大模型,并宣布通过腾讯云对外开放。资料显示,腾讯混元大
2023-09-08 11:20:00
大模型应用疯狂加速,洗牌却在静悄悄进行了
...公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接
2023-10-07 15:24:00
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言
2023-10-29 10:13:00
更多关于科技的资讯: