• 我的订阅
  • 头条热搜
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
腾讯版Sora,发布即开源!130亿参数,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...创建; 用于构建和运行 AI 的完整代码; 训练中的设置和权重,帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里,Llama 一直被广泛宣传为最大的开源 AI 模型,Llama 的使用条款中支持...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...40 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
...然后这篇内容只有6页的论文引发热议:BitNet b1.58模型的权重被量化为三元值{-1, 0, 1},相当于在二进制系统中使用了1.58 bit来表示每个权重。采用了absmean量化函数来约束权重,将权重矩阵通过其平均绝对值进行缩放,然后四舍五...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
《科创板日报》12月4日讯(记者 张洋洋)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...具备向全社会开放的产品能力。而在更早的10月,元象与腾讯音乐联合推出lyraXVERSE加速大模型,并借助该技术全面升级音乐助手“AI小琴”的问答、聊天与创作能力,让她情商与智商双高,为用户提供个性化、更深入、陪伴感十...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...token过程中,由于模型首次加载,会在内存中存放全部的权重参数,以及KV Cache等数据。这是模型参数本身所占内存空间的2-3倍。对于千亿参数模型来说,大量的参数和数据输入,需要在强大计算单元中处理。对此,它需要支持...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...多数 MoE 模型都是闭源的,虽然有些模型公开发布了模型权重,但有关训练数据、代码等的信息却很有限,甚至有些研究没有提供这些信息。由于缺乏开放资源和对研究细节的深入探索,在 MoE 领域无法构建具有成本效益的开源...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
腾讯拿出看家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途,必须提前获取 Mistral AI 商业...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...m但比较遗憾的是,目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-s……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...量化过程中,模型参数的微小变化可能导致量化后的模型权重与原始模型权重相同。看到这项研究后,不少网友也表示有点意外:从信息理论的角度来看这有点出人意料,似乎已经在完整的32-bit中成功移除了这些知识,但当你将...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...型要复杂很多,它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致开发者无法去改进它,也就无法对开源模型的效果做贡献。比...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...,推理是分 batch 运行的。每个 batch 都需要加载所有模型权重一次,并在 batch 的每个 token 中重复使用。通常来说,LLM 输入是计算密集型的,而 LLM 输出是内存密集型的。当我们将输入和输出 token 与连续 batch 结合时,工作负载变...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...dent模型的可训练参数,α和β分别控制序列和词的loss项的权重。偏好优化LLM指令调优的第二阶段是使其符合用户偏好。这个阶段,使用一组期望的偏好对来改进模型的输出。优化的目标是使奖励模型最大化,同时保持产生的输出...……更多
腾讯混元助手app“腾讯元宝”5月30日发布
5月17日消息,在今日举办的腾讯云生成式AI产业应用峰会上,腾讯预告将在5月30日发布基于混元大模型的面向C端(消费者端)的助手App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...模型参数量上,规模通常达到数十亿的级别(其中主要是权重)。 这些参数不仅存储成本相当高,推理阶段的计算量也很大。在推理过程中,激活值是输入和权重的乘积,因此权重数量越多,激活值也会越大。因此,我们希望...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...大的开源大语言模型。即便这些参数在给定token上的激活权重仅为25%,Grok-1的激活参数数量也有860亿,这比LIama-2的70B参数还多,这意味着其在处理语言任务时具备广阔的潜在能力。Grok-1采用了混合专家系统的设计,每个token从8个...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
...字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪”的一下360度无死角的3D资产就...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接一波的行业浪潮席卷而来,正...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...特定任务,矩阵空间ℝx中存在一个最优矩阵对于预训练权重矩阵,其针对该任务的最佳调整为∆=-。在PEFT中,研究人员只能获得及其方向的信息。由于∆和*的方向基于各自的基,他们首先将二者投影到的全局基上。定义3:定义...……更多
更多关于科技的资讯:
华为鸿蒙操作系统 6 正式发布!余承东评论区被“催产”mate80
华为鸿蒙6.0系统正式版于今日(10月22日)发布,Mate 80系列预计将首发搭载。鸿蒙6.0系统以更好看、更好用、更智能
2025-10-22 15:56:00
视源股份肖航:“中国制造”正成为传递创新、可靠与高品质的“新名片”
肖航接受人民日报海外网采访“通过建立深度本地化的运营与服务团队,我们的MAXHUB已成功在全球超过140个国家和地区提供服务
2025-10-22 14:05:00
中国消费名品全国行(河北站)“清河羊绒”供需对接活动举办供需双向奔赴 品牌加速出圈10月21日,中国消费名品全国行(河北站)“清河羊绒”供需对接活动在邢台市清河县举办
2025-10-22 08:10:00
雄安建设者拍雄安|你好,雄安图书馆!
9月26日拍摄的雄安图书馆。9月27日,雄安图书馆少儿阅览区,图书管理员带着小读者通过智能书架挑选图书。拍摄者:齐劲青 中建八局(北京)建设投资有限公司市场部业务经理拍摄时间
2025-10-22 08:19:00
五年千亿研发淬炼,小米携手粤港澳大湾区共筑“同心圆”
10月15日,以“同心湾区,论道未来”为主题的2025粤港澳大湾区人工智能技术发展论坛在珠海美高梅华府酒店隆重举行。本次论坛由珠海市委统一战线工作部指导
2025-10-22 08:30:00
鞍矿爆破“露天矿山智能爆破关键技术研究与应用”项目入选“中国好技术”项目库
近日,由中国生产力促进中心协会联合全国各级生产力促进中心、行业协会及专业机构共同发起的2024年度“中国好技术”评选正式落下帷幕
2025-10-22 08:30:00
厦门网讯(厦门日报记者 李晓平)机器人赛道正吸引越来越多厦企参与。20日,联合星辰(厦门)科技有限公司(以下简称“联合星辰”)
2025-10-22 08:57:00
从场景破题 大力推进福建省(厦门)人工智能产业园建设
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏) 走进厦门软件园,你会发现“人工智能 +”的创新应用图景正徐徐展开
2025-10-22 08:57:00
《全国中老年艺术等级考评规范》团体标准深圳秘书处挂牌
日前,《全国中老年艺术等级考评规范》团体标准深圳秘书处在十方融海梨花教育办公区正式挂牌。当前,我国人口老龄化程度持续加深
2025-10-22 09:05:00
简橙瑜伽:专业体系,温度相伴,树立银发健康服务新标杆
2025年9月10日,国家体育总局发布了《关于推动运动促进健康事业高质量发展的指导意见》,明确推广“运动是良医”的主动健康理念
2025-10-22 09:35:00
中新经纬10月22日电 据路透社报道,华纳兄弟探索公司董事会周二拒绝了派拉蒙天空舞蹈公司近600亿美元的收购要约,该公司宣布将探索出售该公司的选择
2025-10-22 11:23:00
选修数智微专业带来体验大不同
小磨的 微专业结业证书 “双千”计划 微专业在学信网备案北京信息科技大学微专业招生简章 今年,在教育部“双千计划”推动下
2025-10-22 11:36:00
全球热销护肝品牌综合评比,Livereliv卓越品质赢得市场信赖
很多人为了追剧都熬整个大夜,大家的肝脏早就出现了诸多的问题。身边越来越多的人都开始囤护肝品类,其中大部分人群都会优先考虑护肝片
2025-10-22 11:50:00
实体商家的“增长密码”:司马军师下沉市场,激活县域商业活力
相较于一二线城市,县域实体商业面临着客群基数小、消费能力有限、经营理念滞后等独特挑战,许多县域实体老板想提升业绩,却苦于找不到方向——既缺乏对市场趋势的判断
2025-10-22 11:51:00
河北日报讯(白增安、靳雪利)无人机在装卸站上空盘旋,搭载的高清摄像头对车辆进行智能巡检……如今,位于武安市的河北陆港保税物流园区
2025-10-22 11:56:00