• 我的订阅
  • 头条热搜
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
腾讯版Sora,发布即开源!130亿参数,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...创建; 用于构建和运行 AI 的完整代码; 训练中的设置和权重,帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里,Llama 一直被广泛宣传为最大的开源 AI 模型,Llama 的使用条款中支持...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...40 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
...然后这篇内容只有6页的论文引发热议:BitNet b1.58模型的权重被量化为三元值{-1, 0, 1},相当于在二进制系统中使用了1.58 bit来表示每个权重。采用了absmean量化函数来约束权重,将权重矩阵通过其平均绝对值进行缩放,然后四舍五...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
《科创板日报》12月4日讯(记者 张洋洋)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...具备向全社会开放的产品能力。而在更早的10月,元象与腾讯音乐联合推出lyraXVERSE加速大模型,并借助该技术全面升级音乐助手“AI小琴”的问答、聊天与创作能力,让她情商与智商双高,为用户提供个性化、更深入、陪伴感十...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...token过程中,由于模型首次加载,会在内存中存放全部的权重参数,以及KV Cache等数据。这是模型参数本身所占内存空间的2-3倍。对于千亿参数模型来说,大量的参数和数据输入,需要在强大计算单元中处理。对此,它需要支持...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...多数 MoE 模型都是闭源的,虽然有些模型公开发布了模型权重,但有关训练数据、代码等的信息却很有限,甚至有些研究没有提供这些信息。由于缺乏开放资源和对研究细节的深入探索,在 MoE 领域无法构建具有成本效益的开源...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
腾讯拿出看家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途,必须提前获取 Mistral AI 商业...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...m但比较遗憾的是,目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-s……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...量化过程中,模型参数的微小变化可能导致量化后的模型权重与原始模型权重相同。看到这项研究后,不少网友也表示有点意外:从信息理论的角度来看这有点出人意料,似乎已经在完整的32-bit中成功移除了这些知识,但当你将...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...型要复杂很多,它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致开发者无法去改进它,也就无法对开源模型的效果做贡献。比...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...,推理是分 batch 运行的。每个 batch 都需要加载所有模型权重一次,并在 batch 的每个 token 中重复使用。通常来说,LLM 输入是计算密集型的,而 LLM 输出是内存密集型的。当我们将输入和输出 token 与连续 batch 结合时,工作负载变...……更多
腾讯混元助手app“腾讯元宝”5月30日发布
5月17日消息,在今日举办的腾讯云生成式AI产业应用峰会上,腾讯预告将在5月30日发布基于混元大模型的面向C端(消费者端)的助手App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...dent模型的可训练参数,α和β分别控制序列和词的loss项的权重。偏好优化LLM指令调优的第二阶段是使其符合用户偏好。这个阶段,使用一组期望的偏好对来改进模型的输出。优化的目标是使奖励模型最大化,同时保持产生的输出...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...模型参数量上,规模通常达到数十亿的级别(其中主要是权重)。 这些参数不仅存储成本相当高,推理阶段的计算量也很大。在推理过程中,激活值是输入和权重的乘积,因此权重数量越多,激活值也会越大。因此,我们希望...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...大的开源大语言模型。即便这些参数在给定token上的激活权重仅为25%,Grok-1的激活参数数量也有860亿,这比LIama-2的70B参数还多,这意味着其在处理语言任务时具备广阔的潜在能力。Grok-1采用了混合专家系统的设计,每个token从8个...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
...字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪”的一下360度无死角的3D资产就...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接一波的行业浪潮席卷而来,正...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...特定任务,矩阵空间ℝx中存在一个最优矩阵对于预训练权重矩阵,其针对该任务的最佳调整为∆=-。在PEFT中,研究人员只能获得及其方向的信息。由于∆和*的方向基于各自的基,他们首先将二者投影到的全局基上。定义3:定义...……更多
更多关于科技的资讯:
零跑宣布已部署DeepSeek-R1大模型!全新座舱即将上线
快科技2月9日消息,零跑汽车于2月8日宣布,其小零GPT大模型已成功部署DeepSeek-R1大模型,并即将推出。DeepSeek-R1大模型的部署不仅将提升零跑汽车的内部IT团队运营效率
2025-02-09 16:46:00
深化合作,361度携手大润发共促冰雪运动发展
2025年2月9日,国内知名体育品牌361度与大润发在济南大润发历下店正式举行签约仪式,双方将进一步深化合作,共同推动冰雪运动的普及与发展
2025-02-09 17:00:00
奇瑞智能化模型深度接入DeepSeek:将应用于新车与机器人
快科技2月9日消息,奇瑞集团宣布已与人工智能公司DeepSeek深度技术融合,将其智能化大模型系统应用于雄狮智能座舱系统——Lion AI智舱大模型
2025-02-09 17:46:00
2月9日,记者从国网太原市滨河供电公司了解到,为提升电网末端智能化管理,该公司完成了优山美郡三期941户共1008台智能微型断路器安装调试工作
2025-02-09 18:06:00
空客推迟氢动力商用飞机研发计划:技术发展比目标落后5到10年
快科技2月9日消息,据报道,空中客车公司宣布,由于技术发展速度低于预期,该公司将推迟原定于本世纪30年代中期的氢动力商用飞机开发计划至下个十年中期
2025-02-09 18:16:00
本田中国品牌悄悄更名:烨P7改为本田P7
快科技2月9日消息,广汽本田烨P7车型预计今年上市,但最新宣传中已悄然去掉“烨”字。2月3日,广汽本田发布的立春海报中仅提及P7
2025-02-09 18:16:00
逛景区、赏民俗、品美食、看灯展……元宵节马上就要到了,为全力做好元宵节的通信保障,太原移动严格实行24小时不间断值守制度
2025-02-09 18:37:00
外星人Area-51台式机首发59999元:Ultra 9+RTX 4090D组合
快科技2月9日消息,戴尔推出新款外星人Area-51台式机,预售价59999元。据悉,这款台式机使用外星人“预言设计”全塔机箱
2025-02-09 19:16:00
RTX 5090/5080黑屏变砖!NVIDIA终于启动调查
快科技2月9日消息,RTX 5090(D)、RTX 5080上市之后,第一波冲上去入手的玩家,不少都经历了黑屏变砖的噩梦
2025-02-09 19:46:00
全国高铁的心脏!郑州东站变成了“郑妙东站”
快科技2月9日消息,作为中原地区最繁忙的超大高铁站,郑州东站日均开行800多趟列车,6小时内可直达全国128个城市,高峰时段有近2万人同时候车
2025-02-09 19:46:00
院士Shimon Ullman加入欧洲经济研究院
欢迎以色列科学院院士、美国艺术与科学院院士、国际认知科学学会会士、以色列魏茨曼科学研究所计算机科学教授、魏茨曼人工智能中心主任
2025-02-09 19:49:00
Arogyaswami Paulraj加入欧洲经济研究院
欢迎中国工程院院士、美国国家工程院院士、美国艺术与科学院院士、瑞典皇家工程科学院院士、世界科学院院士、斯坦福大学教授、无线通信技术专家
2025-02-09 19:50:00
Kia Nobre院士加入欧洲经济研究院
欢迎美国国家科学院院士、美国艺术与科学院院士、欧洲科学院院士、英国科学院院士、美国耶鲁大学心理学系教授、耶鲁大学吴仔研究所(WTI)副所长
2025-02-09 19:52:00
历史首次!俄宇航员在国际空间站硕士论文答辩
快科技2月9日消息,据报道,俄罗斯总统学院院长阿列克谢·科米萨罗夫在社交媒体上分享了一则令人瞩目的视频。视频中,俄罗斯宇航员伊万·瓦格纳于2月8日在遥远的国际空间站上成功完成了他的硕士论文答辩
2025-02-09 20:46:00
“万千气象看四川” | 攀枝花市盐边县:“马掌· KUANG 野” 西部小镇 精准演绎现代都市生活文旅消费新业态
消费日报网讯(记者 冯举 罗颖)2月5日,记者来到攀枝花市盐边县“马掌·KUANG野”西部小镇。映入眼帘的是商拍,特色西部服饰的游客正在拍摄
2025-02-09 21:11:00