• 我的订阅
  • 头条热搜
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
腾讯版Sora,发布即开源!130亿参数,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...创建; 用于构建和运行 AI 的完整代码; 训练中的设置和权重,帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里,Llama 一直被广泛宣传为最大的开源 AI 模型,Llama 的使用条款中支持...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...40 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
...然后这篇内容只有6页的论文引发热议:BitNet b1.58模型的权重被量化为三元值{-1, 0, 1},相当于在二进制系统中使用了1.58 bit来表示每个权重。采用了absmean量化函数来约束权重,将权重矩阵通过其平均绝对值进行缩放,然后四舍五...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
《科创板日报》12月4日讯(记者 张洋洋)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...具备向全社会开放的产品能力。而在更早的10月,元象与腾讯音乐联合推出lyraXVERSE加速大模型,并借助该技术全面升级音乐助手“AI小琴”的问答、聊天与创作能力,让她情商与智商双高,为用户提供个性化、更深入、陪伴感十...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...token过程中,由于模型首次加载,会在内存中存放全部的权重参数,以及KV Cache等数据。这是模型参数本身所占内存空间的2-3倍。对于千亿参数模型来说,大量的参数和数据输入,需要在强大计算单元中处理。对此,它需要支持...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...多数 MoE 模型都是闭源的,虽然有些模型公开发布了模型权重,但有关训练数据、代码等的信息却很有限,甚至有些研究没有提供这些信息。由于缺乏开放资源和对研究细节的深入探索,在 MoE 领域无法构建具有成本效益的开源...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
腾讯拿出看家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途,必须提前获取 Mistral AI 商业...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...m但比较遗憾的是,目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-s……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...量化过程中,模型参数的微小变化可能导致量化后的模型权重与原始模型权重相同。看到这项研究后,不少网友也表示有点意外:从信息理论的角度来看这有点出人意料,似乎已经在完整的32-bit中成功移除了这些知识,但当你将...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...型要复杂很多,它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致开发者无法去改进它,也就无法对开源模型的效果做贡献。比...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...,推理是分 batch 运行的。每个 batch 都需要加载所有模型权重一次,并在 batch 的每个 token 中重复使用。通常来说,LLM 输入是计算密集型的,而 LLM 输出是内存密集型的。当我们将输入和输出 token 与连续 batch 结合时,工作负载变...……更多
腾讯混元助手app“腾讯元宝”5月30日发布
5月17日消息,在今日举办的腾讯云生成式AI产业应用峰会上,腾讯预告将在5月30日发布基于混元大模型的面向C端(消费者端)的助手App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...dent模型的可训练参数,α和β分别控制序列和词的loss项的权重。偏好优化LLM指令调优的第二阶段是使其符合用户偏好。这个阶段,使用一组期望的偏好对来改进模型的输出。优化的目标是使奖励模型最大化,同时保持产生的输出...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...模型参数量上,规模通常达到数十亿的级别(其中主要是权重)。 这些参数不仅存储成本相当高,推理阶段的计算量也很大。在推理过程中,激活值是输入和权重的乘积,因此权重数量越多,激活值也会越大。因此,我们希望...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...大的开源大语言模型。即便这些参数在给定token上的激活权重仅为25%,Grok-1的激活参数数量也有860亿,这比LIama-2的70B参数还多,这意味着其在处理语言任务时具备广阔的潜在能力。Grok-1采用了混合专家系统的设计,每个token从8个...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
...字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪”的一下360度无死角的3D资产就...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接一波的行业浪潮席卷而来,正...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...特定任务,矩阵空间ℝx中存在一个最优矩阵对于预训练权重矩阵,其针对该任务的最佳调整为∆=-。在PEFT中,研究人员只能获得及其方向的信息。由于∆和*的方向基于各自的基,他们首先将二者投影到的全局基上。定义3:定义...……更多
更多关于科技的资讯:
本文转自:人民网人民网北京2月22日电 (记者许维娜)2025FIFA世俱杯倒计时4个月,这场备受瞩目的足球盛宴的筹备工作正紧锣密鼓地推进
2025-02-23 16:43:00
小伙30多万买机器人对外租8000一天:订单排到下月
快科技2月23日消息,据报道,近日湖南长沙的雷先生花费30多万元购入了一台宇树人行机器人,随后以每天8000元的价格对外出租
2025-02-23 17:01:00
2分20秒869!九号Ninebot E300P MK2创珠海赛车场首个量产电摩圈速纪录
快科技2月23日消息,九号公司宣布其Ninebot E300P MK2电动摩托车在珠海国际赛车场以2分20秒869的成绩刷新了该赛道首个量产电动摩托车的圈速纪录
2025-02-23 17:31:00
聚力建支点 夺取开门红丨湖北人杰:质效双升 预计一季度下线量相当于去年半年
十堰广电讯(全媒体记者 陈林 通讯员 黄兴林)在十堰工业新区,湖北人杰特种汽车科技有限公司每一辆整车在安装随车起重机后
2025-02-23 18:48:00
AMD RDNA4 GPU核心尺寸、晶体管首曝!RX 9070 XT和NV比到底啥水平
快科技2月23日消息,AMD基于新一代RDNA4 GPU架构的RX 9070系列显卡,将于北京时间2月28日21点整正式登场
2025-02-23 13:01:00
神车归来!全新五菱宏光燃油版曝光:搭载1.5L自吸发动机
快科技2月23日消息,日前,全新五菱宏光燃油版新车型在工信部曝光。该车搭载1.5升自然吸气发动机,最大功率提升至81千瓦
2025-02-23 13:01:00
小鹏汽车拖车上起火 拖板车跟着躺枪
快科技2月23日消息,有博主分享视频显示,一辆小鹏汽车在高架上发生起火事故。视频中,这辆小鹏汽车是在拖车上起火,车辆已被大火完全包围
2025-02-23 13:01:00
东南网2月23日讯(福建日报记者 赖昊拓)党的二十届三中全会提出,完善扩大消费长效机制,减少限制性措施,合理增加公共消费
2025-02-23 13:09:00
天元智能与上海宇山红签署合作协议,领航加气制品行业战略新高度
2025年2月15日,天元智能与上海宇山红新型建材有限公司正式签署合作协议,双方将共同建设一条年产超100万方的蒸压加气混凝土超大产量生产线
2025-02-23 13:16:00
东南网2月23日讯 (福建日报记者 张辉) 22日,2台由我省企业自主研发的蛋禽养殖机器人“木鸡郎6”完成打包后,在福州马尾港装船出海
2025-02-23 13:20:00
小米15 Ultra长焦镜头体积碾压iPhone 16 Pro Max:业界最强 没有之一
快科技2月23日消息,日前,小米集团总裁卢伟冰开启小米15 Ultra爆料直播,详细曝光了新机影像配置,并展示了与iPhone 16 Pro Max长焦镜头模组的对比
2025-02-23 13:31:00
李子坝轻轨上重庆必吃榜 游客排队“吃”轻轨
快科技2月23日消息,近期,有网友发现,李子坝轻轨站登上了“重庆网络必吃榜”。网友发布视频中,有人隔江站在李子坝轻轨站对面
2025-02-23 14:01:00
龙芯DeepSeek推理一体机发布:CPU、系统全国产 摆脱对国外技术依赖
快科技2月23日消息,日前,龙芯中科宣布成功发布基于DeepSeek大模型的软硬全栈推理一体机。产品实现从芯片、系统到框架的全栈国产化支持
2025-02-23 14:31:00
奔驰G级家族添新丁!“小号G级”即将亮相 价格更亲民
快科技2月23日消息,奔驰官方最近发布了G级家族的新成员信息,一款基于MMA架构的“小号G级”车型即将亮相,并为其命名为g级
2025-02-23 14:31:00
前女友公开喊话马斯克:孩子正面临医疗危机、请立即回应
快科技2月23日消息,加拿大歌手Grimes近日在社交媒体上公开喊话前男友、特斯拉CEO埃隆·马斯克,称他们共同的孩子正面临一场“医疗危机”
2025-02-23 14:31:00