• 我的订阅
  • 头条热搜
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
腾讯版Sora,发布即开源!130亿参数,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...创建; 用于构建和运行 AI 的完整代码; 训练中的设置和权重,帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里,Llama 一直被广泛宣传为最大的开源 AI 模型,Llama 的使用条款中支持...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...40 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
...然后这篇内容只有6页的论文引发热议:BitNet b1.58模型的权重被量化为三元值{-1, 0, 1},相当于在二进制系统中使用了1.58 bit来表示每个权重。采用了absmean量化函数来约束权重,将权重矩阵通过其平均绝对值进行缩放,然后四舍五...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
《科创板日报》12月4日讯(记者 张洋洋)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...具备向全社会开放的产品能力。而在更早的10月,元象与腾讯音乐联合推出lyraXVERSE加速大模型,并借助该技术全面升级音乐助手“AI小琴”的问答、聊天与创作能力,让她情商与智商双高,为用户提供个性化、更深入、陪伴感十...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...token过程中,由于模型首次加载,会在内存中存放全部的权重参数,以及KV Cache等数据。这是模型参数本身所占内存空间的2-3倍。对于千亿参数模型来说,大量的参数和数据输入,需要在强大计算单元中处理。对此,它需要支持...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...多数 MoE 模型都是闭源的,虽然有些模型公开发布了模型权重,但有关训练数据、代码等的信息却很有限,甚至有些研究没有提供这些信息。由于缺乏开放资源和对研究细节的深入探索,在 MoE 领域无法构建具有成本效益的开源...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
腾讯拿出看家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途,必须提前获取 Mistral AI 商业...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...m但比较遗憾的是,目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-s……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...量化过程中,模型参数的微小变化可能导致量化后的模型权重与原始模型权重相同。看到这项研究后,不少网友也表示有点意外:从信息理论的角度来看这有点出人意料,似乎已经在完整的32-bit中成功移除了这些知识,但当你将...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...型要复杂很多,它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致开发者无法去改进它,也就无法对开源模型的效果做贡献。比...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...,推理是分 batch 运行的。每个 batch 都需要加载所有模型权重一次,并在 batch 的每个 token 中重复使用。通常来说,LLM 输入是计算密集型的,而 LLM 输出是内存密集型的。当我们将输入和输出 token 与连续 batch 结合时,工作负载变...……更多
腾讯混元助手app“腾讯元宝”5月30日发布
5月17日消息,在今日举办的腾讯云生成式AI产业应用峰会上,腾讯预告将在5月30日发布基于混元大模型的面向C端(消费者端)的助手App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...dent模型的可训练参数,α和β分别控制序列和词的loss项的权重。偏好优化LLM指令调优的第二阶段是使其符合用户偏好。这个阶段,使用一组期望的偏好对来改进模型的输出。优化的目标是使奖励模型最大化,同时保持产生的输出...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...模型参数量上,规模通常达到数十亿的级别(其中主要是权重)。 这些参数不仅存储成本相当高,推理阶段的计算量也很大。在推理过程中,激活值是输入和权重的乘积,因此权重数量越多,激活值也会越大。因此,我们希望...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...大的开源大语言模型。即便这些参数在给定token上的激活权重仅为25%,Grok-1的激活参数数量也有860亿,这比LIama-2的70B参数还多,这意味着其在处理语言任务时具备广阔的潜在能力。Grok-1采用了混合专家系统的设计,每个token从8个...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
...字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪”的一下360度无死角的3D资产就...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...公布了文心一言大模型开源。与此同时,“姗姗来迟”的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接一波的行业浪潮席卷而来,正...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...特定任务,矩阵空间ℝx中存在一个最优矩阵对于预训练权重矩阵,其针对该任务的最佳调整为∆=-。在PEFT中,研究人员只能获得及其方向的信息。由于∆和*的方向基于各自的基,他们首先将二者投影到的全局基上。定义3:定义...……更多
更多关于科技的资讯:
倒计时3天!小米汽车宣布将在SU7 Ultra发布会前关闭小定通道
快科技2月24日消息,小米汽车即将在2月27日晚7点举行小米SU7 Ultra的发布会,并宣布届时将关闭小订通道。雷军此前在微博表示
2025-02-24 21:03:00
号称能缓解高血压!老人2万买治疗仪竟把自己电到头疼
2月24日消息,据媒体报道,一位陈姓老人称,他花费19300元购买了一台高电位治疗仪,销售称这台仪器可以缓解高血压、糖尿病
2025-02-24 21:03:00
时评 | 从演出经济看城市的“流量密码”
一场演唱会带火一座城,一场音乐节激活一片海……2月22日,除了连唱三天的“张学友60+”巡回演唱会外,汽水音乐海边派对也在海口同时上演
2025-02-24 21:23:00
iPhone 17系列外观引发争议!苹果设计师太激进
近日,爆料者Majin Bu在社交平台上公布了据称是iPhone 17系列的CAD设计图,揭示了苹果即将推出的新机型的一些关键设计细节
2025-02-24 21:33:00
这才是真正的生产力工具!OPPO Find N5远控Mac实测
移动办公早已不是什么新鲜事。随着移动办公的普及,全球近9亿人群正从传统办公模式逐步向移动化、智能化转型。尤其是2025年
2025-02-24 21:33:00
胎儿全身发白 竞因给妈妈“倒输血”:病例罕见
2月24日消息,据媒体报道,一位妈妈遭遇罕见的胎母输血综合征,腹中胎儿持续“倒输血”给母亲。孩子出生后,其皮肤非常白,可能有严重贫血
2025-02-24 21:33:00
为原生鸿蒙而生 华为首款新形态手机到底会是什么样
在春节前,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东向外界透露了一个重磅消息,他表示华为会在3月份发布一款打破常规
2025-02-24 21:33:00
深圳一企业员工如厕须带“离岗证”:每次不超过7分钟
2月24日消息,据媒体报道,有网友反映,他之前就职的深圳一家公司限制员工上厕所的时间和次数。该网友称,这家公司要求每个员工4小时只能去2次
2025-02-24 21:33:00
深圳机场加快拓展人工智能全场景应用
本文转自:人民网人民网深圳2月24日电 (王星)近日,深圳机场在深圳市国资委指导下,完成人工智能大模型“Deep Seek R1”本地化部署
2025-02-24 21:45:00
曝小米15 Ultra将于3月18日在印度发布,小米15首当其冲沦为百元机
之前,小米官方就已经对外预告过,小米15系列,其中涵盖了全新的小米15Ultra,将会在3月2日的MWC2025上进行全球范围的发布
2025-02-24 21:47:00
博主称iPhone 17和16几乎没有区别,iPhone 15沦为千元机改写历史
近日,有博主指出,单从外观以及材质这两方面来看的话,iPhone17和iPhone16之间好像并没有太大的差别,它们在工艺以及内部结构方面都颇为相似
2025-02-24 21:47:00
曝华为今年独占技术很多,Pura70现感人价花粉直呼亮瞎眼!
有一位数码博主发布文章透露了相关消息,称华为在今年所拥有的独占技术数量比较多,甚至比之前预期的还要更多一些。按照相关爆料信息来看
2025-02-24 21:48:00
博主:厂商想要学华为得花大成本,Mate60价比千元机遭疯抢!
每当华为推出新机的时候,总是能够为大家带来令人眼前一亮的新技术。就拿去年来说,Mate70系列搭载了业界首发的红枫原生影像技术
2025-02-24 21:48:00
卢伟冰爆料小米未来发布会直播,小米15沦为百元机米粉直呼不敢看
2月22日晚,小米集团合伙人、总裁,同时身兼手机部总裁以及小米品牌总经理的卢伟冰开启了一场直播,在直播过程中,透露了诸多关于即将举办的发布会里新品的相关消息
2025-02-24 21:50:00
三星S25 Edge真机视频泄露,S24低至千元网友直呼不敢看
近日,网络上的一段视频,让我们第一次得以看到三星S25Edge设备实际的表现情况,同时也知晓了关于这款手机的一些颇具价值的细节内容
2025-02-24 21:51:00