• 我的订阅
  • 头条热搜
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
腾讯版Sora,发布即开源!130亿参数,成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face,一点没藏着。实际效果如何呢?目前该模型已上线腾讯元宝APP,用户可在AI应用中的...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...创建; 用于构建和运行 AI 的完整代码; 训练中的设置和权重,帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里,Llama 一直被广泛宣传为最大的开源 AI 模型,Llama 的使用条款中支持...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...40 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的:神经网络的 3D 插图,具有透明节点和发光连接,以不...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
...然后这篇内容只有6页的论文引发热议:BitNet b1.58模型的权重被量化为三元值{-1, 0, 1},相当于在二进制系统中使用了1.58 bit来表示每个权重。采用了absmean量化函数来约束权重,将权重矩阵通过其平均绝对值进行缩放,然后四舍五...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...中文大海捞针测试,同样做到了98%以上的准确率。除模型权重外,该模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。据IT之家此前报道,周鸿祎曾表示,前段时间大模型行业...……更多
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
《科创板日报》12月4日讯(记者 张洋洋)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...具备向全社会开放的产品能力。而在更早的10月,元象与腾讯音乐联合推出lyraXVERSE加速大模型,并借助该技术全面升级音乐助手“AI小琴”的问答、聊天与创作能力,让她情商与智商双高,为用户提供个性化、更深入、陪伴感十...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...token过程中,由于模型首次加载,会在内存中存放全部的权重参数,以及KV Cache等数据。这是模型参数本身所占内存空间的2-3倍。对于千亿参数模型来说,大量的参数和数据输入,需要在强大计算单元中处理。对此,它需要支持...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...多数 MoE 模型都是闭源的,虽然有些模型公开发布了模型权重,但有关训练数据、代码等的信息却很有限,甚至有些研究没有提供这些信息。由于缺乏开放资源和对研究细节的深入探索,在 MoE 领域无法构建具有成本效益的开源...……更多
chatgpt低成本复现流程开源
...难。毕竟ChatGPT是不开源的,市面上至今没有开源预训练权重、完全开源的低成本训练流程,而且千亿级别大模型的训练本身就是个难题。但ChatGPT军备赛已经愈演愈烈,为了抓住趋势,如谷歌等都在打造对标竞品。快速复现ChatGPT...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
腾讯拿出看家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途,必须提前获取 Mistral AI 商业...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...发布了《中文大模型基准测评2024年度4月报告》。其中,腾讯混元大模型位列国内大模型第一梯队,在基础和场景应用上均处于领先位置,位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准,其前身是知名的...……更多
chatgpt低成本复现流程来了
...难。毕竟ChatGPT是不开源的,市面上至今没有开源预训练权重、完全开源的低成本训练流程,而且千亿级别大模型的训练本身就是个难题。但ChatGPT军备赛已经愈演愈烈,为了抓住趋势,如谷歌等都在打造对标竞品。快速复现ChatGPT...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...有众多云平台宣布上线DeepSeek- R1大模型。近日,华为云、腾讯云、阿里云、百度智能云等国内主流云平台纷纷宣布上线R1大模型。2月5日,移动云宣布全面上线DeepSeek,实现全版本覆盖、全尺寸适配、全功能畅用。中国移动覆盖全...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...m但比较遗憾的是,目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示,ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重,但仅限于非商业用途。仓库地址:https://huggingface.co/EvolutionaryScale/esm3-s……更多
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE
...提升至 60 TPS,相比 V2.5 提升了 3 倍。官方开源了原生 FP8 权重,并提供 BF16 转换脚本,方便社区适配和应用。SGLang、LMDeploy、TensorRT-LLM 和 MindIE 已支持 V3 模型推理。DeepSeek-V3 更新上线的同时,DeepSeek 还调……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...量化过程中,模型参数的微小变化可能导致量化后的模型权重与原始模型权重相同。看到这项研究后,不少网友也表示有点意外:从信息理论的角度来看这有点出人意料,似乎已经在完整的32-bit中成功移除了这些知识,但当你将...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...型要复杂很多,它可以开源的包括模型训练源代码、参数权重、训练数据等。但目前模型厂商通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致开发者无法去改进它,也就无法对开源模型的效果做贡献。比...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...,推理是分 batch 运行的。每个 batch 都需要加载所有模型权重一次,并在 batch 的每个 token 中重复使用。通常来说,LLM 输入是计算密集型的,而 LLM 输出是内存密集型的。当我们将输入和输出 token 与连续 batch 结合时,工作负载变...……更多
腾讯混元助手app“腾讯元宝”5月30日发布
5月17日消息,在今日举办的腾讯云生成式AI产业应用峰会上,腾讯预告将在5月30日发布基于混元大模型的面向C端(消费者端)的助手App“腾讯元宝”。腾讯元宝是基于混元大模型及搜索引擎驱动的高效信息整合工具,同时结合...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...dent模型的可训练参数,α和β分别控制序列和词的loss项的权重。偏好优化LLM指令调优的第二阶段是使其符合用户偏好。这个阶段,使用一组期望的偏好对来改进模型的输出。优化的目标是使奖励模型最大化,同时保持产生的输出...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...模型参数量上,规模通常达到数十亿的级别(其中主要是权重)。 这些参数不仅存储成本相当高,推理阶段的计算量也很大。在推理过程中,激活值是输入和权重的乘积,因此权重数量越多,激活值也会越大。因此,我们希望...……更多
更多关于科技的资讯:
逼迫选择自助服务!惠普热线强制等15分钟:不到点不接通
快科技2月21日消息,据媒体报道,惠普正在采取一种独特的策略来应对客户支持问题,那就是客户在拨打客服支持热线时至少等待15分钟
2025-02-21 18:30:00
蜜雪冰城3月3日港交所挂牌上市!从郑州刨冰小店起家 成为全球最大现制饮品企业
快科技2月21日消息,今日,蜜雪冰城发布全球发售公告,计划于3月3日在港交所主板挂牌上市,股份代码2097,每股发售价202
2025-02-21 18:30:00
极越:第二批定金退款工作已正式开启
快科技2月21日消息,今天下午,极越发布关于用户关心问题的说明(第十次),宣布第二批用户定金退款工作已全面开启。截至2月21日
2025-02-21 18:30:00
100%量产真机、最大供氧不热失控:华为完成储能极限燃烧试验
快科技2月21日消息,近日,华为数字能源在国际权威的独立保障和风险管理机构DNV及战略客户全程见证下,完成智能组串式构网型储能的极限燃烧试验
2025-02-21 19:00:00
摘养100%纯椰子水10盒到手19.9元:解腻更解渴
摘养100%纯椰子水250ml*10盒原价49.9元,领券立减,实付到手价19.9元(包邮)。购买链接:天猫(券后19
2025-02-21 19:00:00
黄仁勋首次公开回应DeepSeek!投资者误解、对NVIDIA是利好
快科技2月21日消息,NVIDIA CEO黄仁勋在日前发布的线上活动中表示,投资者对DeepSeek的误解导致了NVIDIA股价的暴跌
2025-02-21 19:00:00
L4级自动驾驶!上海邮政首批无人投递车正式上岗:一次装500kg邮件
快科技2月21日消息,近日,中国邮政的无人投递车在上海街头亮相,主要针对的是邮政揽投部至菜鸟驿站的邮件转运需求,旨在优化快递配送的“最后一公里”
2025-02-21 19:00:00
汽车之家新任CEO全员信:不会因海尔收购交易裁员
快科技2月21日消息,据报道,2月20日,汽车之家大股东与海尔集团子公司完成交易。当晚,汽车之家新任CEO杨嵩在给汽员工的全员信中表示
2025-02-21 19:00:00
大衣哥:希望社会忘掉朱之文
2月21日消息,据媒体报道,近日,被网暴的农民歌手“大衣哥”朱之文决定拿起法律武器,以侮辱诽谤为自诉案由,将网暴者起诉至法院
2025-02-21 19:30:00
离婚跟拍师1800一次 摄影师:捕捉悲伤比捕捉欢乐要难
快科技2月21日消息,据报道,随着社会观念的开放与婚姻态度的演变,离婚这一话题已逐渐挣脱禁忌的束缚,被更加坦然地讨论。在此背景下
2025-02-21 19:30:00
2024年手机App活跃用户排行榜:阿里系超20亿遥遥领先、百度已掉队
快科技2月21日消息,月狐数据公布了2024年度移动互联网App得活跃情况,基于MAU(月度活跃用户量)进行评选,分为多达15个子榜单
2025-02-21 19:30:00
够用一夏天!榄菊电蚊香液套装大促:19.9元到手4瓶1器
榄菊官方旗舰店发车,电热蚊香液4液+1器日常价39.9元,今日领取20元优惠券,叠加1.19元淘金币。到手价18.71元
2025-02-21 19:30:00
一男子在世纪佳缘遭遇“连环套” 付了17万多仍未脱单
快科技2月21日消息,据媒体报道,近日,有一上海网友反映,为寻得良缘,他先后两次在婚恋平台“世纪佳缘”签订合同,总计付了17万余元的金额
2025-02-21 19:30:00
新一批游戏版号出炉:《植物大战僵尸3》中国版终于过审
快科技2月21日消息,今日,国家新闻出版署发布2025年2月份游戏审批信息,其中有110款国产游戏、3款进口游戏获批。其中值得注意的是
2025-02-21 19:30:00
免费送100辆车被喷有门槛!周鸿祎:即日起取消门槛 一步就能参与抽奖
快科技2月21日消息,360董事长周鸿祎今晚发布视频称:对于免费送100辆国产新能源汽车的活动,大家希望降低抽奖门槛的心声我也收到了
2025-02-21 20:00:00