腾讯,权重,推理,模型,参数,代码头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

腾讯版Sora，发布即开源！130亿参数，成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face，一点没藏着。实际效果如何呢？目前该模型已上线腾讯元宝APP，用户可在AI应用中的...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

智东西11月5日报道，今日，腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源，并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

权威AI开源标准1.0版发布：Llama也不算开源

...创建；用于构建和运行 AI 的完整代码；训练中的设置和权重，帮助 AI 产生相应的结果。这一定义直接直击 Meta 推动的 Llama 大模型。虽然在生成式 AI 领域里，Llama 一直被广泛宣传为最大的开源 AI 模型，Llama 的使用条款中支持...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

腾讯混元文生图大模型升级并对外开源

5月14日消息，腾讯宣布旗下的混元文生图大模型升级并对外开源，目前已经在HuggingFace及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...40 亿参数的混合专家（MoE）模型‘Grok-1’，以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。封面图根据 Grok 提示使用 Midjourney 生成的：神经网络的 3D 插图，具有透明节点和发光连接，以不...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

...然后这篇内容只有6页的论文引发热议：BitNet b1.58模型的权重被量化为三元值{-1, 0, 1}，相当于在二进制系统中使用了1.58 bit来表示每个权重。采用了absmean量化函数来约束权重，将权重矩阵通过其平均绝对值进行缩放，然后四舍五...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

360智脑7b参数模型采用3.4万亿tokens训练

...中文大海捞针测试，同样做到了98%以上的准确率。除模型权重外，该模型的微调训练代码，推理代码等全套工具集也被一并开源，大模型相关开发者可做到“开箱即用”。据IT之家此前报道，周鸿祎曾表示，前段时间大模型行业...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

赛道正在变得拥挤腾讯混元大模型杀入文生视频让用户 “用起

《科创板日报》12月4日讯（记者张洋洋）昨日，腾讯混元大模型正式上线视频生成能力，这是继文生文、文生图、3D生成之后，混元大模型的最新业务进展。与此同时，腾讯开源该视频生成大模型，参数量130亿，是当前最大的...……更多

2024-12-04 09:56:00文生,腾讯,赛道,模型,正在,关键

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

...具备向全社会开放的产品能力。而在更早的10月，元象与腾讯音乐联合推出lyraXVERSE加速大模型，并借助该技术全面升级音乐助手“AI小琴”的问答、聊天与创作能力，让她情商与智商双高，为用户提供个性化、更深入、陪伴感十...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

...token过程中，由于模型首次加载，会在内存中存放全部的权重参数，以及KV Cache等数据。这是模型参数本身所占内存空间的2-3倍。对于千亿参数模型来说，大量的参数和数据输入，需要在强大计算单元中处理。对此，它需要支持...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

9月5日，腾讯宣布推出新一代大模型“混元Turbo”，相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

腾讯混元上线文生视频并开源，120秒内成片！还有提示词建议

智东西12月3日报道，今天，腾讯混元大模型正式上线视频生成能力，这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍，此次更新中，HunYuan-Video模型经历了四项核心改进...……更多

2024-12-04 09:49:00文生,腾讯,提示,建议,视频,生成

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

快科技3月22日消息，腾讯正式发布了自研深度思考模型混元T1正式版，这是腾讯自研的最强推理模型。腾讯表示，T1不仅吐字快、能秒回，还擅长超长文处理。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...多数 MoE 模型都是闭源的，虽然有些模型公开发布了模型权重，但有关训练数据、代码等的信息却很有限，甚至有些研究没有提供这些信息。由于缺乏开放资源和对研究细节的深入探索，在 MoE 领域无法构建具有成本效益的开源...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

腾讯混元发布并开源图生视频模型：让照片开口说话唱歌AI神器

快科技3月6日消息，今日，腾讯混元宣布发布图生视频模型并对外开源，同时上线对口型与动作驱动等玩法，并支持生成背景音效及2K高质量视频。企业和开发者可在腾讯云申请使用API接口，用户通过混元AI视频官网即可体验。...……更多

2025-03-06 16:43:00腾讯,神器,模型,照片,视频,视频

chatgpt低成本复现流程开源

...难。毕竟ChatGPT是不开源的，市面上至今没有开源预训练权重、完全开源的低成本训练流程，而且千亿级别大模型的训练本身就是个难题。但ChatGPT军备赛已经愈演愈烈，为了抓住趋势，如谷歌等都在打造对标竞品。快速复现ChatGPT...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

DeepSeek V3小版本大升级：推理、前端开发加强这些

...。与DeepSeek-R1保持一致，此次DeepSeek开源仓库（包括模型权重）统一采用MIT License，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。【本文结束】如需转载请务必注明出处：快科技责任编辑：拾柒文章内容举报 ……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

想要体验文生视频的小伙伴又多了一个选择！今日，腾讯宣布旗下的混元视频生成大模型（HunYuan-Video ）对外开源，模型参数量 130 亿，可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP，用户可在 AI 应用中的「AI...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

腾讯混元大模型批量上新：10秒生成AI图像，超过180个腾讯

揭开大模型“混元”的面纱两个月后，10月26日，腾讯混元迎来第一次“批量上新”，并且对外开放。首先，通过测试申请的用户，都能够在“混元”上画画了——从生成图像的准确度、美观度而言，如今混元搭载的“灵感”模...……更多

2023-10-29 10:13:00腾讯,接入,生成,模型,图像,业务

腾讯发布最大开源MoE模型，3890亿参数免费可商用

腾讯拿出看家本领，来挤开源赛道，突然发布了市面上最大的开源MoE模型。Hunyuan-Large，3890亿总参数，520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰，上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

精准狙击Llama 3.1？Mistral AI开源Larg

...是开放的，但只限于研究和非商业用途。它提供了开放的权重，允许第三方根据自己的需求对模型进行微调。这一协议是对用户使用条件的一个重要限制。对于需要自行部署 Mistral Large 2 的商业用途，必须提前获取 Mistral AI 商业...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

位列第一梯队，腾讯混元再度领跑国内大模型

...发布了《中文大模型基准测评2024年度4月报告》。其中，腾讯混元大模型位列国内大模型第一梯队，在基础和场景应用上均处于领先位置，位于卓越领导者象限。SuperCLUE是国内权威的通用大模型综合性测评基准，其前身是知名的...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

chatgpt低成本复现流程来了

2023-02-17 14:37:00流程,成本,模型,训练,内存,参数

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...m但比较遗憾的是，目前在HuggingFace仓库中还没有公开模型权重。英伟达官方博客显示，ESM3将在Nvidia BieNeMo平台提供一个小型开源版本的代码和权重，但仅限于非商业用途。仓库地址：https://huggingface.co/EvolutionaryScale/esm3-s……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

DeepSeek“朋友圈”不断扩围：10家国内外云厂商宣布接

...有众多云平台宣布上线DeepSeek- R1大模型。近日，华为云、腾讯云、阿里云、百度智能云等国内主流云平台纷纷宣布上线R1大模型。2月5日，移动云宣布全面上线DeepSeek，实现全版本覆盖、全尺寸适配、全功能畅用。中国移动覆盖全...……更多

2025-02-06 07:23:00家国,接入,不断,厂商,朋友,用户

国产大模型 DeepSeek-V3 开源：6710 亿参数自

...提升至 60 TPS，相比 V2.5 提升了 3 倍。官方开源了原生 FP8 权重，并提供 BF16 转换脚本，方便社区适配和应用。SGLang、LMDeploy、TensorRT-LLM 和 MindIE 已支持 V3 模型推理。DeepSeek-V3 更新上线的同时，DeepSeek 还调……更多

2024-12-27 09:20:00模型,国产,参数,模型,缓存,价格