腾讯,权重,推理,模型,参数,代码头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

快科技3月26日消息，腾讯今天凌晨正式宣布，元宝迎来重大更新，两大模型同时上新：深度思考模型混元T1正式版、DeepSeek V3-0324最新版。腾讯表示，不论是深度思考、还是秒出答案，元宝一次给足。其中，混元T1正式版是腾讯自...……更多

2025-03-26 07:33:00腾讯,重磅,元宝,最新版,正式版,同时

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...训练耗时降低28.1%；在推理层，通过大规模EP、PD/AF分离、权重优化、LLM智能路由在内的全链路优化，实现推理效率显著提升：推理吞吐TPS增加71%，时延TPOT降低70.6%，扩容时长降低97.6%。“阿里云正在全力打造一台全新的AI超级计...……更多

2025-09-24 13:30:00一文,阿里,重磅,体系,大会,升级

微调大模型，AMD MI300X就够了！跟着这篇博客微调Ll

...PU 上训练 LLaMA 405B 模型。我们使用 LoRA 微调，将所有模型权重和 LoRA 参数都设为 bfloat16，LoRA rank 设为 8，LoRA alpha 设为 16：模型大小：LLaMA 模型的权重占用了约 800GB 的显存。 LoRA 权重 + 优化器状态：大……更多

2024-10-09 09:52:00模型,跟着,博客,模型,参数,训练

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理，上下文窗口128k，支持数十种自然语言以及80+编程语言。特别在MMLU上，其预训练版本更是达到了84.0%的准确率。消息一出，Mistral AI联创兼首席科学家第一时间转发，...……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

腾讯钟学丹：人工智能成为汽车行业新质生产力推动数智化升级

...中国电动汽车百人会论坛（2024）新质生产力分论坛上，腾讯智慧出行副总裁钟学丹发表了题为《AI驱动汽车“新智能”》的主题演讲，分享了腾讯AI大模型等新技术在汽车产业的创新应用成果。腾讯智慧出行副总裁钟学丹钟学丹...……更多

2024-03-19 14:00:00智化,腾讯,人工智能,汽车行业,生产力,人工

挑战Scaling Law，Meta发布移动端350M小模型

...高门槛。不仅用2-bit和4-bit混合精度压缩模型（平均每个权重3.5-bit），而且要有至少8G内存和M1芯片才能运行。Meta最近发表的一篇论文就表明，参数量可以进一步收缩，最新提出的MobileLLM模型参数量小于1B，但性能依旧可观。论...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

惊掉下巴！被字节起诉800万实习生，拿下NeurIPS 20

...以通过修改或注入恶意代码，使模型在加载时被篡改模型权重、修改训练参数或截取模型数据。根据大V「Jack Cui」猜测，这位实习生所用的大概就是这个方法，注入代码动态修改别人的optimer，修改参数梯度的方向，以及在各种...……更多

2024-12-05 09:47:00实习生,下巴,字节,实习,论文,模型

Llama版o1来了，来自上海AI Lab，强化学习代码已开

复刻OpenAI o1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...全部开源，可复现。Ovis1.6系列中的Ovis1.6-Gemma2-9B也已开源权重。在AI领域，多模态大模型的应用场景非常广泛，包括但不限于自动驾驶、医疗诊断、视频内容理解、图像描述生成、视觉问答等。例如，在自动驾驶领域，多模态大...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

开放模型权重被指将导致AI失控，Meta遭举牌抗议

...。与之相反，Meta 的 LLaMA 系列开源模型向公众提供了模型权重，使得任何拥有合适硬件和专业知识的人都可以自行复制和调整模型。一旦发布了模型权重，发布公司就不再有任何手段来控制 AI 的使用方式了。在 Holly Elmore 看来，...……更多

2023-10-08 18:12:00权重,模型,开放,模型,权重,安全

最新大模型产品抢先看

...在的诸多挑战。他表示，尽管随着通义千问、文心一言、腾讯混元等系列大模型纷纷降价免费，生成式人工智能（AIGC）的应用门槛进一步降低。但要让大模型更好地服务于企业应用场景，仍存在不少障碍。比如技术执行、实施...……更多

2024-06-26 00:34:00模型,产品,模型,星环,人工智能,智能

腾讯推出新一代快思考模型混元 Turbo S，将在腾讯元宝逐

大模型领域竞争日趋激烈，腾讯又放出大招！2月27日，腾讯混元Turbo S模型在腾讯云官网上架，开发者和企业用户可以通过API调用，即日起一周内免费试用，同时将逐步在腾讯元宝灰度上线，供用户使用和体验。据介绍，此次升...……更多

2025-02-27 19:52:00腾讯,灰度,元宝,新一代,模型,腾讯

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...布了论文，提出一个名为SliceGPT的方法。SliceGPT通过删除权重矩阵中的行和列来降低网络的嵌入维数，有效降低大模型所需资源，同时保持较高的模型性能。这也意味着SliceGPT可以运行在更少的GPU上，同时运行速度更快。△SliceGPT...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

9月5日，腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

DeepSeek致谢腾讯技术团队：这是一次“巨大的加速”代码

快科技5月7日消息，DeepSeek致谢腾讯技术团队，这是一次“巨大的加速”代码贡献。据新浪报道，腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化，使其在多种网络环境下均实现显著性能提升。经测试，优化后的通信...……更多

2025-05-07 20:11:00腾讯,贡献,团队,代码,这是,技术

DeepSeek首次披露：理论成本利润率545%

...整batch size可以影响模型的训练速度、内存消耗以及模型权重的更新方式。在更低的延迟方面，大规模跨节点专家并行使得专家分散在不同的GPU上，每个GPU只需要计算很少的专家（因此更少的访存需求），从而降低延迟。但是，...……更多

2025-03-01 18:59:00利润率,利润,成本,理论,节点,模型

最新财报：腾讯混元大模型参数规模扩展至万亿

大皖新闻讯 3月20日，腾讯发布2023年第四季度及全年业绩报告，财报指出：“腾讯混元已经发展成为领先的基础模型，在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构，已扩展为...……更多

2024-03-20 19:32:00腾讯,模型,参数,规模,腾讯,模型

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R

...况下，用强化学习实现了性能上的跨越。此外，阿里还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估，测试了数学推...……更多

2025-03-06 07:42:00阿里,推理,模型,参数,全新,能力

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理