腾讯,权重,推理,模型,参数,代码头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

最新财报：腾讯混元大模型参数规模扩展至万亿

大皖新闻讯 3月20日，腾讯发布2023年第四季度及全年业绩报告，财报指出：“腾讯混元已经发展成为领先的基础模型，在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构，已扩展为...……更多

2024-03-20 19:32:00腾讯,模型,参数,规模,腾讯,模型

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...caling Law我们所熟知的Scaling Law主要关注两个维度，即模型权重和训练量，包括训练时的step、epoch和token总量等等。基本上，论文的发现就是，模型规模是重要因素。因此，GPT-3犯了一个错误——模型参数量远远超出了token总量的要...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

全面开源浪潮信息发布千亿参数基础大模型“源2.0”

...51B（518亿）、2B（21亿）三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面，“源2.0”提出了新的改进方法...……更多

2023-11-28 07:46:00浪潮信息,浪潮,模型,参数,基础,信息

「世界开源新王」跌落神坛？重测跑分暴跌实锤造假，2人团队光速

...过一个月的漫长等待，团队终于放出了Reflection 70B的模型权重、训练数据、训练脚本和评估代码。模型权重： https://huggingface.co/glaiveai/Reflection-Llama-3.1-70B训练数据： https://huggingface……更多

2024-10-08 09:47:00神坛,光速,团队,世界,模型,基准

字节“扣子”加入AI战场，2024大模型能搞到钱吗？

...巴的“通义千问”大模型、科大讯飞的星火大模型，再到腾讯的混元大模型，国内传统的三大互联网巨头“BAT”悉数下场。此外，华为、京东、商汤科技、网易有道、昆仑万维（300418.SZ）等等都陆续推出了大模型产品，甚至连移...……更多

2024-02-04 14:00:00扣子,字节,战场,模型,模型,应用

NVIDIA RTX显卡AI推理提速5倍！

...得更好的加速和应用。其中，TensorRT-LLM是一款用于加速LLM推理的库，可大大提升AI推理性能，还在不断更以支持越来越多的语言模型，而且它还是开源的。就在10月份，NVIDIA也发布了面向Windows平台的TensorRT-LLM，在配备RTX30/40系列GP...……更多

2023-11-16 20:13:00提速,推理,显卡,微软,模型,性能

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

...有任何一个模型发布了其后训练数据。即使是主要的开放权重模型也不会发布任何数据或用于实现这种后训练的配方细节。于是，Ai2 似乎看不下去了，决定开源一切！Tülu 3 模型之外，Ai2 还发布了所有的数据、数据混合方法、...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

汽车新智能图谱里：理解腾讯的AI TO B路径

...具体的需求痛点，一起打磨对应的行业AI模型。这也恰是腾讯“实用”标签背后的AI产业路径。作者|皮爷出品|产业家成本、性价比——这是2023年腾讯CSIG事业群CEO汤道生在客户现场听到最多的一个词。有同样感觉的还有腾讯智慧...……更多

2024-04-26 23:00:00腾讯,图谱,路径,智能,汽车,腾讯

大模型降价背后，国产大模型的竞争逻辑变了

...将大模型的使用价格，调低至“厘”时代，百度、阿里、腾讯等巨头纷纷跟进，迅速将大模型推至免费时代。大模型免费时代加速到来5月15日，火山引擎云服务平台，发布了国内首批通过算法备案的“豆包大模型”，主力模型，...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...使用了穷举搜索来调整SplitK GEMM内核。因为每个线性层的权重矩阵都有不同的形状，如果要获得最佳性能，就需要针对每种矩阵形状调整Triton内核。Granite-8B和Llama3-8B的线性层权重矩阵规格如下：调整每个线性层后，相比未调整...……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

谷歌再出大招，发布最新开源大模型Gemma，笔记本上即可运行

...型，沿用了创建Gemini模型时的技术和架构优势，提供两种权重的模型版本，分别是“Gemma2B”和“Gemma7B”，分别拥有20亿和70亿个参数，其中2B版本甚至能直接在笔记本电脑上运行。性能表现方面，Gemma7B在MMLU（大规模多任务语言...……更多

2024-02-23 09:18:00模型,运行,笔记本,笔记,模型,人工智能

微软发布旗下最小语言模型phi-2

...写电子邮件和故事，以及总结文本。在常识、语言理解和推理的基准测试中，该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数，规模虽然比此前版本翻番，但相比较其它主流语言模型，...……更多

2023-11-17 14:00:00微软,旗下,模型,语言,模型,微软

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...需要企业对训练数据进行管理，并同时考虑到模型参数和权重的问题。借助Amazon Bedrock Model Distillation，客户只需针对给定用例选择最佳模型，并从同一模型系列中选择较小的模型，即可以合适的成本提供其应用程序所需的延迟。...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

腾讯版“GPT-4o”来了！混元Turbo首发并上线，效率翻

腾讯混元又升级了，这次它变得更快、更强、更便宜。科创南方9月5日报道，今天，2024腾讯全球数字生态大会在深圳国际会展中心举行。腾讯集团副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏在现场宣布，混元Turbo已经在...……更多

2024-09-06 10:00:00腾讯,效率,价格,腾讯,模型,企业

pytorchtorchao正式发布,提供了一系列优化工具集

...高效训练。在推理方面，torchao提供多种量化方法，包括权重量化（Weight-OnlyQuantization）和动态激活量化（DynamicActivationQuantization），用户可以自有选择适合的量化策略，以获得最佳的模型推理性能。在稀疏性优化方面，torchao可以...……更多

2024-10-03 02:58:00工具集,工具,模型,可将,训练,推理

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

中国首个音乐SOTA模型「天工音乐大模型」今日公测

...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升，数学/推理/代码/文创能力提升超过30%。（天工3.0模型参数超越Grok-1，成全球最大开源MoE...……更多

2024-04-17 15:31:00天工,公测,模型,音乐,中国,天工

李彦宏替马化腾试错？

...彦宏的这一判断，马化腾似乎并不完全同意。就在昨天，腾讯集团召开的公司年会上，腾讯公司董事会主席、首席执行官马化腾这样说道："AI 也是去年一个重点，全行业甚至全世界的重点，我们总算能跟上第一阵列，不能算是...……更多

2024-01-31 21:00:00李彦,模型,腾讯,应用,文心,开发

CPU,正在被AI时代抛弃？

...足任务需求的条件下，提供多种针对网络激活层以及模型权重的低精度和量化方法，大幅度降低访存数据量的同时，充分发挥出英特尔®AMX等加速部件对BF16/INT8等低精度数据计算的计算能力。●多节点并行：支持张量并行（TensorP...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

...上内容，还包括基本的图像去噪、边缘提取等能力。模型权重和代码已开源，用户可以自行探索更多 OmniGen 的能力。三、模型OmniGen 的核心设计原则是：简洁和有效。因此，我们最大程度舍弃了各种额外模块。OmniGen 的基本架构...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...，未来可能还会出现更好的方法。组合 LTM 数据进行实时权重更新，从而实现自我进化当前的 LLM 通常分为训练和推理两个阶段。在推理阶段，模型权重是冻结的，防止模型根据新输入进行调整和学习。这种固定的推理过程会限...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

必然的命运：AI大模型冲向“免费轮盘赌”

...E Lite两款主力模型全面免费开放，即刻生效。效仿百度，腾讯云、讯飞星火也开走免费路线。腾讯云在22日将混元-lite模型调整为全面免费，同时宣布万亿参数模型混元-pro的API输入价格从0.1元/千tokens降至0.03元/千tokens。同天，科...……更多

2024-05-24 13:40:00轮盘,模型,必然,命运,模型,价格

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面，Qwen-72B在GSM8K、MATH测评中也领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力也有质的飞跃。△72B模型做数学题 ……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里