推理,更快,性能,模型,输出,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...er模型取得了比扩散模型更好的结果，只有900M参数，但在推理时间上比StableDiffusion1.4版本快3倍，比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比：文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

...据具体询问的内容，模型只会激活不同的专家子模块进行推理，在吞吐量一定的情况下，可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本，简而言之就是更好的使用体验和性价比。根据xAI公布...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

阿里云通义千问主力模型价格直降97%，大模型商业化拐点已至

...大模型性能逐渐提升，AI应用创新正进入密集探索期，但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略，不仅是对当前市场的一次重大推动，更是对未来商业智能化转型的一次深远布局。阿里云智能...……更多

2024-05-22 16:18:00通义,模型,阿里,拐点,主力,商业

如何跑赢生成式AI竞赛？云计算大厂揭秘组合拳：自研大模型只是

...胜在全面，有琳琅满目的大模型品类，还有加速从训练到推理的各种工具“套餐”，以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的，即让云客户更快更方便地用生成式AI产生价值。一、大模型货...……更多

2024-12-16 09:15:00大厂,组合拳,竞赛,生成,模型,只是

华为联合WPS AI，见证昇腾大模型推理应用启航

...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践，共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多

2024-07-08 11:01:00华为,推理,见证,模型,联合,应用

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

收入占比40%、电话会议点名16次，英伟达：推理端的需求被低

...让人印象深刻的是，英伟达在财报电话会议的一个观点：推理端的爆发，可能很多人还是低估了。据英伟达电话会议披露，公司全年数据中心里已经有40%的收入来自推理业务，超出了绝大部分人预期。而在这次财报电话会议里，...……更多

2024-03-02 13:38:00英伟,电话会议,推理,收入,需求,端的

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

模型即服务，卓世科技MaaS平台 2.0 正式上线

...。本次新上线了包括：模型训练新基座，支持模型训练、推理、量化、评测等功能。卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。...……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

突破数据墙！27岁华裔MIT辍学创业8年，年化收入逼近10亿

...的合同工进行人工标注。他强调，来自专家的、包含复杂推理的数据是未来人工智能的必备条件。传统的数据来源，比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程，模型先输出一些内容，例如撰写研...……更多

2024-09-26 13:37:00华裔,收入,突破,创业,数据,数据

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

芯片集群「贵」出天际，10年内单个集群价值将达万亿美元

...求仍然很大。例如，GPT-3需要３x10^23flop的算力来训练，则推理需要3x10^11flop算力。FPGA和ASIC芯片是专为推理量身定制的，在运行人工智能模型方面，比使用GPU更高效。不过，在这股热潮中表现最好的还是英伟达。英伟达的主导地...……更多

2024-12-07 09:58:00集群,达万,天际,单个,芯片,价值

专家模型不要专家并行！微软开源MoE新路径

...好，所以要在左上角： GRIN作为MoE架构，总参数量约42B，推理时激活的参数为6.6B，打同级别（7B）的非MoE模型是手拿把攥，甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中，GRIN MoE表现优异，尤其是在编码和数学测试中。...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

pytorchtorchao正式发布,提供了一系列优化工具集

...将模型训练转换为float8，从而轻松实现模型高效训练。在推理方面，torchao提供多种量化方法，包括权重量化（Weight-OnlyQuantization）和动态激活量化（DynamicActivationQuantization），用户可以自有选择适合的量化策略，以获得最佳的模...……更多

2024-10-03 02:58:00工具集,工具,模型,可将,训练,推理