边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型，以及1750亿参数GPT-3模型的训练时间。英特尔表示，Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多

2024-04-10 10:52:00英特,英特尔,英伟,能比,推理,芯片

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

突破遥感基础模型关键技术！我国科研人员研发出遥感智能训推一体

...然而，遥感单幅影像幅宽大、基础模型参数规模大，导致推理速度与应用场景较为受限。近日，中国科学院空天信息创新研究院（空天院）科研团队基于自主研制的遥感智能解译基础模型，联合国内相关研发机构，共同研发出“...……更多

2023-10-27 11:57:00遥感,一体机,模型,科研,一体,突破

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

...模型，一举创造了很多历史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法看」直接上升到优秀水平，不专门训练直接数学奥赛金牌，甚至...……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

超级推理模型正面对垒：谷歌版o1发布次日，OpenAI o1

来源：硬AI圣诞节前，人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒，谷歌刚发布自家的先进推理模型挑战OpenAI的o1，第二天，OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五，在为期12个...……更多

2024-12-21 09:15:00下一代,推理,正面,模型,模型,测试

赋能行业创新发展！浪潮海若大模型正式通过备案

...的行业安全可信大模型，具备生成创作、多轮对话、逻辑推理等多项核心能力，通过海量通用数据与行业特有数据融合，更好的适应行业客户的业务需求，推动大模型在政企行业场景的精准落地。面向行业的安全可信行业专属大...……更多

2023-12-19 14:04:00海若,浪潮,模型,发展,行业,模型

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

苹果推出DeepPCR 神经网络训练和推理速度提升7倍

...该算法通过并行处理常规顺序操作，可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务，但由于计算需求过大，神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多

2023-12-16 21:06:00神经网络,推理,神经,速度,苹果,训练

WOT全球技术创新大会2024北京站：探索AI 的无限可能

...实践困境，如何通过大模型Planning能力，理解Agent的能力边界，重塑生产力？代码能力是大模型的核心能力，通义灵码如何提升编程效率，并快速推动整个软件工程智能化的发展？在AIAgent探索与应用专题，来自58同城、快手、阅...……更多

2024-05-31 18:24:00北京站,技术创新,北京,大会,全球,技术

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...比，苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升，并预计在Trainium 2上预训练模型时，效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic，宣布与AWS共同构建面向机器学习训练...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

GPT-4下岗了，上海高校和企业用DeepSeek开发大模型

...相对低配的GPU和显卡内存，就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后，这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数，激活参数为370亿，在14.8万亿token（词元）上进行了预训练，生成速度比...……更多

2025-01-29 21:29:00上海,下岗,模型,智能,开发,企业

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...考虑到大模型和异构多芯发展趋势，为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片，飞桨与文心联合，在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说，动静统一的自动并行能...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

商汤生成式AI业务飙涨256%，成为中国大模型、智算服务市场

...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降，带动模型调用量增长迅速。报告期内，“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元，同比增长100%。上半年新增交付70.5万辆车，...……更多

2024-09-13 13:50:00商汤,市场占有率,占有率,中国,生成,模型

李开复：现在卖AI大模型的方式行不通，需考虑技术和业务成本、

...示，零一万物正持续探索寻找大模型在各个场景下的能力边界。一方面需要考虑模型能力，以模型的强泛化性避免 AI 1.0 时代非标化、定制重、交付重的商业模式；另一方面则是要考虑推理成本，能够帮助企业客户核算 ROI，在不...……更多

2024-11-09 09:50:00李开复,模型,成本,客户,方式,业务

张云泉：集中力量，促进国产AI大模型发展

...法成为新时代的关键资源。大模型的开发、训练、微调及推理各个环节均离不开算力，且算力成本占据整体开销的大头。可以说，算力成为支撑大模型发展的关键因素，也是科技竞争的战略高地。在大规模的前端产品落地后，算...……更多

2024-09-03 14:17:00云泉,模型,国产,力量,发展,模型

北京智源研究院发布原生多模态世界模型Emu3

...（词元）预测的多模态技术范式，释放其在大规模训练和推理上的潜力。据了解Emu3只基于下一个token预测，无需扩散模型或组合式方法，把图像、文本和视频编码为一个离散空间，在多模态混合序列上从头开始联合训练一个Transf...……更多

2024-10-24 05:12:00模态,北京,研究院,模型,研究,世界

9.11比9.9大？多个大模型翻车！业内人士：就是偏科，文科

...文认为，模型产生幻觉的三大来源：数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式，如位置接近性、共现统计数据和相关文档计数，从而导致幻觉。此外，大模型还可能会出现长尾知识回忆不足、难以...……更多

2024-07-17 20:56:00理科,文科,业内人士,模型,业内,多个

如何跑赢生成式AI竞赛？云计算大厂揭秘组合拳：自研大模型只是

...的企业数据后，需要考虑安全性和设定AI应用程序的功能边界。对此亚马逊云科技推出了Amazon Bedrock Guardrails护栏功能，用于轻松定义应用程序的安全性，并实施负责任的AI检查。使用这个功能，你可以限制AI应用只在特定领域回...……更多

2024-12-16 09:15:00大厂,组合拳,竞赛,生成,模型,只是

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...类型的信息：- 仅输入和输出文本，也就是少样本学习- 推理追踪：添加中间推理步骤，可参阅思维链（COT）提示- 计划和反思追踪：添加信息，教LLM计划和反思其解决问题的策略，可参阅ReACT 选择正确的适配方法要决定上述哪...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

...识探索图像数据与相关任务之间的联系，进而预测潜在的边界框和目标物体但其中只有正确的信息才值得保留。为此，该研究引入了视觉对比推理（Visual Contrastive Reasoning）模块。该模块首先使用图像编辑技术创建对比图像，这...……更多

2024-11-05 09:49:00幻觉,有害,框架,图像,技术,任务

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...得出正确答案？为了解决这一问题并推动多模态AI评估的边界，MMMU团队对MMMU基准在健壮性和问题难度上进行提升，新基准MMMU-Pro能够更准确、更严格地评估模型在广泛的学科领域内真正的多模态理解和推理能力。论文链接：https:...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测

...级智能的关键一步。它被指具有这些特性，比如在数学和推理能力方面有很大的提升，突破了人类数据的限制，可以自己生产巨量训练数据，有自主学习和自我改进的能力等等。在草莓项目正式被曝光的前几天，OpenAI科学家Noam B...……更多

2024-08-08 15:11:00奥特,奥特曼,一波,实测,竞技场,草莓

微软研究院推出orca2llm

...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术，同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型，在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多

2023-11-22 11:08:00微软,研究院,研究,微软,模型,推理

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...含四个主要任务：信息抽取、信息定位、定性分析和数值推理。不同于现有的长文本基准测试，”企鹅卷轴”有以下几个优势：数据多样性：”企鹅卷轴”包含了各种真实场景下的长文本，如财务报告、法律文档、学术论文等，...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

优刻得首个「国产千卡智算集群」落地，支持智源千亿大模型训练

...环境，可支持超千卡规模、千亿参数级别的大模型训练和推理任务，旨在突破算力瓶颈，加速AI算力的国产化进程。国产千卡智算集群采用软硬件一体化的架构设计，提供低延迟、高吞吐、高可用的IB组网环境，支持GDR技术，使...……更多

2024-06-27 19:01:00集群,落地,模型,国产,训练,支持

位列第一梯队，腾讯混元再度领跑国内大模型

...维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型在中...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

面壁智能发布开源大模型eurux-8x22b

...大模型Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。官方测试中，Eurux-8x22B 在 LeetCode（180道LeetCode编程真题）与 TheoremQA（IT之家注：美国大学水准的STEM题目）测试上超越了 Llama3-70B……更多

2024-05-04 08:57:00模型,智能,测试,数据,模型,推理