新时代,推理,逻辑,模型,模型,问题头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

PyTorch官宣：告别CUDA，GPU推理迎来Triton

【新智元导读】用英伟达的GPU，但可以不用CUDA？PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多...……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...，和网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

百度发布深度思考大模型文心X1：性能对标R1，API调用价格

...百度首个原生多模态大模型，其多模态理解、文本和逻辑推理能力显著提升，在多项测试中表现优于GPT4.5，API调用价格仅为GPT4.5的1%；文心大模型X1为深度思考模型，性能对标DeepSeek-R1，调用价格约为R1的一半。百度方面表示，作...……更多

2025-03-16 11:07:00文心,深度,模型,性能,价格,文心

面壁智能发布开源大模型eurux-8x22b

...大模型Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。官方测试中，Eurux-8x22B 在 LeetCode（180道LeetCode编程真题）与 TheoremQA（IT之家注：美国大学水准的STEM题目）测试上超越了 Llama3-70B……更多

2024-05-04 08:57:00模型,智能,测试,数据,模型,推理

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

20多家车企接入DeepSeek：为啥没有“蔚小理华米特”

...上叫我给他们讲讲 AI 是怎么回事。由于同时具备强大的推理能力及开源模型两个特质，导致几乎所有科技公司都在研究怎样和 DeepSeek「深度融合」一下。华为、腾讯、百度、字节等互联网巨头，尽管都有各自自研的模型，但不...……更多

2025-02-14 12:52:00米特,接入,多家,模型,推理,智能

业界首款！中国联通发布元景思维链大模型：性能比肩OpenAI

...大慢思考能力，又具备不限于数学的多学科、多场景通用推理能力，且能做到针对不同任务和难度的自适应慢思考，大幅降低资源消耗。中国联通表示，主流榜单的测评结果显示，元景思维链大模型的表现超过了目前最好的通用...……更多

2025-01-24 12:33:00中国联通,中国,模型,思维,业界,性能

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

算力逻辑修复！各大厂商接入DS催化港股AI基建概念李彦宏称

...极发展成本较低的自有ASIC方案，并把重心从AI训练转往AI推理，预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展。中信证券的研报也指出，DeepSeek通过工程化能力创新，实现了大模型训练和推理算力成...……更多

2025-02-17 16:31:00大厂,李彦,港股,基建,催化,接入

华为harmonyosnext重塑全新“星盾”安全架构

...待HarmonyOSNEXT带来的全新体验，共同见证华为引领的智能新时代。 ……更多

2024-06-22 08:33:00华为,架构,全新,安全,华为,盘古

全球首个百亿级人类基因组基础模型Genos发布！

...创新注入了最核心的动力。此次Genos的发布，标志着一个新时代的开启：一个基因组智能分析的时代，一个人人都能读懂自己生命天书的时代，正加速到来。为持续推动模型迭代，华大生命科学研究院近期还联合国内外多家单位...……更多

2025-10-24 13:21:00基因组,基因,模型,人类,基础,全球

2023IDEA大会：让大模型更好应对复杂问题

...本正经的胡说八道”怎么解？众所周之，大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性，这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷，是当下AI应用的重要课题。为此，IDEA...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

讯飞星火3.0发布：综合能力已超chatgpt

...格外突出。”刘庆峰指出，认知大模型正在开启一个增长新时代，大模型正日益与每个人息息相关。刘庆峰指出：“在当前全球政治、经济军事面临巨大挑战和不确定前提下，通用人工智能是这个时代最确定的增长动力来源。”...……更多

2023-10-24 11:10:00讯飞,星火,能力,综合,讯飞,星火

腾讯推出新一代快思考模型混元 Turbo S，将在腾讯元宝逐

...用的多个公开Benchmark上，腾讯混元Turbo S在知识、数学、推理等多个领域展现出对标DeepSeek-V3、GPT-4o、Claude3.5等业界领先模型的效果表现。表格中，其他模型的评测指标来自官方评测结果，官方评测结果中不包含部分来自混元内...……更多

2025-02-27 19:52:00腾讯,灰度,元宝,新一代,模型,腾讯

张云泉：集中力量，促进国产AI大模型发展

...作为数字经济时代的全新生产力，数据、算力和算法成为新时代的关键资源。大模型的开发、训练、微调及推理各个环节均离不开算力，且算力成本占据整体开销的大头。可以说，算力成为支撑大模型发展的关键因素，也是科技...……更多

2024-09-03 14:17:00云泉,模型,国产,力量,发展,模型

东大发布深度推理法律垂域大模型

实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯（记者何洁通讯员毕胜）近日，东南大学法学院数字法学团队依托东南大学大数据计算中心，正式发布国内高校首个深度推理法律垂域大模型—...……更多

2025-03-19 08:25:00东大,推理,深度,模型,法律,法律

科研也完了，AI暴虐170位人类专家！Nature子刊：大模

...读、科研的解决方案，其通用能力覆盖了专业考试、有限推理、翻译、解决数学问题，甚至还能写代码。已有的研究考察了大模型在科研领域的表现，但基准数据集大多属于「回顾性质」的，比如MMLU、PubMedQA和MedMCQA，主要以问...……更多

2024-12-09 09:50:00暴虐,准确率,模型,高达,完了,科研

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

智慧家庭重磅文件，征求意见稿来了！事关千亿市场、8大应用场景

...标准的技术水平和国际影响力将显著提升，形成适合我国新时代发展国情的智慧家庭标准体系。为了实现上述目标，《指南》强调了标准验证服务能力建设的重要性，特别是在智慧家庭产业和标准化结合紧密的区域，将重点开展...……更多

2024-11-23 09:40:00重磅,场景,智慧,意见,文件,家庭

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

第二届世界科学智能大赛启动向全球发起选手招募

...需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理，打造‘灰盒’可信大模型。具体而言，通过融合科学规律、观测数据和合成数据，开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席，上智院院...……更多

2024-07-05 14:45:00第二届,招募,选手,大赛,智能,科学

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...型有效训练时长占比达到 98% 以上。TeleChat-52B在OpenCampass推理榜单排名第一在今年5月的 OpenCampass 测试榜单中，TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本，TeleChat2-115B 在9月最新公布的 C-Eval ……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型