推理,架构,混合,人类,能力,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...例如，OCRBench）的性能，但与低分辨率版本模型相比，在推理相关任务（例如，MMMU）上的准确率却会下降。此外，虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果，但在纯文本任务上的性能却有显著...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

研究人员给了人工智能一个“内心独白”，结果大大提高了其性能

...工智能系统，让它在说话前先思考。内心独白提高了常识推理能力，并使其数学成绩翻了一番。一项新的研究表明，给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统，会在对提示做出...……更多

2024-03-21 16:13:00人工智能,研究人员,独白,人工,内心,性能

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

9月13日，OpenAI发布具有推理能力的人工智能模型“o1”，备受行业瞩目。o1通过模仿人类的思维过程，强化学习和“思维链”技术，引导模型自主解决问题。这一特点在解决复杂问题，尤其是在科学、编码和数学等领域，展现出...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...感知未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示，不同于仅仅识别图像中的物体，具有具身感知能力的智能体必须在物理世界中移动并与环境互动，这需要对三维空间和动态环境有更透彻的...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

LeCun最新万字演讲：纯语言模型到不了人类水平，我们基本已

...：完全是胡说八道。最新的公开演讲中，他表示，系统要推理、规划和理解物理世界，至少还需要几年甚至十年的时间，这时候人工智能才能达到人类水平。他还透露，现在Meta基本已经放弃纯语言模型，因为，仅通过文本训练...……更多

2024-10-18 09:42:00模型,人类,水平,语言,系统,模型

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

...训练。故而，Step-2总参数量达到万亿级别，每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外，Step-2的训练过程中，阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术，支撑起了整...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea提出得更早，...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

全模态对齐框架align-anything来啦：实现跨模态指

...-Vision-11B 既准确地识别出了餐厅，还提供了细致的思考与推理过程。在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下，北大对齐小组愿开源数据、训练、模型、评估的全流程，为全模态对齐研究贡献力量。对齐框架...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

什么是AGI？人工智能的未来

...Artificial Intelligence）指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧，即能够学习各领域知识，并能将知识输出在各个领域。当时，约翰·麦卡锡预计人工智能将在几个月内实现。约翰...……更多

2024-03-19 06:00:00人工智能,人工,智能,人工智能,智能,人工

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

微软被曝未来3年花1000亿美金囤芯片；杨元庆：AI不是取代

...柱。开源大模型Llama3推出，百度智能云支持其全系列训练推理北京时间4月19日凌晨，Meta公布期待已久的多模态开源大模型Llama 3系列，目前包括80亿和700亿两个参数的调优版本。与此同时，Meta还推出了其首款基于Llama 3开源模型的...……更多

2024-04-30 11:00:00杨元庆,微软,美金,芯片,人类,智能

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...用混合专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

文生图参数量升至240亿！Playground v3发布：深

...像描述性能。实验结果表明，PGv3在文本提示遵循、复杂推理和文本渲染准确率方面表现出色；用户偏好研究表明，PGv3模型在常见的设计应用中，如表情包（stickers）、海报和logo设计，具有超越人类的图形设计能力，还能够精确...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

...横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Jim Fan所说，o1的出现标志着大模型研发者开始把集中在训练阶段的投入，开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多

2024-09-21 09:45:00模型,实测,协作,三个,提示,工程

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...能力，但只使用了一半的训练资源。之后，他们对模型的推理和编码能力进行了重大改进，最终开发出了 Grok-1，这是一款功能更为强大的 SOTA 语言模型，在 HumanEval 编码任务中达到了 63.2% 的成绩，在 MMLU 中达到了 73%。xAI 使用了...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

2024北京国际车展｜加速智能汽车驶入AGI时代商汤绝影系

...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力，DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是，前不久上市的小...……更多

2024-04-28 21:29:00商汤,原生态,北京,车展,模型,智能

数字员工、超级个体、具身智能，AI Agent未来发展十大研

...侧大模型加速部署，或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身手， \"AI科学家\"有望加速问世。这三个报告，一方面预测了AI Agent的未来发展趋势，另一方面也同时提及了多模态大...……更多

2024-02-02 17:00:00研究方向,个体,方向,员工,数字,智能

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

商汤科技sensetime推出“云端边”全栈大模型体系

...的指导下，会持续探索大模型能力的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

page 1/3000 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

农业银行全疆首家贵金属旗舰店亮相市民可一站式“淘金”

新疆网讯 12月27日，由中国农业银行乌鲁木齐分行打造的全疆首家贵金属旗舰店，在农业银行乌鲁木齐天山区支行正式营业，消费者可一站式获得贵金属鉴赏

2024-12-28 22:27:00

57岁阿姨演短剧：享受与年轻人竞争的乐趣

12月28日消息，据媒体报道，最近一段时间，微短剧走红网络，这些剧涉及的题材五花八门，以快节奏、高密度、强冲突、多反转著称

2024-12-28 22:39:00

国际知名动漫平台中国首店落户南京，打造二次元新地标

江南时报讯（记者邓雯婷）12月28日上午，国际知名动漫平台“布雷福思朵”中国大陆首店在南京夫子庙水游城落户，吸引了众多动漫迷与消费者的关注

2024-12-28 22:46:00

“地下51米的南京”刷屏网友直呼犹如飞龙在天

快科技12月28日消息，今天，南京地铁7号线中段正式开通运营，标志着全线实现贯通。其中，清凉山站作为南京最深的地铁站，一经亮相便在南京人的朋友圈里刷屏

2024-12-28 20:09:00

16岁男孩每天只睡5小时头秃了医生：睡眠不足精神压力大导

12月28日消息，微博话题“16岁男孩每天只睡5小时头先秃了”引发热议。据媒体报道，16岁的小周由妈妈带至医院脱发门诊就诊

2024-12-28 20:09:00

华为之后全球第二家！三星三折叠屏曝光

快科技12月28日消息，博主定焦数码爆料，除华为外，目前只有三星在布局三折叠屏，其他家都没有三折或者折叠PC的计划，不过三星三折叠屏难以做到大规模的铺货

2024-12-28 20:39:00

00后女孩独自一人野外露营帐篷内烧炭取暖差点殒命

据湖南消防12月28日消息，近日，湖南省郴州市桂东县发生了一起紧急救援事件。一名女子在深夜拨打报警电话，声音急促且含糊不清

2024-12-28 21:09:00

2024贺岁档票房破25亿：《小小的我》成黑马

快科技12月28日消息，据灯塔专业版，截至今晚19时09分，2024年贺岁档（11月22日—12月31日）档期票房（含预售）突破25亿

2024-12-28 21:09:00

量增价低持续快递业争降本：预计明年无人车无人机应用加速

2024年，快递件量已突破1500亿件，增速仍高。国家邮政局本月公布的数据显示，今年1-11月，快递业务量累计完成1572

2024-12-28 22:09:00

男子开小米SU7一年游历38个国家：倍感自豪此生无憾

快科技12月28日消息，今天，小米汽车正式步入一周年。与此同时，“小米车主故事”专栏正式开启，记录真实美好的个人故事，他们也许职业不同

2024-12-28 17:09:00

警惕超大显存的魔改显卡：买了就后悔

如果比较关注低价显卡，你或许会发现最近的魔改显卡多了好多，尤其是某鱼有很多超大显存的显卡，比如860元的魔改RX5600拥有12GB显存

2024-12-28 17:09:00

国产芯新成就！飞腾系列国产CPU总销量突破1000万片

快科技12月28日消息，据官方公布消息显示，中国电子飞腾系列国产CPU总销量突破1000万片。中国电子飞腾系列国产CPU总销量近日突破1000万片

2024-12-28 17:09:00

闲徕手游联运平台玩法全解析

在如今蓬勃发展的手游市场中，手游联运平台成为了众多游戏从业者关注的焦点。那么，手游联运平台究竟有哪些独特的玩法呢？首先

2024-12-28 17:10:00

绘说现代化丨航天强国勇毅前行

本文转自：人民网嫦娥六号月球背面“挖宝”归来、中国空间站上演两次在轨“换班”、长三乙火箭跨入“百次发射俱乐部”....

2024-12-28 17:17:00

华为Mate 70系列一机难求！博主：从元旦开始货源会增加

快科技12月28日消息，博主厂长是关同学透露，华为Mate 70系列从元旦开始会陆续增加货源，这批次供货Pro版会多一些

2024-12-28 17:39:00

头条订阅服务