• 我的订阅
  • 头条热搜
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果,但在纯文本任务上的性能却有显著...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,尤其是在科学、编码和数学等领域,展现出...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元T1正式版进一步...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数,……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...感知未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示,不同于仅仅识别图像中的物体,具有具身感知能力的智能体必须在物理世界中移动并与环境互动,这需要对三维空间和动态环境有更透彻的...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...:完全是胡说八道。最新的公开演讲中,他表示,系统要推理、规划和理解物理世界,至少还需要几年甚至十年的时间,这时候人工智能才能达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...ma 4的推出将让AI智能体变得更强大,使其具备更高水平的推理和行动能力。据知情人士透露,Llama 3已经推出一年了,而Llama4之所以迟迟未能发布,是因为在开发过程中,该模型在技术基准上没有达到Meta的预期,尤其是在推理和...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...训练。 故而,Step-2总参数量达到万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外,Step-2的训练过程中,阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
不止反击,谷歌在AI群隔空@所有人
...得罗夫(Slav Petrov)说。皮查伊具体称,“PaLM 2在逻辑和推理方面进行了广泛的训练,具有极强的逻辑和推理能力。”我们知道,ChatGPT-4作为其中知名的一个代表大模型,其功能的强大已无需赘言,尤其是在逻辑推理和数学表现...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
什么是AGI?人工智能的未来
...Artificial Intelligence)指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧,即能够学习各领域知识,并能将知识输出在各个领域。当时,约翰·麦卡锡预计人工智能将在几个月内实现。约翰...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...,MoE在训练过程通过门控模型实现“因材施教”,进而在推理过程实现专家模型之间的“博采众长”。 图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化,在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...柱。开源大模型Llama3推出,百度智能云支持其全系列训练推理北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的...……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...成式AI可以生成图像、文本和声音,现在还有可以感知、推理、规划和行动的AI代理(AI Agent),以及物理AI。“2018年谷歌发布了Transformer,这完全改变了AI的格局,甚至完全改变了整个计算的格局。”黄仁勋表示,AI不仅仅是一个...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...像描述性能。实验结果表明,PGv3在文本提示遵循、复杂推理和文本渲染准确率方面表现出色;用户偏好研究表明,PGv3模型在常见的设计应用中,如表情包(stickers)、海报和logo设计,具有超越人类的图形设计能力,还能够精确...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
... 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降低了商业应用门槛。 优刻得云平台始终密切关注A...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...能力,但只使用了一半的训练资源。之后,他们对模型的推理和编码能力进行了重大改进,最终开发出了 Grok-1,这是一款功能更为强大的 SOTA 语言模型,在 HumanEval 编码任务中达到了 63.2% 的成绩,在 MMLU 中达到了 73%。xAI 使用了...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是,前不久上市的小...……更多
更多关于科技的资讯:
95后清华博士,辍学,造出逆天机器人
3.99万,这是一款N2人形机器人的价格。这个价格,可以称之为“相当划算”,因为N2是全球第一个实现多场景连续空翻的机器人
2025-06-07 16:04:00
锂电池出口检验启动“快进模式” 厦门海关试点“出口锂电包装智慧监管”
厦门海关关员监管一批即将出口的锂电池。(童婕 摄)厦门网讯(厦门日报记者 吴晓菁 通讯员 陈志旭)昨日,厦门时代新能源科技有限公司(以下简称“厦门时代公司”)通过“出口锂电包装智慧监管”系统
2025-06-07 08:22:00
浙江日报讯 (记者 姜晓蓉 通讯员 柯溢能 查蒙) “学校AI模拟面试总结和分析能力非常强,其中追问模式特别有用,让我提前适应面试节奏
2025-06-07 09:08:00
干货多,收获丰!“艺术为广告赋能”南京研讨会圆满落幕
夏日葳蕤精英汇,艺术赋能起风云。6月4日,由南京市广告协会主办、大贺艺术空间承办的“艺术为广告赋能”南京研讨会圆满落幕
2025-06-07 09:33:00
编者按:2025年,东营市以“提振消费”为核心引擎,打出一套政策组合拳,通过惠民让利、场景创新、环境优化等多维举措,激发市场活力
2025-06-07 09:47:00
长春光谷·光博盛会|长光卫星:逐光苍穹 星耀光博
随着2025长春国际光电博览会•light国际会议(以下简称“2025长春光博会”)日益临近,聚焦吉林这片“中国光学摇篮”的创新沃土
2025-06-07 09:37:00
栖霞板块:创新生态聚势,一路与“智”同行
扫一扫,了解更多内容。□南京日报/紫金山新闻记者朱旖旎南京经开区,空气中弥漫着奋斗的气息。在兴智科技园C栋云蝠智能的办公区
2025-06-07 08:00:00
在“歌声唱给党 跟着总书记的足迹看贵州”网络主题宣传中,财经博主徐梦婧(@财经麦麦吉)聊起了贵州“村超”“村BA”的流量转化话题
2025-06-07 05:34:00
以“数”为脉重塑产业生态网|做强做优贵州数字经济(1)
在占据贵阳大数据交易所一面面墙的LED屏幕上,一串串数字滚动更新。在“银发经济”数据交易板块的首次亮灯,让这所中国首家数据交易枢纽再次成为行业焦点——贵州益智慧科技开发有限公司(
2025-06-07 00:53:00
数据“想象力”变产业新动力|做强做优贵州数字经济(2)
作为一家去年12月中旬才在毕节注册成立的新公司——贵州灵动大数据有限公司一季度数据交易额达到103.9万元,实现了毕节市数据产品在贵阳大数据交易所全流程场内交易零的突破
2025-06-07 00:53:00
3砺生辉&618大促丨开启甄选礼遇
烟台中泽华羿铂尔曼酒店2022.6.6-2025.6.6三载春华秋实烟台中泽华羿铂尔曼酒店迎来了三岁生辰岁月匆匆 宛如白驹过隙一千零九十五个日夜更迭见证了我们从青涩到坚韧的蜕变我
2025-06-07 03:03:00
戏剧艺术的创新发展路径
摘要:在数字化与全球化冲击下,戏剧艺术面临着传统模式与时代需求的结构性矛盾。本文以创新为核心,从技术融合、文化根植、市场下沉及社会应用四个维度
2025-06-06 09:00:00
乐其创新SmallRig助力全球公益影像创作者记录湾区活力,深化国际文化交流实践
2025年5月23日,以“影像浪潮・时代进程”为主题的2025国际影像文化周(中国·深圳)正式开幕,本届国际影像文化周涵盖全球影像场景产业论坛
2025-06-06 10:35:00
全球动漫与文化洞察:中国国际动漫节(CICAF)上的分享
近期在中国杭州闭幕的中国国际动漫节(CICAF)为国际交流搭建了一个充满活力的平台,吸引了全球人才,并展示了动漫产业的蓬勃未来
2025-06-06 10:35:00
碧莲盛二十周年:以技术革新守护毛发健康
2025年,中国植发行业头部企业碧莲盛医疗集团迎来创立20周年庆典。6月5日,董事长尤丽娜在北京华贸旗舰店领衔启动盛典
2025-06-06 10:35:00