• 我的订阅
  • 头条热搜
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
什么是AGI?人工智能的未来
...Artificial Intelligence)指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧,即能够学习各领域知识,并能将知识输出在各个领域。当时,约翰·麦卡锡预计人工智能将在几个月内实现。约翰...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...柱。开源大模型Llama3推出,百度智能云支持其全系列训练推理北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...能力,但只使用了一半的训练资源。之后,他们对模型的推理和编码能力进行了重大改进,最终开发出了 Grok-1,这是一款功能更为强大的 SOTA 语言模型,在 HumanEval 编码任务中达到了 63.2% 的成绩,在 MMLU 中达到了 73%。xAI 使用了...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是,前不久上市的小...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身手, \"AI科学家\"有望加速问世。这三个报告,一方面预测了AI Agent的未来发展趋势,另一方面也同时提及了多模态大...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是“当今世界上最...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
商汤 AI 办公小程序“Raccoon 智能助手”上线:提炼文章重点
... 大模型,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,提供自然语言处理...……更多
百度文心一言发布会详细纪要
...话体现出文心一言各方面的能力,比如总结分析的能力、推理的能力。事实性的东西对于一个搜索引擎来说不是那么难,但是对于一个生成式预训练大模型来说,出错的概率还是挺高的,这些问题都答对相当不容易,因为百度的...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...完成上面说的第二个步骤,模型中没有思维链,也不具备推理能力。PaLM-E 让机器人有了聪明的大脑,可以将复杂自然语言指令分解为简单指令,完成上面说的第一个步骤,然后再去调用 RT-1 执行动作。所以,PaLM-E 所做的只是自...……更多
高通骁龙:端侧AI 启幕移动智能“芯”时代
...与能效飞跃,搭载了史上最快的高通Hexagon NPU,比上一代推理速度快98%,每瓦特性能提升40%,支持大模型参数规格从年初的10亿量级暴增10倍至100亿,可以以20个Token/s的速度进行AI大模型的生成。高通传感器中枢也引入了下一代微...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。戴琼海提到,清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百...……更多
朱松纯:通用人工智能要“眼里有活”,关键在AI“价值观”
...级较少的无标注数据,强调自主的智能,如感知、认知,推理、学习、执行。“就像人类大脑平时相当于只有10瓦的算力,激烈思考时也就达到25瓦,但人类仍然拥有高超的智能……,这是两条完全不同的赛道。”朱松纯说。而...……更多
...法不准确。同时,它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...代模型在技术上可能解决目前ChatGPT中存在的事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实...……更多
GPT-4就是冲着赚钱来的!
...GPT-4的预期可能更高。“GPT-4目前可以说是具备了基本的推理能力和逻辑能力。但是应该还不能处理复杂问题,或者我们不知道怎么给prompt(提示词)。所以现在还只是一个知识特别丰富,但是只有基本推理逻辑能力的AI。”Liu Li...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
联想王传东:AI PC重塑产业生态 新应用崛起
...来的公共大模型,提供的都是不涉及个人隐私数据的基础推理服务,无法得知用户偏好,在隐私和安全方面也存在弊端。王传东表示:“出于数据安全和隐私保护的考虑,以及更高效率、更低成本响应用户需求的考虑,人们既希...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...同的模型形态,采用混合专家模型(MoE)结构,提高训练和推理效率及专业领域适应性,具备强大的中文创作能力。 腾讯混元大模型构建三层自主可控的国产大模型全栈技术架构:上层为自研高速网络互联来支撑模型训练,预计20...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...er模型取得了比扩散模型更好的结果,只有900M参数,但在推理时间上比StableDiffusion1.4版本快3倍,比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比:文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多
大语言模型如何宣告心理学的死亡?
...数据的相关性连接,以及作为表征数据内部相关性连接的推理规则和推理方法。当这些连接达到一定的密度和连通性时,LLM似乎展现出了推理的能力。但这种能力更多是因为它们处理大量相关性连接时所表现出的复杂性,而不是...……更多
更多关于科技的资讯:
“感谢太重让我们的起重机拥有了一颗‘智慧心’。”6月29日,用户拿到太重提交的起重机升级设计成果后,发出了这样的感叹。不久前
2024-06-29 20:07:00
中国联通贵安智·云数据中心智算资源已服务全国
记者日前从中国联通贵安智·云数据中心获悉,该中心正在建设中的智算楼宇,建成后承载算力预计可达20.4EFLOPS(FLOPS即每秒执行的浮点运算次数
2024-06-29 20:46:00
第26届中国机器人及人工智能大赛海南赛区总决赛开幕
本文转自:人民网-海南频道第26届中国机器人及人工智能大赛海南赛区总决赛开幕。主办方供图人民网海口6月29日电(记者 毛雷)6月29日
2024-06-29 22:53:00
有机会获百万资助!腾讯启动新项目寻找AI技术保护文化遗产
用宇宙射线给云冈石窟做CT,为圆明园兽首打造裸眼3D沉浸式体验……6月28日,“探元计划2023”五大共建场景成果发布
2024-06-29 17:31:00
为父母买手机怎么选?优先考虑实用和性价比
给父母选手机重点是什么?相信很多人都被这样的难题所困,现在的旗舰手机,大都在影像上卷的特别严重,然而对于父母而言,他们不玩大型游戏
2024-06-29 18:04:00
你还买日系车吗!东风本田怒斥国产新能源割韭菜暗简配背后:本田中国销量锐减
快科技6月29日消息,近日,东风本田销售部副部长杨忠华怒斥了国产新能源,认为在看不见的地方以次充好引发网友热议。日前,在本田猎光发布会上
2024-06-29 17:10:00
AI芯片成新一代电老虎:未来五年消耗全球1.5%以上的电力 产生11亿吨碳排放
快科技6月29日消息,AI芯片的快速增长,带来了耗电量的大幅增加。一些计算表明,AI所需的电力将在全球电力消耗中占据相当大的份额
2024-06-29 17:10:00
微信分期上线!可分3、6、12期分期还款 消费500元以上可用
快科技6月29日消息,今日有媒体发现,微信“分期”上线。据了解,该产品支持线上线下场景,可分3、6、12期分期还款,消费500元以上可用
2024-06-29 17:10:00
哪里最幸福?中国十大最具幸福感城市排名:你的家乡上榜没
快科技6月29日消息,据国内媒体报道称,2023年中国十大最具幸福感城市排名已经出炉,南京、杭州、长沙居前三。报道中提到
2024-06-29 17:10:00
美好人居时代人物|木里木外练峰:智能高定,只为“美好关系”
美学策源、榜样引领。回首二十余年,家居建材各品类品牌领导者、产业资源引导者探寻本源,厘清并制定品牌战略,开展恰当的渠道策略
2024-06-29 17:10:00
为大家揭秘游戏代理之路,如何获得游戏代理权?
亲爱的玩家们,你们好!在数字娱乐的世界里,游戏代理权不仅是实力的象征,更是市场价值的体现。你是否想过,有一天你也能成为某个热门游戏的代理商
2024-06-29 17:15:00
总投资107亿元 银川经开区绿色智算中心项目集中开工
本文转自:人民网-宁夏频道人民网银川6月29日电(周航)6月28日,银川经开区绿色智算中心项目集中开工现场推进会举行。本次集中开工5个项目
2024-06-29 17:18:00
回应小米空调第一不实后!董明珠:不是我刻意要当网红 格力的产品深入人心
6月29日消息,近日,在格力电器2023年度股东大会现场,董明珠再谈自己的“网红”身份。“很多人总会认为我是一个网红,但不是我要刻意当‘网红’
2024-06-29 17:40:00
旅游列车市场经营权第一次公开招商:去往大东北、大西北
快科技6月29日消息,国铁招商平台公布了7月10日至8月31日期间各地经由兰新铁路、兰新高铁去往新疆方向,经由嫩林铁路去往黑龙江漠河方向等旅游列车市场经营权的中商企业名单
2024-06-29 17:40:00
AMD Zen5锐龙AI 300笔记本推迟两周:差点和锐龙9000撞车
快科技6月29日消息,对于Zen5架构的锐龙AI 300笔记本、锐龙9000台式机处理器,官方给出的上市时间只是模糊的7月份
2024-06-29 17:40:00