• 我的订阅
  • 头条热搜
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
财联社9月13日讯北京时间周五凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”...……更多
...自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。推进流程行云流水AI技术不断进步,让科学家能借助一些模型来集思广益或...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...伴生一系列 AI 相关的职业,催生 AI 程序员。ChatGPT 就是新时代的 OS,现在每个人都可以尝试把专业领域的知识以用户体验的方式传达出去,ChatGPT 可以观察到每一个问题的深度,准确地满足用户的需求。从人机交互的角度,王千...……更多
...过程中,其范围、种类和功能也需要客观考量。从而催生新时代的数字法理。其二,数字法律关系。随着数字时代的到来,人类进入了不依赖于时间、地点的数字化生存模式,每个人都会在数字交往中形成碎片化的、多处“流动...……更多
2023-11-06 05:06:00数字法理的根基与面向
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...爽博士出席并发表主题演讲《软硬件协同优化,赋能AI2.0新时代》。 大模型是AI2.0时代的“蒸汽机” AI+X应用落地及边缘计算将成为关键 自ChatGPT发布以来,大模型引爆“第四次工业革命”,成为AI2.0时代的“蒸汽机”,驱动着...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
...科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...本Claude 3.5 Sonnet。从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言,“太卷了,现在AI竞争是要以周为单位了吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
ChatGPT一周年,机会在大厂还是小公司?
...人生轨迹的海量创业者们。目前来看,Open AI很可能成为新时代里的苹果公司——就连创始人被驱逐出董事会再回归的桥段,都如此相似。就算它无法复制苹果的成功,微软和谷歌也足够有野心。在中国创业圈,AI狂飙的剧情正在...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...模型的短板,此前行业也多次讨论过大模型的数学和复杂推理能力较差,即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次,第一财经曾在6月报道过,根据司南评测体系OpenCompass的高考全卷测试,包括GPT-4在内,7...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... 3.5依旧答错了。LeCun在此嘲讽大模型一番,大模型竟可以推理...?问题在于,LLM没有常识,不理解现实世界,也不会规划和推理。LLM行不行,就看提示了一位网友分析总结了,以上LLM失败的原因。他表示,LLM本身就是个「哑巴」...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...要更多的时间,见证AI的飞轮旋转起来。那是创新驱动的新时代,科技将改变我们的人生。来源:刺猬公社返回搜狐,查看更多责任编辑: ……更多
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,尤其是在科学、编码和数学等领域,展现出...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...-4o,最强大模型Llama3.1405B一夜封神,扎克伯格:开源引领新时代》 ……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...着科技的飞速发展,我们正快速进入一个以算力为主导的新时代。这个时代的到来,将对经济社会的方方面面产生深远影响。中兴通讯的陈新宇在一次内部会议上指出,公司在未来将坚定投资于算力领域,并致力于智能计算基础...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
更多关于科技的资讯:
新款iPhone 16 Pro机型配备了新一代超瓷晶面板
AppleTrack的SamKohl专程飞往澳大利亚,只为了成为第一个发布iPhone16Pro与iPhone15Pro跌落测试对比的人
2024-09-24 01:42:00
北京汽车新标志变更为baic字母车标
9月23日消息,北京汽车股份有限公司9月20日发布公告称,公司标志已变更,自本公告日期起生效。从官方公布的文件看,新标志改为BAIC的字母车标
2024-09-24 01:52:00
年轻科技潮牌vidda携2024激光投影新品亮相
9月19日,2024激光显示技术与产业发展大会在青岛召开,作为激光显示行业盛会之一,本次大会展出了“激光显示+电视”“激光显示+投影”“激光显示+商用”“激光显示+车载”等多个场景创新产品
2024-09-24 02:03:00
三星计划与亚马逊合作推出galaxym155gprime
据外媒消息,三星正计划与亚马逊合作推出一款名为GalaxyM155GPrime的新手机。多年来,三星手机一直没有使用“Prime”这个名字
2024-09-24 02:26:00
比亚迪旗下全新车型海狮05DM-i迎来正式上市
9月23日,比亚迪旗下全新车型海狮05DM-i迎来正式上市。该车定位紧凑型插电式混动SUV,与宋Pro并列为姊妹车型,旨在刷新国民SUV体验
2024-09-24 02:34:00
杨幂使用华为matext非凡大师接听电话引关注
9月23日消息,在社交平台上,杨幂使用华为MateXT非凡大师接听电话的视频引发关注。如图所示,杨幂使用的是华为MateXT非凡大师玄黑配色
2024-09-24 03:01:00
Redmi Note 14系列将发布,采用1.5K全面屏
9月23日消息,RedmiNote14系列将于9月26日19:00发布,这一代的Note小金刚主打“更抗摔、更防水、更长续航”
2024-09-24 03:02:00
户外音乐神器huaweisoundjoy2即将发布
近两年,随着户外运动和露营热潮席卷全国,一款能够点燃氛围、带来精彩音乐体验的便携式户外音箱,逐渐成为年轻人的户外必备单品
2024-09-24 03:20:00
OPPO计划推出两款磁吸充电宝
9月23日,数码博主@熊猫很禿然在微博上爆料称,OPPOFind系列的产品负责人周意保最近透露了不少关于OPPO新品的信息
2024-09-24 03:31:00
外媒感叹华为matext三折叠屏手机非常薄
CNMO注意到,近期有多家外媒上手体验了仅在国内发售的华为MateXT三折叠屏手机。其中有一家外媒上手后,对这款手机的坚固程度感到惊讶
2024-09-24 03:40:00
9月24日至26日三大手机厂商将举办新品发布会
CNMO注意到,近期新机发布的节奏逐渐密集。据各家厂商官方消息,9月24日至9月26日,有三家手机厂商将分别举办新品发布会
2024-09-24 03:44:00
乐道l60上市72小时快报,首批用户画像曝光
9月23日,CNMO注意到,有博主放出了乐道L60上市72小时快报,并给出了首批用户的画像。乐道L60均店新增大定订单量达到160至180台
2024-09-24 03:57:00
iphone16系列触摸屏失灵,用户揭露其他缺陷
苹果发布会的热度在持续上涨,但都是吐槽的声音,不少人称该系列手机在触摸屏方面存在严重问题,具体表现为首次滑动屏幕时有响应
2024-09-24 04:08:00
华为全屋智能助力康养产业发展
随着我国人口老龄化进程的加快,老龄化社会所带来的挑战日益凸显,我国60岁以上老年人口已近3亿,我国银发经济规模约7万亿元
2024-09-24 04:21:00
三星准备好开放oneui7.0beta测试计划
据外媒报道,三星似乎已经准备好开放OneUI7.0的Beta测试计划。最近,三星更新了SamsungMembers应用
2024-09-24 04:35:00