• 我的订阅
  • 头条热搜
能看风水 夸我有情趣 Kimi现在都这么野了吗
最近,差评君发现了个新鲜玩意儿。喂给 AI 一张图,它就能给你推测出一个人的性格。光靠歌单,就能把人最近的心理状态推测个七七八八。而这些,都出自 Kimi 最新的 k1 视觉思考模型之手。这不,距离上次推出数学模型 k0-ma...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比如官...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...出现。想来想去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研究范式存在一定的不足,于是决定来到香港中文大学读博。图 | 曾忠燊(来源:曾忠燊)前不久,曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式,...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
随着大模型的发展日新月异,其推理和训练的边界问题也引起了广泛讨论。近日,清程极智CEO汤雄超在一场行业活动中明确表示,尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限,但从技术角度来看,这两个阶段...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
....3%,显著高于DeepSeek-V3的3.9%,也远远超过行业的其他推理模型,比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符,或偏离用户指令的现象,会极大影响用户的使用体验。在医疗、法律、金融等对准确性要求高...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
对标o1,Kimi放出了最能打的国产模型
...性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时间,o1 将大模型的能力又往前推了一步。这段时间,国内大模型初创公司月之暗...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...地与环境和自身频繁交互,并从中获取经验予以改进。大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势,北京理工大学 DIRECT LAB 正式启动了「大模型自我进...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表...……更多
...闻网中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频,终于上线了!全程22分钟,o1研发团队在项目Bob McGrew组织下,一起分享了「啊哈」时刻。有的人提到,...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...了开幕式。度小满CEO朱光在金融科技周主论坛上发言“大模型在金融行业的应用”是本届科技周最受关注的话题。度小满CEO朱光在科技周主论坛上表示,“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用,将从外...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...二,据知名科技商业类媒体The Information援引多位测试过该模型的人士透露,站在时代风口浪尖的“AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品,作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推理
...作为ChatGPT服务的一部分,OpenAI计划在未来两周内发布新AI模型“草莓”(Strawberry)。该时间表要早于之前的预期。根据之前的报道,“草莓”是一款专注于推理的AI产品,预计于今秋发布。但这两位测试过该模型的人士称,OpenAI...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...13日在上海大学举行的总决赛。据悉,今年的赛题包括大模型推理优化、渗流数值模拟,以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的特征,正越来越多地在人工智能领域,尤其是大型语言模型(LLMs)中得到广泛应用,最近爆火的OpenAI o1模型[1]和Reflection 70B模型[2]都采取了自我纠正的方法。传统的大语言模型,因为在输出答案的时候是逐个Token输出,当输出...……更多
更多关于科技的资讯:
折叠屏iPhone前瞻:书本式折叠方案 定价或超2万元
苹果一直以来都在持续推出高端iPhone,以高利润来应对整体销量下滑的挑战。近日天风国际证券分析师郭明錤发布简报,预测苹果公司将于2026年底或2027年初发布其首款折叠屏iPhone
2025-03-06 22:43:00
选装价4.2万!小米SU7 Ultra碳纤维双风道前舱盖受损太多没法修
快科技3月6日消息,今日,小米汽车发布答网友问第117集,都是一些很实用的注意提醒。对于小米SU7 Ultra的碳纤维双风道前舱盖如果发生碰撞
2025-03-06 22:43:00
豪华品牌标配!小米汽车宣布免费提供维修代步车
快科技3月6日消息,在小米汽车最新一期的答网友问中,针对新提小米SU7 Ultra车主提出的“免费代步车”问题进行了回复
2025-03-06 23:13:00
顶配价格超10万!苹果新款MacBook Air/MacStudio看点汇总
3月5日晚,苹果发布了包括搭载M4芯片的MacBook Air、Mac Studio以及突破性的M3 Ultra芯片在内的新品
2025-03-06 23:13:00
男子在杭州太子山意外拍到黄山:光明顶清晰可见
3月6日消息,据媒体报道,浙江杭州杨先生在杭州太子尖拍摄到安徽黄山的壮观云海。当事人表示,杭州太子尖到安徽黄山直线距离约70公里
2025-03-06 23:13:00
【浪潮星锐】商广勇:关于我职业生涯关键词的三次进化
对于商广勇来说,“创新”是他职业生涯的一大关键词。在浪潮近二十年,在他看来,创新是自己一直不变的底色,但每个阶段对于创新的理解也不尽相同
2025-03-06 23:27:00
超跑同款!小米SU7 Ultra主动尾部扩散器有何作用:官方解答来了
快科技3月6日消息,在最新一期的小米汽车答网友问中,官方详细解释了小米SU7 Ultra主动尾部扩散器的作用。该扩散器位于车尾下方
2025-03-06 23:43:00
《双人成行》团队新作《双影奇境》今日发售:国区198元 全球最低价
快科技3月7日消息,今天零点,2021年TGA年度游戏《双人成行》团队新作——《双影奇境》国区正式解禁开售,国区售价198元
2025-03-07 00:43:00
中国移动董事长杨杰:正全面进行6G研发 比5G有三方面升级
快科技3月7日消息,5G方兴未艾,而6G已离我们越来越近。据中证金牛座,日前,中国移动董事长杨杰接受采访时表示:“我们正在全面进行6G研发
2025-03-07 00:43:00
替代高通!曝苹果自研基带升级版明年量产:补齐最后一块短板 支持毫米波
快科技3月7日消息,分析师郭明錤爆料,苹果C1基带的升级版计划明年量产,新款基带芯片支持毫米波,补齐最后一块短板。郭明錤指出
2025-03-07 00:43:00
在快节奏的工作环境中,管理者作为团队的领航人物,其角色至关重要。然而,当管理者逐渐脱离实际业务,沉浸在会议、报告和宏观规划中时
2025-03-07 02:08:00
烟台高新区:抢占未来发展“智”高点
胶东在线3月3日讯(通讯员 郭健) 人工智能作为新一轮科技革命的关键驱动力,对国家级高新区发展意义重大。烟台高新区卫生健康局持续聚焦人工智能产业
2025-03-07 03:03:00
本文转自:人民日报邹  翔人工智能会取代你我吗?这一话题引发热议,有代表委员认为人工智能正赋能千行百业并逐渐取代人工,还有代表委员认为要加强学习
2025-03-07 06:11:00
本文转自:人民日报人工智能(AI)是科学技术发展到新一轮的最新变革,它不仅推动产业升级,改变传统经济的面貌,而且对人类社会生活产生深远影响
2025-03-07 06:13:00
一块医药:助力构建医药供应链新生态  提升服务品质助力美好生活
本文转自:人民日报作为国内领先的成长型连锁药店供应链与运营服务商,湖南一块医药科技有限公司(简称“一块医药”)始终秉持“技术驱动+全链路赋能”的企业战略
2025-03-07 06:13:00