• 我的订阅
  • 头条热搜
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
...出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来编写一个找松鼠的网页...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...到的“思考”过程,来源:OpenAI) 认知将跃升至“理科博士生水准”OpenAI曾解释过,2023年发布的GPT-4类似于高中生的智能水平,而GPT-5则是完成AI从“高中生跃升至博士”的成长。这个o1模型就是其中关键的一步。相较于GPT-4o等...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...授,阿兰・图灵研究所 Turing Fellow,其指导的 UCL 一年级博士生宋研。利物浦大学助理教授方蒙。上海交通大学 Apex 和多智能体实验室张伟楠教授(上海交通大学计算机系教授、博士生导师、副系主任),温颖副教授(上海交通...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...人工智能。袁洋袁洋是清华大学交叉信息学院助理教授,博士生导师。2012年毕业于北京大学计算机系;2018年获美国康奈尔大学计算机博士学位;2018-2019年前往麻省理工学院大数据科学学院做博士后。他的主要研究方向是智能医...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
北京大学王选计算机研究所研究员、博士生导师 赵东岩出品|搜狐科技作者|张雅婷随着DeepSeek的爆火,公众对AI幻觉的担忧也日益加剧。比如,不少人通过DeepSeek辅助就医、撰写论文时发现,DeepSeek会“一本正经地胡说八道”...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...for optical neural networks)为题,发表于 Nature[1]。 清华大学博士生薛智威、博士后周天贶是共同一作,方璐教授、戴琼海教授担任共同通讯作者。清华大学博士生徐智昊、之江实验室虞绍良博士参与了本项研究。图丨相关论文(来...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...理、化学和生物学这些具有挑战性的基准任务上的表现与博士生相似。OpenAI 还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅正确解答了 13% 的问题,而 o1 模型正确解答了 83% 的问题。模型...……更多
MIT最新研究:多个AI协作有助提高大模型推理能力和准确性
...提高自己的回答。”麻省理工学院电气工程和计算机科学博士生、CSAIL附属成员以及论文的首席作者之一Yilun Du说道。根据Yilun Du的个人主页,他目前正在攻读博士,此前已获得麻省理工学院学士学位,曾在ChatGPT的开发机构OpenAI...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...副主任 张奇张奇,复旦大学计算机科学技术学院教授、博士生导师。兼任上海市智能信息处理实验室副主任,中国中文信息学会理事、CCF 大模型论坛常务委员、CIPS 信息检索专委会常务委员、CIPS 大模型专委会委员。主要研究方...……更多
...了人类的性别、伦理和道德偏见。伦敦大学学院信息学系博士生奥利维娅·麦克米伦-斯科特问道:“它们是否也反映了人类在推理测试中的认知偏差?”她总结自己的研究成果称,这些大语言模型“经常表现出非理性推理,但表...……更多
...三。”项目带头人、Om AI Lab人工智能中心主任、浙江大学博士生导师赵天成博士在为记者通俗解释的同时,也表达了对引发反响的意外惊喜,“一天涨十几个星标比较常见,能收获几百个星标已经算是全球顶尖了;像VLM-R1这样一...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
日前,美国罗格斯大学博士生金明宇和所在团队,通过引入思想链(CoT,Chain of Thought)的概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...Song Han教授指导。同时,他也是大连理工大学IIAU实验室的博士生,导师是Huchuan Lu教授。他的研究领域是生成式AI和机器学习的交叉,特别是深度学习及其应用的算法与系统协同设计。此前,他曾在香港大学担任研究助理,由Ping L...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...成了 PaperQA2 系统,它在检索和总结任务上的表现超过了博士生和博士后。将 PaperQA2 应用于矛盾检测任务让我们能够大规模识别生物学论文中的矛盾。例如,ZNF804A rs1344706 等位基因对精神分裂症患者的大脑结构有积极影响的说法...……更多
“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平
...的重要言论。米拉表示,大约一年半年后,OpenAI将发布“博士生水平”的人工智能。相较之下,GPT-3相当于幼儿的智能水平,GPT-4更像高中生的智能水平。但她强调,博士等级的AI仅适用于某些特定任务,“这些系统在某些特定的...……更多
大江东|在首届浦江AI学术年会,感受人工智能加速跑
...国在高端人才引进和培养方面已取得显著进展,尤其是在博士生和青年科学家的创新成果上,达到了国际先进水平。”姚期智感慨,这让他十分惊喜。“引进人才只是第一步,更重要的是他们能够在这里扎根、成长。真正有抱负...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...斯。 共同一作Agrim Gupta是斯坦福大学计算机科学专业的博士生,2019年秋季入学,同样是李飞飞的学生。此前,他曾在微软、DeepMind,有Meta的全职经历,也在Google做过兼职。2018年时,他就跟随李飞飞一同在CVPR上发表了论文。目...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...交大GAIR实验室(生成式人工智能研究实验室)的一年级博士生组成。指导教师包括上交大副教授刘鹏飞,姚班校友、斯隆奖得主李远志等。LLaMA-O1:https://github.com/SimpleBerry/LLaMA-O1相关论文:https://arxiv.org/abs/2406.073……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...为华人学者Tianhao Wu。Tianhao Wu目前是加州大学伯克利分校博士生,导师是焦剑涛(Jiantao Jiao)和Kannan Ramchandran。本科主修数学,合作导师是北大教授、清华交叉信息学院兼职教授王立威(Liwei Wang)。他的研究重点是通过强化学习...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
...者通过了所有检查并被纳入分析结果,大多数人类专家是博士生、博士后研究员或教职/学术人员。在BrainBench上,大型语言模型的性能表现都超过了人类专家,平均准确率为81.4%,而人类专家的平均准确率为63.4%;当把人类回答限...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者。从事多模态大模型与具身智能研究,取得了一系列重要研究成果,在人工智能顶级期刊和会议上发表论文 80 余篇,谷歌引用 9700 余次。荣获...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...电影中的场景正在变为现实,来自北京大学的助理教授、博士生导师董豪团队近日提出首个通用指令导航大模型系统InstructNav。不论是寻找物体,走到指定位置,还是满足抽象的人类需求,只要你说出指令,InstructNav都能帮你实...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...能让应用变得更广泛。同济大学百人计划、特聘研究员、博士生导师 王昊奋 :ChatGPT 出来后,我被问得 最多的问题就是——知识图谱是不是不用做了?是不是相当于“判死刑”了?我说可能“死缓”吧,当然,也还有不少变数...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...物和化学问题(GPQA)基准测试中的准确率也超过了人类博士生水平。据介绍,类似于人类在回答一个难题前可能会思考很长时间,o1在尝试解决问题时也会使用一连串的思考。通过强化学习,o1可以学会磨练自己的思维链,完善...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...产品在大模型领域的协同发展,清华大学新闻学院教授、博士生导师沈阳认为,依托搜索平台,夸克大模型拥有高质量的各类数据。在教育、医疗等垂直领域中,夸克在对话、解题上的能力取得了新突破。同时,在安全性能上,...……更多
字节跳动实习生投毒自家大模型:全删了
...任何处罚。多方消息显示,田姓实习生为国内某高校在读博士生,于2021年9月起在字节AI Lab实习,其所在的团队刚在今年4月与北大王立威团队提出了VAR研究,在图像生成质量、推理速度、数据效率和可拓展性等方面均超过了DiT。...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目:Embedding Trajectory for Out-of-Distributi...……更多
郑小林:建立思维链的AI 具有里程碑意义
...·2024全球数字生态大会举行,浙江大学计算机学院教授、博士生导师,浙江大学人工智能研究所副所长郑小林就AI的最新发展趋势发表了自己的观点。“AI不局限于数字世界,还要与物理世界进行深度交互,这是未来发展的重要...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...产品在大模型领域的协同发展,清华大学新闻学院教授、博士生导师沈阳认为,依托搜索平台,夸克大模型拥有高质量的各类数据,在中文语境下,模型能力处在行业领先水平。在教育、医疗等垂直领域中,夸克在对话、解题上...……更多
浙江赴港举办高端人才招聘会 数字经济领域人才受青睐
...聚焦大模型、智能计算等领域。香港大学电子工程专业的博士生周游,提前对实验室进行过了解。一到现场,就直接来沟通岗位要求、薪资待遇等细节。求职者 周 游:主要是想赵比如说通讯中的架构研发、模型推理,之江实验...……更多
更多关于科技的资讯:
深圳香蜜丽格成功举办2025LA-HA中国激光医学研讨会。续写Fotona4D发展新篇章
鹏城8月,热力全开!2025年8月5日,“2025LA-HA中国激光医学研讨会暨Fotona欧洲之星基石方案临床应用交流会”在深圳香蜜丽格圆满落幕
2025-08-08 20:05:00
中新经纬8月8日电 据深交所微信公众号8日消息,8月5日,深交所在杭州举办第二十六期“创享荟”活动,围绕创新药的现状未来及资本市场支持行业高质量发展举办专题座谈交流
2025-08-08 19:27:00
一杯“秋奶”喝出节气新经济:益禾堂立秋单日总GMV破6700万!
当二十四节气与新茶饮浪漫邂逅,一杯奶茶如何成为秋日仪式感的代名词?8月7日立秋,益禾堂以“秋天宠你”为情感内核,成功引爆全民“秋天的第一杯奶茶”消费热潮
2025-08-08 19:34:00
2025跑步机选购榜单:减震技术如何守护你的膝盖舒适与运动健康?
跑步机的价值,最终由膝盖说了算!本榜聚焦长期使用下的膝盖舒适度与耐用性两大核心价值,评选真正懂呵护的跑步机。膝盖舒适度&
2025-08-08 19:34:00
2025最新进口纳豆激酶品牌排行榜!哪个牌子效果好又安全?科研实力+口碑双认证!
在当今健康意识不断提升的时代,纳豆激酶凭借其卓越的心血管保健功效,已成为众多家庭必备的营养补充品。面对市场上琳琅满目的产品选择
2025-08-08 19:34:00
中能拾贝深度赋能某上市发电企业,构建电力生产全链条数字化新范式
随着“双碳”目标的深入推进与数字技术的迅猛发展,能源电力行业正迎来绿色转型与智能升级的关键窗口期。中能拾贝深耕能源电力行业二十载
2025-08-08 19:34:00
2025采购与供应管理大会将于9月在厦门开幕
2025年9月14日—16日,全球供应链管理领域的目光将聚焦于福建省厦门市。在这座美丽的海滨城市,一场备受瞩目的国际盛会——“2025年采购与供应管理大会暨第六届中国供应链管理年会”即将拉开帷幕
2025-08-08 19:34:00
益禾堂“秋奶”狂潮席卷全国,立秋当日总GMV破6700万,创历史新高!
8月7日立秋,“秋天的第一杯奶茶”全民狂欢再度引爆!益禾堂以“益趣”为核心,主打“秋天宠爱”,推出轻乳茶新品,结合创意营销攻势
2025-08-08 19:34:00
在茶馆遇见茶的温度与品牌的厚度:解码小罐茶全新茶馆生态
在快节奏的城市生活中,逐渐兴起的“茶空间”逐渐成为人们逃离压力、精神栖息、社交娱乐的都市新场景。这种生活消费方式的转变
2025-08-08 19:34:00
北京最有人气的购物中心,要被卖了
近日,有市场知情人士透露,英格卡购物中心正计划打包出售国内的10座荟聚购物中心。首批将出售位于无锡、北京、武汉的三座荟聚购物中心
2025-08-08 09:16:00
李现也来参与的“观鸟”,在全球拥有千亿级市场|产品观察
作者 | 张子怡编辑 | 彭孝秋今年春天,明星李现带火一个小众赛道。他分享的观鸟vlog被生态环境部公开表扬,此后一连数日的热搜都跟“观鸟”
2025-08-08 11:22:00
商品多退少补太繁琐?小鹅通称重分拣功能上线,高效管理每一克!
小鹅发现,不少社区团购商家在用小鹅通卖生鲜时,采用的是先销后采的方式,缺少"称重分拣"的环节,销转过程低效还易出错。现在
2025-08-08 12:22:00
外卖大战背后,最直观的受益者当属消费者。数据显示,90后日均打开外卖App的频次已达3.2次,25-45岁人群贡献了82%的订单
2025-08-08 10:39:00
随着美团、饿了么、京东的官宣,这场外卖大战似乎会暂告一段落。其间出现各种意想不到的现象,也引起各方对外卖行业发展的反思
2025-08-08 10:39:00
外卖内卷,算得上今年的一个现象级话题。2月11日京东宣布入局外卖,一池春水即被搅动。美团升级“闪购”,饿了么联合淘宝闪购
2025-08-08 10:39:00