• 我的订阅
  • 头条热搜
港中文团队提出大模型元推理范式,革新大模型的评价体系
曾忠燊,是一名潮汕人。其本科和硕士分别毕业于美国伊利诺伊大学和美国佐治亚理工学院。在本科毕业和硕士毕业之后,他曾先后在 IBM-Research 和深圳 IDEA 研究院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研...……更多
清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式
【新智元导读】近日,清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖(Outstanding Paper Award)……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频,终于上线了!全程22分钟,o1研发团队在项目Bob McGrew组织下,一起分享了「啊哈」时刻。有的人提到,...……更多
本周(4.8-4.14)AI界发生了什么?
...时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
李开复辟谣「掉队」传闻,零一万物推「白菜价」顶级模型
AI「六小虎」分野,零一万物的牌面大模型发展到现在,我们应该关注什么?像 OpenAI o1 这样的技术新范式是其一;像 canvas、NotebookLM 这样的产品新思路也是;还包括用户、客户营收这样的商业化指标。目标多元,但资源有限。...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...天贶(来源:该团队)研究团队通过建立光子传播对称性模型,未采用传统的电训练反向传播范式,化“反”为“前”。这种新范式挣脱了前向-反向光场传播严格对齐的束缚,基于通用的光计算原位训练系统,突破了电训练架...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...训练与推理、生成式AI与应用的基础设施激发“智能基建革新”,加速大模型和生成式AI落地《白皮书》以商汤基于AI大装置的多场景实践案例为例,阐述了从大型模型训练到生成式AI应用的全过程,再到区域智算中心的建设与运营,深...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...其坚定信心及历史使命。 以下为访谈实录:建立 “世界模型”触发机器人 “灵性”问:被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向,引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
2024年过半,大模型、AIGC这场考试,你交卷了吗?成绩如何?大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂,但企业用户关心的依旧是产品、应用与自身业务的匹配度;大模型是否能够真正解决...……更多
...项新技术,也将带来财富资管领域业务形态和逻辑范式的革新。 ……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
Microsoft Start Networks中国内容生态伙伴峰会成功举办
...态正在加速重构。作为全球内容产业的重要参与者和体验革新者,微软在技术迭代下致力于构建强大的内容生态体系—— MSN ,赋能高质量内容的跨区域流动与创新。通过此次盛会,微软旨在联结更多用户及产业合作伙伴,深入...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...费用降到0.2元。这有助于玩具制作、3D打印等行业的技术革新。 腾讯地图基于腾讯混元3D大模型,发布了自定义3D导航车标功能。用户上传一张图,就能生成个性化的3D导航车标,比传统3D车标重建方案提速91%。后续,混元3D模型...……更多
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者
...者之一。《AI 重写排序算法,速度快 70%:DeepMind AlphaDev 革新计算基础,每天调用万亿次的库更新了》2024 年 7 月,谷歌 DeepMind 团队研发的 AlphaProof 和 AlphaGeometry 2 在 IMO 竞赛上共同实现了里程碑式的突破。AlphaP……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。(英伟达科学家Jim Fan、图灵奖得主Yann LeCun等参与讨论OpenAI的Q*实现方式) (Meta科学家田渊栋则认为Q*是Q-learning和A*的结合,且天然地适合推理任务,尤其在...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...和顶尖的技术人才,成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向,致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...增强的专业智能体” 相关工作,并带来了知识图谱与大模型结合最新研发成果 —— 知识增强大模型服务框架 KAG。梁磊介绍,专业领域增强大模型服务框架 KAG 通过图谱逻辑符号引导决策和检索,显著提升了垂直领域决策的精准...……更多
...解问题。这一方法最早应用于计算机视觉领域的图片生成模型。朱毅鑫说,当时计算机视觉领域有一类难题叫作“什么是纹理”。比如,两张有着明显差别的纹理图片,如果用计算机视觉进行逐个像素的比对,就会认为是不一样...……更多
大模型价格战“卷”向何方?|深度
...应用,或许才是国内大模型生态可持续发展之道。▍算法革新与模型优化才是价格战背后真正推手让人始料不及的是,国内率先掀起大模型价格战的是一家“不务正业”的量化私募巨头——幻方。这些年国内金融量化交易异军突...……更多
更多关于科技的资讯:
环比增10000%+!微信“蓝包”赠书成风潮
随着蛇年春节假期画上句号,此前备受关注的微信“蓝包”即“送礼物”功能也交出了最新成绩单。从品类看, 休闲零食、糖果/巧克力等客单价低但节日氛围浓厚的商品类目订单量旺盛
2025-02-08 23:46:00
儿子砸车窗取AED救下心梗父亲 车主:不需要对方赔偿
2月8日消息,据媒体报道,近日,叶先生发现自己车的车窗被砸,车内的AED不见了,对方给叶先生发了信息,称自己父亲心梗,急需AED急救
2025-02-08 23:46:00
52天婴儿喝奶奶喂的蜂蜜水中毒进ICU 医生:蜂蜜不适合婴儿
2月9日消息,据媒体报道,一名仅52天的宝宝出现严重腹胀,然后又出现呼吸困难、瞳孔对光反射消失,情况危急。经过医生诊断
2025-02-09 00:46:00
实干争春看贵州|贵安新区芯片企业提升工艺迎接新订单
2月8日19时40分,在位于贵安综合保税区围网内的贵州安芯电子有限公司生产车间里,技术工人杨成还在数控设备前忙碌着。与安芯电子一同成长的他
2025-02-09 01:14:00
大V 29.9万买小米SU7开快1年28.8万卖掉直呼奇迹:网友吵翻电车有毛保值率
快科技2月9日消息,电动汽车是不是保值,这引起了网友的热议。近日,有汽车大V分享消息称,“自己29.9万买的SU7 Max开了快1年
2025-02-09 06:46:00
全球最薄折叠旗舰!OPPO Find N5正式接入DeepSeek-R1:系统直接调用
快科技2月9日消息,OPPO Find N5将在本月正式发布,该机将刷新折叠屏厚度极限,折叠态厚度不到9.2mm,成为全球最薄折叠屏手机
2025-02-09 07:16:00
会员到期男子用自制天线免费看20多个台引围观:别付费当冤大头了
快科技2月9日消息,近日有网友分享了自己的经验,用自制天线看20多个台。近日山东济南一名男子自制“天线”,用铜线插在电视上
2025-02-09 06:46:00
女生光腿穿校服!日本学校寒潮天仍禁止学生穿裤袜引抗议:取消黑校规
2月9日消息,据国外媒体报道称,近日日本遭遇了今冬以来最强寒潮,多地降雪达到了灾害级别。然而,在这种极端天气下,许多学校仍然要求学生按照规定穿着校服
2025-02-09 07:16:00
打破好莱坞垄断!《哪吒2》进全球票房榜前50、全球动画片票房榜前10
快科技2月9日消息,据灯塔专业版数据,截止今天6:10,电影《哪吒之魔童闹海》累计票房(含预售)破75.35亿,进入全球影史票房榜第48名
2025-02-09 06:46:00
华为手表上热搜 WATCH D2属医疗器械能用医保付款
快科技2月9日消息,今日,词条#华为手表属于医疗器械可以医保付款#登上微博热搜第二,引起网友热议。据媒体报道,日前,上海
2025-02-09 07:16:00
Mac比Windows PC更安全吗 未必
一直以来,相比Windows平台的PC用户,苹果macOS似乎有一种先天的“安全优势”,很多用户认为Mac比Windows更安全可靠
2025-02-08 22:46:00
“胖一点”好!攒点肉真的能扛病
快科技2月8日消息,微博话题“攒点肉真的能扛病”引发关注。医生就这一话题作出解释,生病时,尤其是禁食期间,体内的脂肪组织可分解代谢产生能量
2025-02-08 22:46:00
雷军驾驶小米YU7参与冬测:表现不错 测试任务圆满完成
快科技2月8日消息,今日晚间,小米创办人雷军发文表示,他驾驶小米YU7参与了冬季高速长途的测试,主要测智能驾驶和续航等项目
2025-02-08 22:46:00
英特尔AMD高通芯片科普:一文带你认清三大厂商笔记本处理器
在今年的CES 2025上,英特尔、AMD以及高通都发布了全新的处理器,持续布局自家的产品线。目前各家在移动端处理器这款都提供了非常丰富的型号尤其是英特尔和AMD
2025-02-08 23:16:00
2024平板电脑市场变天了:小米大增73%
市场调研机构Canalys公布了2024年全球平板电脑市场统计数据。最新数据显示,2024年第四季度全球平板电脑出货量达到3990万台
2025-02-08 17:15:00