• 我的订阅
  • 头条热搜
港中文团队提出大模型元推理范式,革新大模型的评价体系
曾忠燊,是一名潮汕人。其本科和硕士分别毕业于美国伊利诺伊大学和美国佐治亚理工学院。在本科毕业和硕士毕业之后,他曾先后在 IBM-Research 和深圳 IDEA 研究院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研...……更多
清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式
【新智元导读】近日,清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖(Outstanding Paper Award)……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频,终于上线了!全程22分钟,o1研发团队在项目Bob McGrew组织下,一起分享了「啊哈」时刻。有的人提到,...……更多
本周(4.8-4.14)AI界发生了什么?
...时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
李开复辟谣「掉队」传闻,零一万物推「白菜价」顶级模型
AI「六小虎」分野,零一万物的牌面大模型发展到现在,我们应该关注什么?像 OpenAI o1 这样的技术新范式是其一;像 canvas、NotebookLM 这样的产品新思路也是;还包括用户、客户营收这样的商业化指标。目标多元,但资源有限。...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...训练与推理、生成式AI与应用的基础设施激发“智能基建革新”,加速大模型和生成式AI落地《白皮书》以商汤基于AI大装置的多场景实践案例为例,阐述了从大型模型训练到生成式AI应用的全过程,再到区域智算中心的建设与运营,深...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...天贶(来源:该团队)研究团队通过建立光子传播对称性模型,未采用传统的电训练反向传播范式,化“反”为“前”。这种新范式挣脱了前向-反向光场传播严格对齐的束缚,基于通用的光计算原位训练系统,突破了电训练架...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...其坚定信心及历史使命。 以下为访谈实录:建立 “世界模型”触发机器人 “灵性”问:被誉为 “AI 教母” 的李飞飞教授首次创业即选择了 “空间智能” 方向,引发了对这一领域的广泛关注。可以谈谈您对空间智能和具身智...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...量化模型和端侧大模型推向新高度之余,端侧设备的交互革新也有了前进方向。不止AI硬件,大模型驱动下的具身智能更是热度空前,人形机器人正开启星辰大海。作为支撑大模型运行以及生成式AI应用开发的关键,AI Infra走到了...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
...项新技术,也将带来财富资管领域业务形态和逻辑范式的革新。 ……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
2024年过半,大模型、AIGC这场考试,你交卷了吗?成绩如何?大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂,但企业用户关心的依旧是产品、应用与自身业务的匹配度;大模型是否能够真正解决...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「...……更多
Microsoft Start Networks中国内容生态伙伴峰会成功举办
...态正在加速重构。作为全球内容产业的重要参与者和体验革新者,微软在技术迭代下致力于构建强大的内容生态体系—— MSN ,赋能高质量内容的跨区域流动与创新。通过此次盛会,微软旨在联结更多用户及产业合作伙伴,深入...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...费用降到0.2元。这有助于玩具制作、3D打印等行业的技术革新。 腾讯地图基于腾讯混元3D大模型,发布了自定义3D导航车标功能。用户上传一张图,就能生成个性化的3D导航车标,比传统3D车标重建方案提速91%。后续,混元3D模型...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...出现。想来想去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。(英伟达科学家Jim Fan、图灵奖得主Yann LeCun等参与讨论OpenAI的Q*实现方式) (Meta科学家田渊栋则认为Q*是Q-learning和A*的结合,且天然地适合推理任务,尤其在...……更多
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者
...者之一。《AI 重写排序算法,速度快 70%:DeepMind AlphaDev 革新计算基础,每天调用万亿次的库更新了》2024 年 7 月,谷歌 DeepMind 团队研发的 AlphaProof 和 AlphaGeometry 2 在 IMO 竞赛上共同实现了里程碑式的突破。AlphaP……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...和顶尖的技术人才,成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向,致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用,引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多
更多关于科技的资讯:
深创投独投,多维高精度电机研发商「国奥科技」完成数千万元A轮融资 | 36氪首发
文 | 张冰冰编辑 | 阿至36氪获悉,国奥科技(深圳)有限公司(以下简称「国奥科技」)近日宣布完成数千万元A轮融资,本轮融资由深创投投资
2025-06-08 06:49:00
□南京日报/紫金山新闻记者 张安琪一笔五年五亿元资金的科研投入终于开花结果——数日前,由南京世和基因生物技术股份有限公司主导的“金陵队列”超万例多癌早筛研究成果发表于国际顶级期刊《自然医学》
2025-06-08 07:42:00
主播走进保税仓 “618大促”跨境电商进口增长强劲
一年一度的“618”电商大促正在进行。今年,跨境电商直播走进了各地保税仓,成为拉动消费的新增长点。走进义乌综合保税区进口商品仓库
2025-06-07 20:23:00
政策市场双轮驱动,十堰消费市场活力迸发
十堰广电讯(全媒体记者 陈伟 通讯员 郭华) 消费,一头连着经济发展的宏观大局,一头连着千家万户的幸福生活。今年以来,十堰持续激发消费活力
2025-06-07 20:20:00
95后清华博士,辍学,造出逆天机器人
3.99万,这是一款N2人形机器人的价格。这个价格,可以称之为“相当划算”,因为N2是全球第一个实现多场景连续空翻的机器人
2025-06-07 16:04:00
锂电池出口检验启动“快进模式” 厦门海关试点“出口锂电包装智慧监管”
厦门海关关员监管一批即将出口的锂电池。(童婕 摄)厦门网讯(厦门日报记者 吴晓菁 通讯员 陈志旭)昨日,厦门时代新能源科技有限公司(以下简称“厦门时代公司”)通过“出口锂电包装智慧监管”系统
2025-06-07 08:22:00
浙江日报讯 (记者 姜晓蓉 通讯员 柯溢能 查蒙) “学校AI模拟面试总结和分析能力非常强,其中追问模式特别有用,让我提前适应面试节奏
2025-06-07 09:08:00
干货多,收获丰!“艺术为广告赋能”南京研讨会圆满落幕
夏日葳蕤精英汇,艺术赋能起风云。6月4日,由南京市广告协会主办、大贺艺术空间承办的“艺术为广告赋能”南京研讨会圆满落幕
2025-06-07 09:33:00
编者按:2025年,东营市以“提振消费”为核心引擎,打出一套政策组合拳,通过惠民让利、场景创新、环境优化等多维举措,激发市场活力
2025-06-07 09:47:00
长春光谷·光博盛会|长光卫星:逐光苍穹 星耀光博
随着2025长春国际光电博览会•light国际会议(以下简称“2025长春光博会”)日益临近,聚焦吉林这片“中国光学摇篮”的创新沃土
2025-06-07 09:37:00
栖霞板块:创新生态聚势,一路与“智”同行
扫一扫,了解更多内容。□南京日报/紫金山新闻记者朱旖旎南京经开区,空气中弥漫着奋斗的气息。在兴智科技园C栋云蝠智能的办公区
2025-06-07 08:00:00
在“歌声唱给党 跟着总书记的足迹看贵州”网络主题宣传中,财经博主徐梦婧(@财经麦麦吉)聊起了贵州“村超”“村BA”的流量转化话题
2025-06-07 05:34:00
以“数”为脉重塑产业生态网|做强做优贵州数字经济(1)
在占据贵阳大数据交易所一面面墙的LED屏幕上,一串串数字滚动更新。在“银发经济”数据交易板块的首次亮灯,让这所中国首家数据交易枢纽再次成为行业焦点——贵州益智慧科技开发有限公司(
2025-06-07 00:53:00
数据“想象力”变产业新动力|做强做优贵州数字经济(2)
作为一家去年12月中旬才在毕节注册成立的新公司——贵州灵动大数据有限公司一季度数据交易额达到103.9万元,实现了毕节市数据产品在贵阳大数据交易所全流程场内交易零的突破
2025-06-07 00:53:00
3砺生辉&618大促丨开启甄选礼遇
烟台中泽华羿铂尔曼酒店2022.6.6-2025.6.6三载春华秋实烟台中泽华羿铂尔曼酒店迎来了三岁生辰岁月匆匆 宛如白驹过隙一千零九十五个日夜更迭见证了我们从青涩到坚韧的蜕变我
2025-06-07 03:03:00