• 我的订阅
  • 头条热搜
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...览本周AI领域涌现多项重要进展。Runway宣布开展通用世界模型研发,旨在通过研究通用世界模型改进其视频生成系统,使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2,一款高质量、逼真的人工智能图像生成器。Mistral AI...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
...中国信通院与北京智源研究院、天津大学等联合发布了大模型评测体系3.0,暨“方升”大模型基准测试体系。据介绍,测试指标重点强化行业和场景导向的能力考查,提出了自适应动态测试方法,测试数据超过百万条,并首次推...……更多
OpenAI首席战略官:AGI可能比预期更早到来
...今年 5 月,OpenAI 再次震惊世界,发布了生成式人工智能模型 GPT-4o,能够实时与人类互动,甚至能够检测情绪,让人想起科幻电影。人们对人工智能可能主宰人类时代的担忧愈演愈烈。OpenAI 首席战略官 (CSO) Jason Kwon 负责监督未来...……更多
开放模型权重被指将导致AI失控,Meta遭举牌抗议
AI 尤其是大模型时代的开源与闭源,有利有弊,重要的是如何在使用的过程中做好文章。一直以来,人们在 AI 领域的开源与闭源选择上存在着分歧,而在大模型时代,开源这股强大的力量已经悄然崛起。根据此前谷歌泄露的一...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...最近一段时间,有关 AI 科学家的研究越来越多。大语言模型(LLM)有望帮助科学家检索、综合和总结文献,提升人们的工作效率,但在研究工作中使用仍然有很多限制。对于科研来说,事实性至关重要,而大模型会产生幻觉,...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升,尤其是业界领先的编码能力。而Claude 3.5 Haiku与上一代最强Claude 3 Opus性能相当,成本、速度与上一代Haiku相近。甚至,Claude现在...……更多
Databricks推出目前最强开源 AI
3月31日消息,Databricks近日在推出了一款通用大语言模型DBRX,号称是“目前最强开源AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。从官方新闻稿中得知,DBRX是一个基于Transformer的大语言模型,采用MoE(Mixture...……更多
图灵巨头再次决裂!Hinton支持的加州AI限制法案初步通过,LeCun李飞飞吴恩达喊打
...够实施足够安全保障。就在本周,加州的《前沿人工智能模型安全创新法案》——SB 1047,再次朝着正式成为法律,迈出了重要一步。简单来说,SB 1047将会通过追究开发者的责任,来防止AI系统造成大规模人员伤亡,或引发损失...……更多
北京网络安全大会开幕 聚焦AI驱动安全
...量增长1000%。另一项对IT行业领导者进行的关于ChatGPT等大模型的调查显示,安全性是受访者最关心的问题,71%的受访者认为生成式人工智能会给企业数据安全带来新的风险。 面对人工智能时代新的网络安全态势,与会嘉宾们呼...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
【新智元导读】Scaling Law还没走到尽头,「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列,规模甚至降低到了1B以下,两个版本分别只有125M和350M参数,但却实现了比更大规模模型更优的性能。从5月和6月...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...,OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型,和基于它的一系列应用,一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo,新的大模型更聪明,文本处理上限更高,价格也...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频,终于上线了!全程22分钟,o1研发团队在项目Bob McGrew组织下,一起分享了「啊哈」时刻。有的人提到,...……更多
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
...源:硬AI圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1,第二天,OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五,在为期12个工作...……更多
微软发布旗下最小语言模型phi-2
...会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据...……更多
堵漏洞,助力AI发展安全驶入快车道 以大模型为核心的人工智能技术是创新范式变革与产业升级的关键引擎,越来越多的机关、企事业单位开始推进大模型私有化部署,广泛应用于企业办公、科技研发、公共服务等领域。然而...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...、平台运营、企业提效和游戏智能体等方面,以及生成式AI模型Claude3在视觉能力、安全性、代码辅助等方面的优势。演讲重点介绍了亚马逊云科技如何通过Claude3等生成式AI模型,为游戏公司沐瞳科技提供高效的游戏运营解决方案,实...……更多
openai推出mle-bench新基准
...估AI在特定任务中的能力。OpenAI在MLE-bench上测试了多个AI模型和智能体框架,使用AIDE框架的o1-preview模型表现最佳,在16.9%的比赛中至少获得了一枚铜牌,该结果超越了Anthropic的Claude3.5Sonnet。获得5金即可评上"Grandmaster"特级……更多
很强也很贵!OpenAI12天12场直播收官,官宣最新推理模型o3
...网友猜测的一样,人工智能(AI)巨头OpenAI发布最新推理模型o3和o3-mini。前一天,OpenAI公司CEO山姆·奥特曼(Sam Altman)就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3?奥特曼表示是为了避免和英国电信运...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务中表现优异,但在具体任务中的效果却不尽如人意。为了提升模型在特定自然语言任务上的表现,现有的方法主要依赖于高质量的人工...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-mo...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
Sora爆火,2024年或成中国AI“应用之年”
...智能行业该如何“接招”等问题。其后,通用人工智能大模型在全球掀起了新一轮人工智能产业发展浪潮,我国人工智能大模型市场也呈现百模争鸣、日新月异的快速增长态势。进入2024年之后,文生视频大模型Sora又为人工智能...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...者,该项目负责开发用于 AI 编程的 StarCoder 系列大型语言模型。论文标题:Planning In Natural Language Improves LLM Search For Code Generation 论文地址:https://arxiv……更多
指数反弹了,为何半数指增产品年内跑输基准?
...现分化。在市场出现较大变化时,基金经理需要调整量化模型中的因子权重和组合管理参数,以追求可持续的超额收益。这种调整可能不会立即见效,导致短期内跑输基准指数。他进一步表示,指增跑输基准指数或许和基金规模...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...满。不知疲倦一天24小时在线水贴,内容多是OpenAI下一代模型爆料消息,时准时不准……自从OpenAI奥特曼和草莓哥配合互(炒)动(作)过之后,不管你愿意不愿意看,推荐算法都会确保ta出现在你的时间线上。昨天,草莓哥声...……更多
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...作开发了 ExploreToM 框架,旨在更有效地评估和训练大语言模型(LLM)的心智理论(Theory of Mind,ToM)能力。心智理论心智理论(Theory of Mind,ToM)是人类社会智能的基础之一,能让我们能够理解他人的想法、意图和信念。这种认...……更多
无视安全的公司,离掉队不远了
...已成为整个AI圈儿的“Job Zero”一个最显著的问题是,大模型把纯粹的程序逻辑变成了某种黑盒,这是一个自机器学习技术遗留下来的老问题,叫做AI的可解释性——即便是模型的构建和训练者,也无法完全确认,AI 的每一次结果...……更多
更多关于科技的资讯:
虎鲸文娱人才创作基地落户陵水,助力海归青年创作者“回家筑梦”
日前,第七届海南岛国际电影节“青椰计划”特别活动——虎鲸文娱集团旗下大麦娱乐“海纳圆桌对谈”在三亚举行。虎鲸文娱集团正式宣布
2025-12-08 13:54:00
平台默认勾选开启、强制关联支付软件、开通容易取消难……网络上,有关免密支付的“吐槽”层出不穷,反映出消费者对加强支付业务安全管理的迫切愿望
2025-12-08 12:30:00
新闻纵深·冀货出海新探索|平乡自行车童车:从“贴牌代工”到“骑向全球”
平乡自行车童车出口销量占国际市场的百分之四十从“贴牌代工”到“骑向全球”阅读提示平乡县,被誉为“中国童车之都”。在这里
2025-12-08 08:26:00
杭州市康复医院近日组织开展第34个国际残疾人日宣传教育活动。“杭州市智能仿生假肢适配服务基地”在本次活动上揭牌成立。未来将为肢体残疾人提供智能仿生假肢适配相关服务
2025-12-08 09:24:00
米连科技率先跑通新赛道,成实时视频情感社交重要实践者与引导者
当众多社交平台仍在探索可持续的商业模式时,米连科技通过将“视频社交+实时互动”作为产品核心,不仅成功开辟了新的市场空间
2025-12-08 09:24:00
国际人才嘉年华2025(秋季)盛大启幕丨科创动能全景绽放,多元机遇职引未来!
《2025年世界人才排名》显示,香港已跃居全球第四、亚洲首位,彰显了港府近期在人才引进与培育方面取得显著成效。港府推行的多项人才计划累计收到申请逾52万份
2025-12-08 10:24:00
“苏新消费·暖冬购物季”正式启动 苏宁易购这波精彩 很给“利”
12月5日,2025“苏新消费·暖冬购物季”正式启幕,本次购物季将持续至2026年3月。重点围绕十三地市“苏品苏货”,结合“双12”
2025-12-08 10:28:00
工行河北省分行:金融“活水”浇开智造之花 为科技自立自强蓄能加力
从7人团队起步,到现已成长为年营收超40亿元的全国电气百强企业,科林电气在智能电网领域成果斐然。工行河北省分行以源源不断的金融活水和与时俱进的智慧服务精准滴灌
2025-12-08 10:36:00
近期,民生银行张家口分行全面开展“金融护航·幸福养老”主题宣传活动,以专业服务赋能养老规划,以暖心举措守护金融安全。多维布局
2025-12-08 10:41:00
王涵不是戴上面具之后才能放飞自我,而是那个看似放飞的自我其实是面具的产物。对于社会交往而言,认为需要加入或取消某种媒介才能体验交往的快乐
2025-12-08 10:54:00
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00
刘沛雨摘要:本文主要从转型升级时期中小企业的管理创新方面展开分析,在市场发展变化迅速的局面下,通过应用一些管理创新手段和方法
2025-12-08 05:10:00
正值中国首个跨境电商综试区——杭州综试区设立十周年,也恰逢亚马逊全球开店(以下简称“亚马逊”)业务在中国开展运营十周年的重要里程碑
2025-12-08 07:21:00
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00