• 我的订阅
  • 头条热搜
刚刚,谷歌宣布35岁Keras之父Francois Chollet离职
...让很多人略微震惊。「今天,我们宣布 Keras 的创始人、人工智能领域的领军人物 Francois Chollet 将离开 Google,开始他职业生涯的新篇章。虽然我们对他的离去感到悲伤,但我们为他的巨大贡献感到无比自豪,并很高兴看到他的下...……更多
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
...题。已有的评估方法,要么只关注结果,要么要要过多的人工完成。为了解决这一问题,田渊栋、Jürgen Schmidhuber带领的团队提出了「Agent-as-a-Judge」框架。简言之,让智能体来评估智能体系统,让AI审AI。它不仅可以减少97%的成本...……更多
什么是AGI?人工智能的未来
【AGI】是推动人工智能发展的核心理念,一直以来,我们可能并未听说【AGI】的发展历程,或者是相关概念,好像是最近才突然“火”起来,为什么消失了多年的概念在当今又被提起?下面笔者会从AGI的原点,深入介绍一下AGI...……更多
12月7日消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并不能准确表示人类的能力。最近,微软的研究人员发布了...……更多
...推“双子座” 号称最强AI模型安峥本报记者 安峥在美国人工智能(AI)初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后,美国谷歌公司于当地时间12月6日推出一款全新人工智能模型“双子座(Gemini)”。“多感官”特点...……更多
全球AI安全评估测试有了新基准
...域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记者 崔 爽第27届联合国科技大会期间...……更多
...谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座(Gemini)”。谷歌旗下人工智能公司“深层思维”的首席执行官兼联合创始人德米斯·哈萨比斯代表“双子座”研发团队介绍说,“双子座”是谷歌迄...……更多
初探:高通推出的基于ARM的骁龙(Snapdragon)X Plus芯片
...于ARM的芯片将很快就会出现在个人电脑上,但它们承诺的人工智能性能,最终可能会看到人工智能在你的个人电脑上运行,而不是在云端上运行。厌倦了所谓的人工智能个人电脑吗?系好安全带,因为我们,或者人工智能,甚至...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
摘要:评估和评价长期以来一直是人工智能 (AI) 和自然语言处理 (NLP) 中的关键挑战。然而,传统方法,无论是基于匹配还是基于词嵌入,往往无法判断精妙的属性并提供令人满意的结果。大型语言模型 (LLM) 的最新进展启发了 ...……更多
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
...限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中,OpenAI 的 o1 模型准确率……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...PU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速度明显快于v4 TPU。一年前,在人工智能开发机构OpenAI发布聊天机器人ChatGPT后,创...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...用场景任务提供高效精准的感知和理解能力支持,向通用人工智能迈出坚实的一步。“书生(INTERN)”最初版本由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布,并持续联合...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...或者联系报道。本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队,共同第一作者为上海交通大学博士生邱芃铖和吴超逸,共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授,这是该...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...授,44岁成为美国国家工程院院士,现任斯坦福以人为本人工智能研究院(HAI)院长。计算机视觉领域标杆成果ImageNet亦是由她一手推动。此前,李飞飞也曾短暂进入工业界,出任谷歌副总裁即谷歌云AI首席科学家。她一手推动了...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com具身智能是实现通用人工智能的必经之路,其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...授、慕尼黑工业大学 Florian Walter 和 Alois Knoll 教授。随着人工智能(AI)的飞速发展,强化学习(Reinforcement Learning,RL)在诸多复杂决策任务中取得了显著的成功。我们在自动驾驶、机器人控制和推荐系统等实际应用中,越来越...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
封面新闻记者 马晓玉 边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的,而2023年底,谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
·随着尖端人工智能系统变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...至少在某些条件下,o3模型可以接近实现AGI。AGI是“通用人工智能”(artificial general intelligence)的缩写,泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义:“在最具经济价值的工作上胜过人类的高度自主...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
....4%。这一测试由全球众多领域专家共同开发,目的是评估人工智能在广泛学科领域的表现,被视为衡量人工智能学术能力的前沿基准。该测试包含超过3000道多项选择题和简答题,涵盖从语言学到火箭科学、从古典学到生态学等10...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...提取信息——这使其成为数据分析和数据科学任务的理想人工智能模型。- 流程自动化Claude 3.5 Sonnet能够实现重复性任务或流程的自动化。它具备业界领先的指令执行能力,能够处理复杂的流程和操作。全新Claude 3.5 Haiku,智能超...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
Google的下一个主要人工智能模型已经到来,以对抗来自 OpenAI 的新产品的夹击。本周三,Google 发布了 Gemini 2.0 Flash,该公司称其除文本外,还能原生生成图像和音频。 2.0 Flash 还可以调用第三方应用程序和服务,使其能够接入 Goo...……更多
20亿参数!谷歌发布轻量级开源人工智能模型Gemma
...开源大型语言模型Gemma,这标志着自从OpenAI的ChatGPT引领了人工智能聊天机器人热潮以来,在2022年取得了重要突破。Gemma是由谷歌DeepMind和其它团队共同开发的,旨在为开发人员和研究者提供一个“轻量级、最先进的开源模型系列...……更多
李飞飞最新报告:美去年AI领域私人投资是中国近9倍,中国仍是美最大竞争对手
...在几个小时前,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI),发布了长达500页的《2024 年人工智能指数报告》(Artificial Intelligence Index Report 2024)。这份报告是Stanford HAI发布的第七份AI Inde……更多
5分钟完成最强超算10^25年工作,谷歌量子芯片重大突破,马斯克祝贺
...够解决未来问题的算法。当被问及「为什么离开了新兴的人工智能领域,转而专注于量子计算」时,Hartmut Neven 表示,两者都将被证明是这个时代最具变革性的技术,但先进的人工智能将从量子计算的接入中显著受益。这就是 Qua...……更多
谷歌宣布推出Gemini,规模最大功能最强;AMD 正式发布MI300加速器;Altman当选《时代》年度CEO
... 6 日消息,谷歌宣布推出其认为规模最大、功能最强大的人工智能模型 Gemini。根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了「最先进的性能」,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。谷歌针对不同...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
... AI 之战十年前已经打响》Facebook、微软和百度如何加入了人工智能的人才争夺战:通过收购和投资人工智能初创公司,例如,谷歌收购了DeepMind、Facebook收购了Oculus VR,微软收购了Nuance,百度收购了Face++等;建立本地化的人工智...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Grok-2将于8月发布,在回应用户关于训练数据的提问时,他表示该模型将在这方面做出...……更多
更多关于科技的资讯:
离年薪百万最近的大学专业,被求职年轻人评为新“天坑”
原标题:离年薪百万最近的大学专业,正在沦为新“天坑”作者:睡着数据:睡着 乐乐如今,甭管是 ChatGPT 还是国产 Kimi
2025-02-11 23:33:00
行业首家!海信电视正式接入DeepSeek!支持R1、V3自由切换
快科技2月11日消息,海信电视今日正式宣布接入DeepSeek,成为全球首个接入DeepSeek的电视品牌,并支持R1和V3版本自由切换
2025-02-11 21:48:00
暴雪国服战网今日起调整登录方式:必须绑定网易游戏账号
快科技2月11日消息,暴雪游戏国服运营团队宣布,战网今起正式调整登录方式。用户需要将战网通行证与网易账号进行绑定,并使用该网易账号才能登录游戏
2025-02-11 22:18:00
明星智驾公司爆雷!纵目科技员工称多名高管卷款跑路
快科技2月11日消息,据报道,国内明星智驾公司纵目科技爆雷,总部停水停电,公司暂停运营,甚至还有多位高管卷款跑路。报道称
2025-02-11 22:49:00
意料之外!阿里将为中国iPhone开发AI功能
快科技2月11日消息,据最新报道,苹果和阿里巴巴将合作为中国iPhone用户开发AI功能。此前,在业界曾广泛流传着多种关于苹果合作伙伴的猜测
2025-02-11 22:49:00
2025消博会时装周将于4月13日启幕 目前已启动全球招募活动
南海网2月11日消息(记者 王子遥)记者从2025消博会时装周组委会获悉,2025消博会时装周将于今年4月13日启幕,目前全球招募活动已正式开启
2025-02-11 18:27:00
十大行动促消费!“2025欢乐元宵·购物嘉年华”活动启动
齐鲁晚报•齐鲁壹点 尚青龙百年老字号青岛啤酒带来只有酿酒师才能喝到的新鲜原浆,21天保质期的水晶纯生;李村脂渣、高家糖球
2025-02-11 22:15:00
3案例入选工信部数字应用场景典型案例河北新闻网讯(刘一格、王育民)近日,工业和信息化部公布2024年“数字三品”应用场景典型案例
2025-02-11 19:38:00
SOT能否以云算力服务商,突围算力挖矿赛道,引领加密数字潮流
[2025年2月5日,马来西亚吉隆坡]全球算力竞争白热化,SOT是否具备突围能力?这个问题是全球各界关注的焦点。2024年BTC第四次减半以来
2025-02-11 19:59:00
“Al背景下文艺创作研讨会”在宁举行
AI技术迅猛发展,给文艺创作带来了前所未有的变革和机遇。2月11日下午,由江苏省当代艺术创作研究会主办的“Al背景下文艺创作研讨会”在宁举行
2025-02-11 20:13:00
东南网2月11日报道(福建日报记者 徐士媛 通讯员 温连光)6日,新春伊始,龙岩市举行2025年全市民营企业家新春恳谈会暨“迎新春 开门红”招商项目集中签约活动
2025-02-11 20:17:00
RTX 4090工程卡首次公开:残暴四个16针接口 供电2400W!
快科技2月11日消息,chiphell论坛网友“maxreni”从神秘渠道搞到了一大批NVIDIA显卡的工程样卡,涵盖GTX 10
2025-02-11 20:18:00
比亚迪智驾下饺子 7万的车也有NOA 王传福:要像安全带一样标配
智驾一夜变天了。昨晚,比亚迪召开智能化战略发布会,介绍了自己关于智驾方面的规划,一句话总结就是——智驾无差别上车。价格不再是区分智驾的隔离带
2025-02-11 20:18:00
余承东之后 长城魏建军发声:智能驾驶不是一场秀 实践出真知!
快科技2月11消息,今日晚间,长城汽车董事长魏建军发微博称:“智能驾驶不是一场秀,实践出真知。”疑似回应近期友商全系普及智驾
2025-02-11 20:18:00
万亿宁王要在香港上市了!宁德时代向港交所递交招股书
快科技2月11日消息,据港交所文件,宁德时代正式向香港联交所递交发行境外上市外资股(H股)并在香港联交所主板挂牌上市的申请
2025-02-11 20:18:00