人工智能,人工,智能,任务,基准,开发头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

刚刚，谷歌宣布35岁Keras之父Francois Chol

...让很多人略微震惊。「今天，我们宣布 Keras 的创始人、人工智能领域的领军人物 Francois Chollet 将离开 Google，开始他职业生涯的新篇章。虽然我们对他的离去感到悲伤，但我们为他的巨大贡献感到无比自豪，并很高兴看到他的下...……更多

2024-11-15 09:53:00人工智能,人工,智能,任务,基准,开发

田渊栋团队新作祭出Agent-as-a-Judge！AI智能

...题。已有的评估方法，要么只关注结果，要么要要过多的人工完成。为了解决这一问题，田渊栋、Jürgen Schmidhuber带领的团队提出了「Agent-as-a-Judge」框架。简言之，让智能体来评估智能体系统，让AI审AI。它不仅可以减少97%的成本...……更多

2024-10-28 09:52:00审判,新作,团队,成本,智能,评估

什么是AGI？人工智能的未来

【AGI】是推动人工智能发展的核心理念，一直以来，我们可能并未听说【AGI】的发展历程，或者是相关概念，好像是最近才突然“火”起来，为什么消失了多年的概念在当今又被提起？下面笔者会从AGI的原点，深入介绍一下AGI...……更多

2024-03-19 06:00:00人工智能,人工,智能,人工智能,智能,人工

谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将

12月7日消息，美国当地时间周三，谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊（Sundar Pichai）的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品...……更多

2023-12-07 17:28:00人工智能,人工,深度,模型,智能,时代

微软华人团队发布全新基准AGIEval，专为人类考试而生

...在有点小儿科了，有些任务的性能都甩了人类一截。通用人工智能（AGI）的一个重要特点是模型具有处理人类水平任务的泛化能力，而依赖于人工数据集的传统基准测试并不能准确表示人类的能力。最近，微软的研究人员发布了...……更多

2023-05-13 21:28:00微软,基准,专为,团队,人类,全新

谷歌推“双子座” 号称最强AI模型

...推“双子座” 号称最强AI模型安峥本报记者安峥在美国人工智能（AI）初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后，美国谷歌公司于当地时间12月6日推出一款全新人工智能模型“双子座（Gemini）”。“多感官”特点...……更多

2023-12-08 06:04:00双子座,双子,模型,双子座,双子,人工智能

全球AI安全评估测试有了新基准

...域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统，特别是大语言模型成为社会各方面不可或缺的一部分，以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记者崔爽第27届联合国科技大会期间...……更多

2024-04-25 04:00:00基准,评估,测试,安全,全球,人工智能

谷歌公司发布人工智能模型“双子座”

...谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座（Gemini）”。谷歌旗下人工智能公司“深层思维”的首席执行官兼联合创始人德米斯·哈萨比斯代表“双子座”研发团队介绍说，“双子座”是谷歌迄...……更多

2023-12-08 07:31:00人工智能,双子座,双子,人工,模型,智能

初探：高通推出的基于ARM的骁龙（Snapdragon）X

...于ARM的芯片将很快就会出现在个人电脑上，但它们承诺的人工智能性能，最终可能会看到人工智能在你的个人电脑上运行，而不是在云端上运行。厌倦了所谓的人工智能个人电脑吗？系好安全带，因为我们，或者人工智能，甚至...……更多

2024-04-29 10:57:00高通,芯片,人工智能,芯片,高通,英特

关于LLM-as-a-judge范式，终于有综述讲明白了

摘要：评估和评价长期以来一直是人工智能 (AI) 和自然语言处理 (NLP) 中的关键挑战。然而，传统方法，无论是基于匹配还是基于词嵌入，往往无法判断精妙的属性并提供令人满意的结果。大型语言模型 (LLM) 的最新进展启发了 ...……更多

2024-12-04 09:49:00范式,模型,基准,偏见,数据,评估

OpenAI o1 模型 PlanBench 规划能力实测：

...限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 个来自 Blocksworld 领域的任务，其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中，OpenAI 的 o1 模型准确率……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...PU（张量处理单元）系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本，谷歌承诺其速度明显快于v4 TPU。一年前，在人工智能开发机构OpenAI发布聊天机器人ChatGPT后，创...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

...用场景任务提供高效精准的感知和理解能力支持，向通用人工智能迈出坚实的一步。“书生（INTERN）”最初版本由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布，并持续联合...……更多

2023-03-15 13:30:00商汤,模态,书生,模型,任务,社区

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...或者联系报道。本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队，共同第一作者为上海交通大学博士生邱芃铖和吴超逸，共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授，这是该...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...授，44岁成为美国国家工程院院士，现任斯坦福以人为本人工智能研究院（HAI）院长。计算机视觉领域标杆成果ImageNet亦是由她一手推动。此前，李飞飞也曾短暂进入工业界，出任谷歌副总裁即谷歌云AI首席科学家。她一手推动了...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...zhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com具身智能是实现通用人工智能的必经之路，其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。近年来，多模态大模型和机器人技术得到了长足发展，具身智能成为全球科技和...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

安全强化学习方法、理论与应用综述，慕工大、同济等深度解析

...授、慕尼黑工业大学 Florian Walter 和 Alois Knoll 教授。随着人工智能（AI）的飞速发展，强化学习（Reinforcement Learning，RL）在诸多复杂决策任务中取得了显著的成功。我们在自动驾驶、机器人控制和推荐系统等实际应用中，越来越...……更多

2024-10-09 09:51:00同济,学习方法,深度,理论,方法,应用

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

封面新闻记者马晓玉边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的，而2023年底，谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间，谷歌发布了外界期待许久的大语言模型Gemini，在发布会现场，谷歌将Gemini的...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力，又可以...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

2023 AI现状报告：GPT-4仍最强，监管方向缺乏全球共

·随着尖端人工智能系统变得更加强大和灵活，比较它们的能力越来越困难。由于基准变得不那么明确，用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内...……更多

2023-10-12 15:21:00共识,监管,现状,方向,报告,全球

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

...至少在某些条件下，o3模型可以接近实现AGI。AGI是“通用人工智能”(artificial general intelligence)的缩写，泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义：“在最具经济价值的工作上胜过人类的高度自主...……更多

2024-12-21 17:02:00下一代,推理,模型,直播,模型,推理

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

....4%。这一测试由全球众多领域专家共同开发，目的是评估人工智能在广泛学科领域的表现，被视为衡量人工智能学术能力的前沿基准。该测试包含超过3000道多项选择题和简答题，涵盖从语言学到火箭科学、从古典学到生态学等10...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o

...提取信息——这使其成为数据分析和数据科学任务的理想人工智能模型。- 流程自动化Claude 3.5 Sonnet能够实现重复性任务或流程的自动化。它具备业界领先的指令执行能力，能够处理复杂的流程和操作。全新Claude 3.5 Haiku，智能超...……更多

2024-10-23 09:55:00人类,编程,模型,能力,开发,任务

Google推出全新人工智能模型Gemini 2.0 用途更

Google的下一个主要人工智能模型已经到来，以对抗来自 OpenAI 的新产品的夹击。本周三，Google 发布了 Gemini 2.0 Flash，该公司称其除文本外，还能原生生成图像和音频。 2.0 Flash 还可以调用第三方应用程序和服务，使其能够接入 Goo...……更多

2024-12-12 09:54:00人工智能,人工,模型,用途,全新,智能

20亿参数！谷歌发布轻量级开源人工智能模型Gemma

...开源大型语言模型Gemma，这标志着自从OpenAI的ChatGPT引领了人工智能聊天机器人热潮以来，在2022年取得了重要突破。Gemma是由谷歌DeepMind和其它团队共同开发的，旨在为开发人员和研究者提供一个“轻量级、最先进的开源模型系列...……更多

2024-02-22 20:42:00轻量,轻量级,人工智能,人工,模型,参数

李飞飞最新报告：美去年AI领域私人投资是中国近9倍，中国仍是

...在几个小时前，由李飞飞联合领导的斯坦福大学以人为本人工智能研究所（Stanford HAI），发布了长达500页的《2024 年人工智能指数报告》（Artificial Intelligence Index Report 2024）。这份报告是Stanford HAI发布的第七份AI Inde……更多

2024-04-17 10:00:00中国,对手,私人,领域,竞争,报告