模型,基准,攻击,影响,安全,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...即理解人们思维的能力，是开发具有类人社会智能的 AI 模型的重要基础。近日，来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准，发现现有的多模态模型和 LLM 都表现存在系统性缺陷，同时他们提出...……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

谷歌DeepMind推Imagen2；ChatGPT Plu

...览本周AI领域涌现多项重要进展。Runway宣布开展通用世界模型研发，旨在通过研究通用世界模型改进其视频生成系统，使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2，一款高质量、逼真的人工智能图像生成器。Mistral AI...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

精准狙击Llama 3.1？Mistral AI开源Larg

...所未有的速度加速，继 Meta 昨天推出其新的开源 Llama 3.1 模型之后，法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚，Mistral AI 宣布其旗舰开源模型的下一代产品：Mistral Large 2，该模型拥有 1230 亿个参数，在代码生成、数学、推理...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

非Transformer架构站起来了!首个纯无注意力大模型,

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

中国信通院启动“CAICT人工智能伙伴计划”

...中国信通院与北京智源研究院、天津大学等联合发布了大模型评测体系3.0，暨“方升”大模型基准测试体系。据介绍，测试指标重点强化行业和场景导向的能力考查，提出了自适应动态测试方法，测试数据超过百万条，并首次推...……更多

2023-12-26 17:41:00信通,人工智能,中国,人工,伙伴,智能

OpenAI首席战略官：AGI可能比预期更早到来

...今年 5 月，OpenAI 再次震惊世界，发布了生成式人工智能模型 GPT-4o，能够实时与人类互动，甚至能够检测情绪，让人想起科幻电影。人们对人工智能可能主宰人类时代的担忧愈演愈烈。OpenAI 首席战略官 (CSO) Jason Kwon 负责监督未来...……更多

2024-08-13 17:30:00能比,首席,战略,人工智能,人工,智能

开放模型权重被指将导致AI失控，Meta遭举牌抗议

AI 尤其是大模型时代的开源与闭源，有利有弊，重要的是如何在使用的过程中做好文章。一直以来，人们在 AI 领域的开源与闭源选择上存在着分歧，而在大模型时代，开源这股强大的力量已经悄然崛起。根据此前谷歌泄露的一...……更多

2023-10-08 18:12:00权重,模型,开放,模型,权重,安全

检索总结能力超博士后，首个大模型科研智能体PaperQA2开

...最近一段时间，有关 AI 科学家的研究越来越多。大语言模型（LLM）有望帮助科学家检索、综合和总结文献，提升人们的工作效率，但在研究工作中使用仍然有很多限制。对于科研来说，事实性至关重要，而大模型会产生幻觉，...……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o

...，进化后的Claude 3.5 Sonnet一举击溃OpenAI o1，堪称最强推理模型。它在各个方面得到了全面显著的提升，尤其是业界领先的编码能力。而Claude 3.5 Haiku与上一代最强Claude 3 Opus性能相当，成本、速度与上一代Haiku相近。甚至，Claude现在...……更多

2024-10-23 09:55:00人类,编程,模型,能力,开发,任务

Databricks推出目前最强开源 AI

3月31日消息，Databricks近日在推出了一款通用大语言模型DBRX，号称是“目前最强开源AI”，据称在各种基准测试中都超越了“市面上所有的开源模型”。从官方新闻稿中得知，DBRX是一个基于Transformer的大语言模型，采用MoE（Mixture...……更多

2024-04-01 12:06:00模型,基准,测试,语言,英伟,训练

图灵巨头再次决裂！Hinton支持的加州AI限制法案初步通过

...够实施足够安全保障。就在本周，加州的《前沿人工智能模型安全创新法案》——SB 1047，再次朝着正式成为法律，迈出了重要一步。简单来说，SB 1047将会通过追究开发者的责任，来防止AI系统造成大规模人员伤亡，或引发损失...……更多

2024-08-19 09:37:00加州,图灵,法案,巨头,限制,再次

北京网络安全大会开幕聚焦AI驱动安全

...量增长1000%。另一项对IT行业领导者进行的关于ChatGPT等大模型的调查显示，安全性是受访者最关心的问题，71％的受访者认为生成式人工智能会给企业数据安全带来新的风险。面对人工智能时代新的网络安全态势，与会嘉宾们呼...……更多

2024-06-06 17:23:00安全,北京,大会,驱动,网络,安全

挑战Scaling Law，Meta发布移动端350M小模型

【新智元导读】Scaling Law还没走到尽头，「小模型」逐渐成为科技巨头们的追赶趋势。Meta最近发布的MobileLLM系列，规模甚至降低到了1B以下，两个版本分别只有125M和350M参数，但却实现了比更大规模模型更优的性能。从5月和6月...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

用过GPT-4 Turbo以后，我们再也回不去了

...，OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型，和基于它的一系列应用，一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo，新的大模型更聪明，文本处理上限更高，价格也...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。OpenAI o1团队采访的完整版视频，终于上线了！全程22分钟，o1研发团队在项目Bob McGrew组织下，一起分享了「啊哈」时刻。有的人提到，...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

超级推理模型正面对垒：谷歌版o1发布次日，OpenAI o1

...源：硬AI圣诞节前，人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒，谷歌刚发布自家的先进推理模型挑战OpenAI的o1，第二天，OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五，在为期12个工作...……更多

2024-12-21 09:15:00下一代,推理,正面,模型,模型,测试

微软发布旗下最小语言模型phi-2

...会已拉开帷幕，微软在本次活动中发布了旗下最小的语言模型Phi-2，共有27亿参数，相比较此前版本有明显提升。注：微软于今年6月发布Phi-1，只有13亿代码，适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据...……更多

2023-11-17 14:00:00微软,旗下,模型,语言,模型,微软

你的AI大模型可能正在“裸奔” 这三重风险必须警惕！

堵漏洞，助力AI发展安全驶入快车道以大模型为核心的人工智能技术是创新范式变革与产业升级的关键引擎，越来越多的机关、企事业单位开始推进大模型私有化部署，广泛应用于企业办公、科技研发、公共服务等领域。然而...……更多

2025-03-27 07:06:00模型,风险,正在,安全,模型,数据

生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营

...、平台运营、企业提效和游戏智能体等方面,以及生成式AI模型Claude3在视觉能力、安全性、代码辅助等方面的优势。演讲重点介绍了亚马逊云科技如何通过Claude3等生成式AI模型,为游戏公司沐瞳科技提供高效的游戏运营解决方案,实...……更多

2024-04-16 18:17:00亚马,亚马逊,科技,生成,运营,体验

openai推出mle-bench新基准

...估AI在特定任务中的能力。OpenAI在MLE-bench上测试了多个AI模型和智能体框架，使用AIDE框架的o1-preview模型表现最佳，在16.9%的比赛中至少获得了一枚铜牌，该结果超越了Anthropic的Claude3.5Sonnet。获得5金即可评上"Grandmaster"特级……更多

2024-10-12 20:06:00基准,机器,任务,学习,基准,自然语言