模型,基准,攻击,影响,安全,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...间和物理世界的交互来完成复杂任务。近年来，多模态大模型和机器人技术得到了长足发展，具身智能成为全球科技和产业竞争的新焦点。然而，目前缺少一篇能够全面解析具身智能发展现状的综述。因此，鹏城实验室多智能体...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

谷歌和微软两位“印度老乡”CEO，正面硬刚

12月6日夜间，谷歌发布了其最新一代的AI大模型Gemini。谷歌的印度籍CEO Sundar Pichai亲自为这项发布站台，在公开信中将Gemini描述为：“我们迄今为止最强大、最通用的模型，它在许多领先的基准测试中都展现出了最先进的性能。...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

苹果公司公布“mm1”多模态大模型

...dalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首次对...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

Llama 3.1 405B“最强模型”宝座还没捂热乎，就被砸场子了——Mistral AI发布最新模型Mistral Large 2，参数123B，用不到三分之一的参数量性能比肩Llama 3.1 405B，也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评：许多声称开源的AI模型，实际上在...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

NeurIPS 2024 | FaceChain团队新作，开

...直在进行深入研究。采用了新一代的 Transformer 人脸表征模型 TransFace 后，FaceChain 去年也是推出了 10s 直接推理的人物写真极速生成工作，FaceChain-FACT。继 TransFace 之后，FaceChain 团队最近被机器学习顶级国际会议 NeurI……更多

2024-10-18 09:46:00人脸,拓扑,新作,模型,团队,人脸

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

【新智元导读】小模型时代来了？OpenAI带着GPT-4o mini首次入局小模型战场，Mistral AI、HuggingFace本周接连发布了小模型。如今，苹果也发布了70亿参数小模型DCLM，性能碾压Mistral-7B。小模型的战场，打起来了！继GPT-4o mini、Mistral Ne……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

NeurIPS | 消除多对多问题，清华大规模细粒度视频片段

...算机系媒体所的二年级博士生，主要研究方向是多模态大模型与视频理解，在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文，曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术，特别是细粒度视...……更多

2024-10-29 09:55:00大规,粒度,范式,清华,片段,大规模

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-7...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

AI技术为安全治理提供“新工具箱”

...置等都更好更精准。”AI安全风险主要分三类2023年，AI大模型安全风险凸显。AI技术在带来强有力的新工具的同时，也带来数据隐私、技术滥用、失控等安全问题。“加强对AI这一新兴技术的潜在风险研判和防范，确保AI安全、可...……更多

2024-01-26 01:46:00工具箱,工具,安全,技术,安全,技术

ChatGPT接连宕机影响有多大

...户提问。几个小时后，OpenAI宣布问题已经解决。随着AI大模型技术的突飞猛进，如ChatGPT这样的产品已经作为工作和生活助手服务数以亿计的用户。在这一趋势下，ChatGPT及其他大模型产品在过去一年时间内多次发生故障，也让业...……更多

2024-06-20 09:16:00影响,故障,模型,服务,用户,安全

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群，——还...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

碾压所有对手？谷歌发布轻量化开源大模型，笔记本电脑就可跑

开源大模型赛道迎来重磅新品。当地时间2月21日，谷歌宣布正式推出全新的开源大语言模型（LLM）“Gemma”，旨在帮助开发人员和研究人员负责任地构建人工智能。据介绍，Gemma大模型与谷歌规模最大、能力最强的人工智能模型...……更多

2024-02-22 12:44:00模型,对手,笔记本,笔记,电脑,模型

openai发布多语言大规模多任务语言理解

...言大规模多任务语言理解（MMMLU）数据集。背景随着语言模型日益强大，评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集，通过提供强大的多语言和多任务数据集，来评估大型语言模型（LL...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...为什么不使用MoE架构？后训练与RLHF流程是如何进行的？模型评估是如何进行的？我们什么时候可以见到Llama 4？Meta是否会发展agent？恰逢Llama 3.1刚刚发布，Meta科学家就现身播客节目Latent Space，秉持着开源分享的精神，对以上问题...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

物理层安全技术为行业5G网络发展夯实安全基础

...趋势。物理层安全技术架构体系包括物理层安全传输技术模型和物理层身份认证技术模型。物理层安全传输技术的基本原理是利用主信道和窃听信道之间的差异设计发送信号，使合法用户可以正确接收解调，而窃听者难以恢复接...……更多

2024-01-11 06:44:00物理层,安全,物理,基础,发展,行业

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

实验证明，大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型（LLM）的出现，人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近，OpenAI 发布了 o1 ...……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

开源社区分水岭：Meta大模型Llama 3发布，参数最高或

为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，...……更多

2024-04-19 15:58:00分水,分水岭,模型,参数,社区,模型

田渊栋团队新作祭出Agent-as-a-Judge！AI智能

...改进的智能体系统铺平了道路。「法官」智能体，击败大模型现有评估方法，无法为智能体系统的中间任务解决阶段，提供足够的反馈。另一方面，通过人工进行更好的评估，代价太大。而智能体系统的思考方式，更像人类，通...……更多

2024-10-28 09:52:00审判,新作,团队,成本,智能,评估

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚，马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上，马斯克在7月份就在X平台上确认，Gr...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

什么是AGI？人工智能的未来

...业或军事行动的任何阶段。这样的系统可能以人类大脑为模型，但并不一定必须如此，重要的是这样的系统可以被用来取代人类大脑，从组织和管理矿山或工厂到驾驶飞机、分析情报数据或规划战斗等各种任务。Mark Gubrud认为【A...……更多

2024-03-19 06:00:00人工智能,人工,智能,人工智能,智能,人工

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

12月22日，国内首个官方“大模型标准符合性评测”结果公布，百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

谷歌DeepMind推Imagen2；ChatGPT Plu

...览本周AI领域涌现多项重要进展。Runway宣布开展通用世界模型研发，旨在通过研究通用世界模型改进其视频生成系统，使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2，一款高质量、逼真的人工智能图像生成器。Mistral AI...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

全球农田氨减排研究取得进展

...放率田间观测数据，成功训练和验证了随机森林机器学习模型，完成历史基准（2018年）与气候变化情景下的全球高分辨率模拟，产出5弧分（约10km）网格尺度的全球农田氨排放数据集。研究表明，高效肥选用、深施等肥料管理措...……更多

2024-02-22 01:24:00减排,农田,进展,研究,全球,农田

筑牢湾区网络安全防线！Coremail亮相大湾区网络安全大会

...另一方面，Coremail也在积极探索AI赋能高效办公，推出AI大模型整合方案，将邮箱能力解耦调用，以邮箱桥接大模型，实现智能化和自动化。聚焦网络安全大会：Coremail分享信创环境下邮件数据安全的探索与实践聚焦AI+把脉邮件...……更多

2024-11-11 17:46:00湾区,安全,网络,防线,大会,邮件

GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试

...即理解人们思维的能力，是开发具有类人社会智能的 AI 模型的重要基础。近日，来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准，发现现有的多模态模型和 LLM 都表现存在系统性缺陷，同时他们提出...……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

中国信通院启动“CAICT人工智能伙伴计划”

...中国信通院与北京智源研究院、天津大学等联合发布了大模型评测体系3.0，暨“方升”大模型基准测试体系。据介绍，测试指标重点强化行业和场景导向的能力考查，提出了自适应动态测试方法，测试数据超过百万条，并首次推...……更多

2023-12-26 17:41:00信通,人工智能,中国,人工,伙伴,智能

非Transformer架构站起来了!首个纯无注意力大模型,

Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型不断出现，比如 Mistral 发布的首...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练