神坛,光速,团队,世界,模型,基准头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...源新王」Reflection 70B，才坐上王座没几天就被打假，跌落神坛了！甚至有人质疑，它莫不是套壳的Sonnet 3.5？发布者Matt Shumer和Sahil Chaudhary经过一番挣扎，已经光速「滑跪」，po出的复盘长文也是亮点满满。「开源新王」Reflection 70B...……更多

2024-10-08 09:47:00神坛,光速,团队,世界,模型,基准

铠侠exceriaplus极至光速g3ssd测试

...对消费级市场推出了自家的主流级新品——EXCERIAPLUS极至光速G31TBSSD(代号SD10)。铠侠EXCERIAPLUS极至光速G3SSD是标准的M.2规格，支持PCIe4.0x4速率、NVMe1.4技术，我们收到的版本为1TB。它用的是铠侠自研的BiCSTLC原厂颗粒，顺序读写速度.……更多

2023-12-18 17:20:00光速,极至,测试,测试,光速,极至

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

...的研究比比皆是。那么，我们该怎么办呢？最近，微软团队提出了可扩展的智能体框架——AgentInstruct，可自动创建大量多样化、高质量的合成数据。它最大的优势在于，仅只用原始数据源，就能创建完整的提示和回应。论文地...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...答案？为了解决这一问题并推动多模态AI评估的边界，MMMU团队对MMMU基准在健壮性和问题难度上进行提升，新基准MMMU-Pro能够更准确、更严格地评估模型在广泛的学科领域内真正的多模态理解和推理能力。论文链接：https://arxiv.org/...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

$什么影响大模型安全？NeurIPS\\\'24新研究提出大模型越狱攻击新基准$

什么影响大模型安全？NeurIPS\'24新研究提出大模型越

...与评估体系来了。来自香港科技大学（Guangzhou）USAIL研究团队，从攻击者和防御者的角度探讨了什么因素会影响大模型的安全。提出攻击分析系统性框架JailTrackBench。JailTrackBench研究重点分析了不同攻击配置对LLMs性能的影响，包...……更多

2024-11-01 09:29:00模型,基准,攻击,影响,安全,研究

自动化、可复现，基于大语言模型群体智能的多维评估基准

...社区信赖的基准。图 3 展示了最终排行榜的截图。研究团队正在继续添加更多的模型和维度，欢迎来自社区的贡献和提交！图 3:Decentralized Arena 排行榜，包括不同维度的排名。方法：通过大语言模型的群体智能进行基准测试去...……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估

超越光速，是能看到过去，还是能回到过去？

在我们深入探讨超越光速的可能性之前，让我们先来聊聊光速本身。光速，通常用字母c表示，在真空中的速度约为每秒299,792,458米，这个数值不仅精确无比，还被用来定义了公里和秒的标准。但光速的意义远不止于此，它是宇...……更多

2024-06-15 09:52:00光速,还是,光速,时间,旅行,宇宙

GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试

...的重要基础。近日，来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准，发现现有的多模态模型和 LLM 都表现存在系统性缺陷，同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中，这篇论文...……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

向具有光速能力的计算机的一次充满希望的飞跃

该团队的可重新编程的基于光的处理器。图片来源：Will Wright，皇家墨尔本理工大学科学家们创造了一种世界首创的可重新编程的基于光的处理器，他们说这可能会开创量子计算和通信的新时代。这些在原子水平上运行的新兴领...……更多

2024-03-04 10:29:00光速,飞跃,能力,计算机,量子,佩鲁

怎样证明光速在宇宙的任何地方任意时刻都是一样的?

...宙中，有一种速度穿梭于星际，贯穿时间和空间，它就是光速。作为现代物理学的核心原则之一，光速不变原理引人入胜，它告诉我们，在宇宙的任何地方，光速在真空中的速度总是恒定不变，这个速度大约是每秒299,792公里。...……更多

2024-06-06 14:25:00光速,宇宙,时刻,地方,光速,宇宙

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...者来自上海交通大学和上海人工智能实验室智慧医疗联合团队，共同第一作者为上海交通大学博士生邱芃铖和吴超逸，共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授，这是该团队在继 PMC-LLaMA 后，在持续...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

....正如开头所述，能够把苹果AI装进终端设备，背后是来自团队自研的基础模型，在发光发热。iPhone的AI革命：30亿参数装进口袋具体来说，AFM是一款基于Transformer架构的仅解码器稠密模型。其设计思路如下：共享输入/输出嵌入矩...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：

...任务，难以揭示复杂场景中的模型表现。最近，Meta GenAI团队发布了一个全新基准Multi-IF，专门用于评估LLM在多轮对话和多语言指令遵循(instruction following)中的表现，包含了4501个三轮对话的多语言指令任务，覆盖英语、中文、法语...……更多

2024-11-26 09:51:00多语,大比,基准,指令,任务,语言

马斯克打脸OpenAI！全球最大模型Grok-1开源

...价称，这是有史以来最大的开放大型语言模型，由世界级团队训练，通过磁力链接发布。Apache 2.0。314B，专家混合（8个活跃中的2个）。就连活动参数仅（86B）就超过了最大的Llama。迫不及待地想看到基准测试结果以及人们用它构...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

【新智元导读】o1诞生，对于OpenAI团队来说，是最具革命性的时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。OpenAI o1团队采访的完整版视频，终于上线了！全程22分钟，o1研发团队在项...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

下载次数破39万！CMU、Meta联合发布VQAScore文

...不足，并进一步提升它们呢？为解决这一问题，CMU和Meta团队联合推出了全新的评估指标VQAScore及基准GenAI-Bench，用于自动评估图像、视频和3D生成模型在复杂提示词下的表现。 ECCV’24论文链接:：https://arxiv.org/abs/2404.01291CVPR’……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

田渊栋团队新作祭出Agent-as-a-Judge！AI智能

【新智元导读】AI评估AI可靠吗？来自Meta、KAUST团队的最新研究中，提出了Agent-as-a-Judge框架，证实了智能体系统能够以类人的方式评估。它不仅减少97%成本和时间，还提供丰富的中间反馈。AI智能体，能否像人类一样有效地评估...……更多

2024-10-28 09:52:00审判,新作,团队,成本,智能,评估

首个自主机器学习AI工程师，刚问世就秒了o1，Kaggle

...数据集能够更好地用于训练：那么它的跑分如何呢？研究团队在 MLE 基准测试（MLE-bench）上对 NEO 进行了全面评估。MLE-bench 是一种创新的基准测试，专注于将 AI 智能体应用于真实世界的机器学习工程任务。与其他人工设计的挑战...……更多

2024-11-19 09:48:00机器,大师,工程师,工程,学习,学习

杰斐逊实验室用创纪录的电子自旋测量揭开物理学的新前沿

...莉森-泽克（Allison Zec）说：\"当你计算出两个物体以接近光速相互撞击的基本运动学原理时，会有一个最大能量。\"她曾在弗吉尼亚大学物理教授肯特-帕施克（Kent Paschke）的团队工作，现在是新罕布什尔大学的博士后研究员。她...……更多

2024-03-07 10:49:00杰斐逊,物理学,测量,实验室,物理,实验

马斯克的AI模型登场！叛逆风格独树一帜数据优势成最大卖点

...（编辑史正丞）北京时间周日午后，社交媒体平台X的AI团队发布公告，正式推出Grok大语言模型。（来源：xAI）Grok一词，是英国作家道格拉斯·亚当斯在知名科幻小说《异乡异客》造出来的概念。《牛津英语词典》对这个词的解...……更多

2023-11-06 09:08:00马斯克的AI模型登场！叛逆风格独树一帜数据优势成最大卖点

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...近Llama 3 8B 使用PyTorch和OpenLM框架进行训练具体而言，研究团队先是提出了一个语言模型数据比较新基准——DCLM。之所以提出这一基准，是因为团队发现：由机器学习 (ML) 模型从较大的数据集中自动过滤和选择高质量数据，可能...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...别组成，旨在评估LLMs理解短程和长程依赖内容的能力。团队设计了5种类型的长期依赖任务，包括理解与推理、计算、时间线重新排序、多重信息检索和摘要。通过人工标注精心生成了超过1100对高质量的长依赖问答对，以满足长...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

2023 AI现状报告：GPT-4仍最强，监管方向缺乏全球共

...大选期间违法而受到调查。·生成式AI扩展热潮导致一个团队花费超过10亿美元来训练单个大型模型。·除了高层的自愿承诺之外，全球人工智能治理的进展有限。·一首AI生成的歌曲跻身Billboard榜单前10名或Spotify 2024年热门歌曲排...……更多

2023-10-12 15:21:00共识,监管,现状,方向,报告,全球

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...ni Pro从今天起，就会在Bard中实装上线。同时，谷歌Gemini团队还公布了一份60页的详细技术报告。消息一出，社交媒体瞬间炸了锅。英伟达AI科学家Jim Fan就第一时间转发评论：这是OpenAI王座的有力竞争者。话不多说，一起来看...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...此前就提出三层架构(KRE)理论，即:第一层知识(Knowledge)，世界知识的全面灌注；第二层推理(Reasoning)，理性思维的质变提升；第三层执行(Execution)，世界内容的互动变革。这三层可以组成一个对于世界提供生产力工具模型的完备能...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

本科生这样“攻克”世界级难题

本文转自：福州晚报福州大学超算团队连续五次获全球一等奖本科生这样“攻克”世界级难题福州晚报讯喜讯从上海传来！记者昨日从福州大学获悉，福州大学团队在2024ASC世界大学生超级计算机竞赛（简称“ASC24”）总决赛中...……更多

2024-04-18 07:36:00本科生,难题,本科,世界,福州大学,福州

重要突破！西湖大学团队和浙二医院共同实现脑机接口中文解码

先进神经芯片中心默罕默德·萨万教授团队，自然语言处理实验室张岳教授团队和朱君明教授团队联合发布了他们最新的研究结果：“A high-performance brain-sentence communication designed for logosyllabic language”.该研究实现脑……更多

2023-11-29 11:46:00西湖,中文,接口,团队,突破,医院

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...5 倍。如何使用 OpenAI o1？ChatGPT Plus 和 Team（个人付费版与团队版）用户马上就可以在该公司的聊天机器人产品 ChatGPT 中开始使用 o1 模型了。你可以手动选取使用 o1-preview 或 o1-mini。不过，用户的使用量有限。目前，每位用户每周...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型