力作,批评,团队,模型,人类,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

新智元报道编辑：乔杨【新智元导读】今天，OpenAI悄悄在博客上发布了一篇新论文——CriticGPT，而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练，但目的却是用来指正GPT-4的输出错误，实现「自我批评」。O...……更多

2024-07-01 09:23:00力作,批评,团队,模型,人类,训练

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

【新智元导读】合成数据2.0秘诀曝光了！来自微软的研究人员们提出了智能体框架AgentInstruct，能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3，在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

新智元报道编辑：乔杨好困【新智元导读】能抗衡AlphaFold 3的生命科学大模型终于出现了。初创公司Evolutionary Scale AI发布了他们最新的98B参数蛋白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

全模态对齐框架align-anything来啦：实现跨模态指

...好数据集 Align-Anything，提供详细的人类偏好注释以及用于批评和改进的精细语言反馈，在增强模型的多模态理解能力的同时，从而实现跨模态的全面评估和改进。全模态大模型与全模态对齐大模型性能的最后一块拼图人类在日...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

...为在单一模型内构建有向无环图（DAG）。DAG由代表命题、批评、精炼和验证的节点组成，边表示它们之间的逻辑关系或依赖关系，边都有方向，不存在任何循环路径。这种无环的特性确保推理过程不受循环依赖的影响，能更真实...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许多人提到，相对...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂

...有益的。值得一提的是，这篇论文来自 OpenAI 的超级对齐团队，其中几位作者在今年早些时候已经离开 OpenAI，团队也已经分崩离析。其中一位作者透露，这是该团队的最后一篇论文。一个直观的例子为了提高模型输出的可读性...……更多

2024-07-19 09:45:00遗作,输出,模型,团队,两个,模型

硅谷手记｜AI抄袭背后的硅谷“不光彩文化”

...证据和对方反应来看，抄袭性质已比较确定”。曼宁发声批评后，斯坦福该团队的两名成员夏尔马和加格也在社交媒体上正式道歉，并表示要完全撤下Llama3-V模型。在当前的人工智能热潮中，这个事件引发广泛关注。有观点认为...……更多

2024-06-05 13:55:00硅谷,光彩,手记,抄袭,背后,文化

数学不太好的文科生

...—如何将成千上万张GPU卡串联在一起,让它们充分发挥算力作用。这是“BAT”目前也没有完全解决的问题。数学解题能力靠“打补丁”除了功能增加,GPT-4的文本处理和生成能力也优于ChatGPT。谈及这个大模型的数学水平,赵海笑道:...……更多

2023-03-16 09:23:00文科生,文科,数学,赵海,模型,能力

最强AI程序员砸饭碗：84秒跑通代码像人一样思考

...锁了提升SOTA的最大增幅——57%！至于Genie的实际效果，用团队的话来说就是：它可以做到像人类工程师一样解决现实生活中的软件问题。首先，你可以用4种方式让Genie开始工作，分别是提示词、GitHub Issue、Linear Ticket或者API。以...……更多

2024-08-13 14:46:00程序员,代码,程序,数据,模型,团队

AI检测AI：“矛”更利还是“盾”更坚

...具，如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具，如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异？AI检测工具如何根据...……更多

2024-08-16 10:04:00检测,还是,检测,模型,文本,技术

人类和AI在推理任务中的表现相似，Google DeepMi

Google DeepMind团队发表了一篇研究论文，揭示了当前人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

ChatGPT「秘方」竟在拖LLM后腿？Karpathy、L

...要阶段，接在预训练和监督微调（SFT）之后。我对RLHF的批评是：它几乎算不上是真正的强化学习，而且我认为这一点没有被广泛理解。强化学习很强大，而RLHF则不然。让我们来看一个AlphaGo的例子，它的训练用到了实际的RL算...……更多

2024-08-10 13:48:00后腿,秘方,人类,奖励,模型,学习

Bengio团队提出多模态新基准，直指Claude 3.5和

...程完成这一任务吗？为此，来自图灵奖得主 Yoshua Bengio 的团队提出了全新的视觉问答任务：视觉字幕恢复（Visual Caption Restoration，VCR）。让我们借由这个任务对视觉语言模型的推理能力一探究竟：当前的视觉语言模型距离人类的...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

打脸“AI灭绝伦”！研究反驳：大模型涌现能力不会威胁人类生存

...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现，GPT 等 LLM 尚无法独立地学习或获得新技能，这意味着它们不会对人类构成生存威胁。他们表示，“涌现能力” 背后的真相或许比科幻电影更富有戏剧性，许多...……更多

2024-08-19 09:31:00模型,威胁,人类,能力,研究,模型

国内首个类ChatGPT模型发布，服务器被挤崩

...悉，国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台，邀观众参与内测。看过《流浪地球2》的伙伴应该对MOSS这个名字很熟悉，据悉团队在训练完成第一代模型的时候，正值该片热映，片中的人工智能550W...……更多

2023-03-02 13:52:00模型,服务器,服务,中文,模型,对话

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...器偏差分析对LLM自动评估器（LLM-as-a-Judge autorater）的常见批评主要涉及他们对某些判断的偏见。通过在自动评估器偏见基准CoBBLEr上评估 FLAMe及其变体，论文发现FLAMe模型比其他流行的LLM自动评估器的偏见要小得多。 CoBBLEr主要测...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

语音克隆达到人类水平，微软全新VALL-E 2模型让Deep

...当「第一个吃螃蟹的人」，不发模型是担心可能的带来的批评和负面舆论。一旦有了能将VALL-E转化为产品的方法，或者市场上杀出其他竞品，难道还担心微软有钱不赚吗？的确如网友所说，从项目页面目前放出的demo来看，很难...……更多

2024-07-25 09:34:00堪比,微软,配音,语音,模型,人类

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...模型attention计算的额外开销。为了确定最优激活参数量，团队投入大量成本展开实验：训练一系列激活参数范围从10M到1B的模型，使用最高1000亿tokens的训练数据，覆盖100亿到1000亿tokens的不同数据规模。使用isoFLOPs曲线，在固定计...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

Meta版慢思考也来了。田渊栋团队带来新作Dualformer，把快慢思考无缝结合，性能提升还成本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

AI “早筛” 癌症，准确区分13种癌症，准确率98.2%，

...行治疗。日前，来自伦敦帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET，通过观察 DNA 甲基化模式，从非癌组织中识别出 13 种不同类型的癌症（包括乳腺癌、肝癌、肺癌和前列腺癌等），准确率高达 9...……更多

2024-06-27 08:48:00癌症,准确率,人类,治疗,癌症,模型

人工智能为了游戏获胜会“说谎”

...人工智能会欺骗人类？5月13日，美国麻省理工学院的研究团队称，部分人工智能系统已经学会如何欺骗人类，包括部分号称已被训练成乐于助人和诚实的系统。国内AI企业相关负责人指出，AI缺乏对谎言伦理后果的认知，其行为...……更多

2024-05-14 04:02:00人工智能,人工,智能,人工智能,模型,人工

马斯克打脸OpenAI！全球最大模型Grok-1开源

...OpenAI的竞争对手。作为OpenAI创始人之一，也是最新的OpenAI批评者，马斯克此前已表示，OpenAI已偏离了其预期目的，成为了一个以利润为导向的实体。他直言，OpenAI最初是作为一个非营利性开源组织创建的，目的是抗衡谷歌。但此...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

新AI模型可识别运动员情绪

...莹利用卷积神经网络技术和实际比赛视频，德国一个研究团队训练出能够识别运动员情绪的AI（人工智能）模型。它根据网球运动员在比赛中的肢体语言识别其情感状态，准确率可达到人类观察者水平。德国卡尔斯鲁厄理工学院...……更多

2024-06-26 03:17:00运动员,模型,情绪,运动,人工智能,运动员

$多个中国团队斩获EMNLP\\\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者

...起来了~接下来，具体康康获奖论文有哪些～上交大CMU等团队获最佳论文此次共有5项研究成果获得EMNLP’24最佳论文奖。1、An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance（图像能表达千言万语……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人