模型,训练,模型,问题,训练,研究人员头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

火爆全球的Chat GPT，想毁灭人类？

...的对话机器人｜图源网络德雷克塞尔大学生物医学工程的研究人员从健康的志愿者和阿尔茨海默氏症患者那里采集了 237 段录音，结果发现，GPT-3模型可以仅根据语音数据推断受试者的认知测试分数，还能很好地区分阿尔茨海默...……更多

2023-02-01 21:23:00火爆,人类,全球,训练,模型,人类

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...数据是否有助于提升 RDT 的性能？A：是的。如表 2 所示，研究人员对三者分别进行了消融实验，结果表明缺少任何一者都会带来极大的性能损失。特别地，仅用双臂数据训练的 RDT (scratch) 在未见物体和场景上表现极差，这表明预...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

张云泉：集中力量，促进国产AI大模型发展

...第18期，总第915期），原题为《集中力量，促进国产AI大模型发展——专访十四届全国政协委员、中科院计算所研究员张云泉》。文丨《瞭望东方周刊》记者万宏蕾编辑顾佳贇算力建设能否及时跟上，成为AI大模型向各领域进一步...……更多

2024-09-03 14:17:00云泉,模型,国产,力量,发展,模型

扩散模型版CS: GO！世界模型+强化学习：2小时训练登顶A

...化学习中很重要的视觉细节。日内瓦大学、爱丁堡大学的研究人员提出了一个在扩散世界模型中训练的强化学习智能体DIAMOND（DIffusion As a Model Of eNvironment Dreams），文中分析了使扩散模型适应于世界建模（world modeling）所需的设计...……更多

2024-11-19 09:49:00模型,训练,小时,学习,世界,模型

首个多模态连续学习综述，港中文、清华、UIC联合发布

...的负前向知识转移。 MMCL 算法汇总为了应对上述挑战，研究人员越来越关注 MMCL 方法。作者将 MMCL 方法分为四类主要方法，即基于正则化、基于架构、基于重放和基于提示的方法。基于正则化的方法：由于训练中参数的自由移...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

微软、英伟达纷纷押注小模型，大模型不香了？

...发展的道路上，科技巨头们曾经竞相开发规模庞大的语言模型，但如今出现了一种新趋势：小型语言模型（SLM）正逐渐崭露头角，挑战着过去“越大越好”的观念。视觉中国当地时间8月21日，微软和英伟达相继发布了最新的小型...……更多

2024-08-26 14:17:00模型,英伟,微软,模型,训练,性能

北大字节VAR最佳论文、厦大清华亚军，NeurIPS 202

...回归模型，一直将 VAR 作为高优项目推进，不仅安排多名研究人员重点攻关此技术方向，还投入大量算力资源支持模型训练和实验。该团队近期将发布新的 VAR T2I 模型研究成果，并将对模型开源。二是由新加坡国立大学、 Sea AI La...……更多

2024-12-05 09:47:00论文,清华,亚军,字节,北大,模型

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

...）= 83 个猕猴桃。这只是数百个问题中的一个简单例子。研究人员对这些问题进行了轻微修改。然而，几乎所有这些问题都使得尝试这些问题的模型成功率大幅下降，连 OpenAI 最新最强的 o1-preview 模型也无法幸免。题目为：利亚...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

超级人工智能会偷袭人类吗？

...程中产生的假象，并认为创新能力的增强是循序渐进的。研究人员近日在美国新奥尔良举行的神经信息处理系统大会（NeurIPS）机器学习会议上报告了这项工作。“我认为他们在说‘没有什么神奇的事情发生’方面做得很好。”...……更多

2023-12-29 07:44:00人工智能,人工,人类,智能,模型,研究

北京人工智能数据运营平台发布

...工智能研究院理事长、北京大学教授黄铁军表示，构建大模型生态首先要建立数据流通机制，推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集，很难想象人工智能怎样才能实现如此快速的迭代，然而，...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

ChatGPT一周年，机会在大厂还是小公司？

大创新靠小厂、小创新靠大厂。大厂的体量也会有大模型，只要增加1%就是巨大的受益。但是最大的创新可能来自于创业公司。新的一波机会，从信息时代走向智能时代，会有新的公司起来。作者|尹凯编辑|原野ChatGPT 会成为AI大...……更多

2023-12-07 09:42:00大厂,还是,机会,公司,模型,王小川

不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM

...这一点值得思考。来自伊利诺伊大学香槟分校和亚马逊的研究人员选择和这些问题进一步对话。他们去除了上下文示例、技巧、多智能体系统，仅仅通过行动 / 观测空间与 LLM 的训练任务对齐。他们训练的 AgentOccam 成为了零样本...……更多

2024-11-07 09:54:00样本,模型,策略,训练,经验,智能

打乱/跳过Transformer层会怎样？最新研究揭开其信息

...）模型。encoder-only模型选择的是BERT，有24层、3.4亿参数。研究人员使用这些模型的标准预训练checkpoints。在所有实验中，模型都是冻结的，除BERT的评估中包含一个标准的微调步骤，其它情况未通过微调等方法修改模型参数。基准...……更多

2024-07-27 09:29:00流动,机制,研究,信息,中间层,顺序

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

...Movie Gen Video沿用了Transformer的设计，尤其借鉴了Llama 3。而研究人员引入的「流匹配」（Flow Matching），让视频在精度和细节表现上，都优于扩散模型。稍显遗憾的是，这次Meta发的也是「期货」，产品预计明年才正式向公众开放。...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...好几条街。然而，这仅仅是 o1 模型的 preview 版本。OpenAI 研究人员 David Dohan 曾发文暗示，一个月后，o1 模型还将有全新的升级版本。届时，还不知 o1 性能，将有多么逆天？！物理学博士论文，AI 1 小时直出 200 行代码2022 年，物...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级

...许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难...……更多

2024-07-01 09:23:00力作,批评,团队,模型,人类,训练

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

【新智元导读】研究人员提出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

$多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中

...语言模型中流动。来自以色列理工学院、特拉维夫大学的研究人员将这一方法扩展到语言模型的后向传递和梯度。首先证明，梯度矩阵可以被视为前向传递和后向传递输入的低秩线性组合。然后，开发了将这些梯度投射到词汇项...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

谷歌公开“社会学习”ai框架

...特定任务解法的“教师模型”学习各种问题的解决方案，研究人员设计了“垃圾短信检测”、“解决小学数学问题”、“根据特定文字回答问题”等多项测试，来评估相关“社会学习”框架的成效。研究人员表示，部分AI模型只...……更多

2024-03-11 11:35:00框架,社会,学习,模型,学习,指令

斯坦福发布ai基础模型“透明度指标”

...标最高的是Meta的Lama2，但相关“透明度”也只有54%，因此研究人员认为，市面上几乎所有AI模型，都“缺乏透明度”。据悉，这一研究是由HAI基础模型研究中心（CRFM）的负责人RishiBommasani所主导，调查了海外最流行的10款基础模...……更多

2023-10-21 16:47:00斯坦,斯坦福,透明度,模型,指标,基础

生成式AI可训练机器人执行多种任务

...记者张梦然）据美国麻省理工学院官网近日报道，该机构研究人员为了训练更先进的多用途机器人，开发出一种技术：使用一种称为扩散模型的生成式人工智能（AI），可将不同领域、不同形式的多个数据源整合起来，用于多种...……更多

2024-06-24 01:57:00机器人,生成,多种,机器,训练,任务

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...种直观简洁的方式来识别不同学术领域中的领先模型，使研究人员和开发者更容易理解不同模型的优势和劣势。细粒度评估：研究团队还基于不同学科、不同模态、不同语言以及不同类型的逻辑和视觉推理能力进行基于准确性的...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

百川智能、阿里云等进入开源大模型领域，开启商业化前奏

闭源商业化的“百模大战”暂告段落，开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后，基于该模型微调的大模型不断涌现。此外，阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B，国内8、9月份...……更多

2023-10-14 00:21:00百川,阿里,前奏,模型,领域,智能

谷歌在AI赛道加速

...oogle 的 AI 研究实验室Google DeepMind 发布了一项关于训练 AI 模型的新研究，Google 声称，该研究将大大提高训练速度和能效，比其他方法的性能高出 13 倍，能效高出 10 倍。随着有关 AI 数据中心对环境影响的讨论日益升温，新的 JEST...……更多

2024-07-11 09:47:00赛道,训练,方法,数据,模型,学习

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

...放且易于访问：与原始Gemma模型一样，Gemma 2允许开发者和研究人员共享和商业化创新成果。广泛的框架兼容性：Gemma 2兼容主要的AI框架，如Hugging Face Transformers，以及通过Keras 3.0、vLLM、Gemma.cpp、Llama.cpp和Ollama……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力