团队,华人,指令,数据,模型,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

华人团队爆火instructblip抢跑看图聊天

碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线，就已经被超越了。近来，华人团队开源了多模态基础模型InstructBLIP，是从BLIP2模型微调而来的模型。BLIP家族...……更多

2023-05-15 20:17:00团队,华人,指令,数据,模型,研究

微软华人团队发布全新基准AGIEval，专为人类考试而生

随着语言模型的能力越来越强，现有的这些评估基准实在有点小儿科了，有些任务的性能都甩了人类一截。通用人工智能（AGI）的一个重要特点是模型具有处理人类水平任务的泛化能力，而依赖于人工数据集的传统基准测试并...……更多

2023-05-13 21:28:00微软,基准,专为,团队,人类,全新

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...人学者Tianhao Wu，导师之一是2011年清华特奖得主焦剑涛。团队提出了一种称作思考偏好优化（Thought Preference Optimization）的方法，能让模型像OpenAI-o1一样，通过内部“思考”输出更好答案，最终只显示结果，不展示思考过程。TPO将...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...答案？为了解决这一问题并推动多模态AI评估的边界，MMMU团队对MMMU基准在健壮性和问题难度上进行提升，新基准MMMU-Pro能够更准确、更严格地评估模型在广泛的学科领域内真正的多模态理解和推理能力。论文链接：https://arxiv.org/...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

大模型这把“火”，烧到了人形机器人

...内部成立了一个机器人部门。早在2017年，OpenAI的机器人团队，就发布过用于模拟机器人控制的开源软件Roboschool。2018年，团队研发出来的机械臂已经能自如地“盘核桃”，即灵活把玩木块。当然，OpenAI机器人团队最著名的研究，...……更多

2024-02-02 10:00:00人形,机器人,模型,机器,机器人,机器

$多个中国团队斩获EMNLP\\\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者

...起来了~接下来，具体康康获奖论文有哪些～上交大CMU等团队获最佳论文此次共有5项研究成果获得EMNLP’24最佳论文奖。1、An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance（图像能表达千言万语……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：

...任务，难以揭示复杂场景中的模型表现。最近，Meta GenAI团队发布了一个全新基准Multi-IF，专门用于评估LLM在多轮对话和多语言指令遵循(instruction following)中的表现，包含了4501个三轮对话的多语言指令任务，覆盖英语、中文、法语...……更多

2024-11-26 09:51:00多语,大比,基准,指令,任务,语言

仅用4块GPU、不到3天训练出开源版GPT-4o，这是国内团

LLaMA-Omni能够接收语音指令，同步生成文本和语音响应，响应延迟低至 226ms，低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型（LLM）已成为强大的通用任务解决器，但大多数 LLM 仅支持基于文本的交互，这限...……更多

2024-09-24 13:42:00团队,训练,这是,研究,语音,文本

打脸“AI灭绝伦”！研究反驳：大模型涌现能力不会威胁人类生存

...了这一观点。来自达姆施塔特工业大学和巴斯大学的研究团队发现，GPT 等 LLM 尚无法独立地学习或获得新技能，这意味着它们不会对人类构成生存威胁。他们表示，“涌现能力” 背后的真相或许比科幻电影更富有戏剧性，许多...……更多

2024-08-19 09:31:00模型,威胁,人类,能力,研究,模型

LLM数学性能暴涨168%，微软14人团队力作！合成数据2.

...的研究比比皆是。那么，我们该怎么办呢？最近，微软团队提出了可扩展的智能体框架——AgentInstruct，可自动创建大量多样化、高质量的合成数据。它最大的优势在于，仅只用原始数据源，就能创建完整的提示和回应。论文地...……更多

2024-08-20 13:44:00微软,力作,秘诀,生成,团队,性能

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型（MLLM）。之所以选择多模态大模型作为 Ferret 的设计前提，是因为其拥有强大的视觉语言全局理解能...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

...上述问题，来自UNC ,芝加哥大学，UMD和罗格斯大学的研究团队提出了Calibrated Self-Rewarding（CSR），多模态大模型的自我增强因为会存在一个真实图像的参照，这会使得self-rewarding的过程更加可靠。论文地址: https://arxiv.org/pdf/2……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

全自动组装家具！斯坦福发布IKEA Video Manua

...让数据集更能反映实际应用中的难点。‍有趣的是，研究团队发现25%的家具存在多种有效的组装顺序。比如Laiva架子就有8种不同的组装方式！这种多样性真实地反映了现实世界中组装任务的灵活性。系统的标注流程为了获得高...……更多

2024-12-04 09:53:00斯坦,斯坦福,指令,全自动,场景,家具

字节版Sora火爆24小时，同名论文再次被热议

...值也是拉满了，嗷嗷待哺内测资格！与此同时，字节研究团队一篇PixelDance同名论文，也被扒了出来，再次引发热议。‍‍‍背后论文揭示「PixelDance」原型‍‍字节团队此前入选CVPR 2024的论文，就提出了名为一种PixelDance的模型。...……更多

2024-09-26 13:41:00字节,火爆,再次,小时,论文,指令

全球首个多模态地理科学大模型“坤元”发布：可据指令生成专业地

...程，最终生成用户所需的专业地理图表。展望未来，研究团队将继续深耕地图大模型及地理推理机研发领域，致力于让“坤元”等地理科学语言大模型能够读懂地图、理解地理空间关系。此外，他们还将打造地理科研协作大平台...……更多

2024-09-19 19:53:00坤元,地理,模态,图表,指令,生成

90 后华人 CMU 校友回国创业，自研具身智能机器人

...恒地投入，才能打赢关键核心技术攻坚战。\"90 后 \" 创业团队涌现如我们所见，除了相关领域的龙头企业在布局自研人形机器人，国内也有不少年轻的初创团队涌现。例如由 \"90 后 \" 科技博主、前华为 \" 天才少年 \" 彭志辉创办...……更多

2024-03-12 23:00:00机器人,校友,机器,智能,创业,华人

鬼手操控着你的手机？大模型GUI智能体易遭受环境劫持

...大模型玩手机”。如图 2 所示，不同于现有的研究，研究团队考虑即使用户和平台都是无害的，在现实世界中部署时，GUI Agent 不可避免地会面临多种信息的干扰，阻碍智能体完成用户目标。更糟糕的是，GUI Agent 可以在私有设备...……更多

2024-09-03 09:59:00模型,环境,智能,手机,环境,干扰

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...合专家架构，能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集，为时序分析提供了丰富的训练资源，为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代，时序预测已成为众多...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

又一华人高管离职，OpenAI总裁提前归队

11月9日，OpenAI安全系统团队负责人Lilian Weng宣布将于当地时间11月15日离职，而3个月前，她刚刚上任OpenAI研究与安全副总裁。Lilian Weng本科就读于北京大学，后在印第安纳大学伯明顿分校取得博士学位，是GPT-4项目的重要贡献者之...……更多

2024-11-18 13:33:00总裁,华人,安全,团队,问题,动荡

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...ma2自己给自己微调，性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法，使得微调后的Llama 2-70B模型在AlpacaEval 2.0排行榜中超越了GPT-4、Claude 2和Gemini Pro等领先的大语言模型。这项研究的突...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型