模态,基准,弱点,团队,模型,任务头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

数字员工、超级个体、具身智能，AI Agent未来发展十大研

... 而在腾讯发布的《2024数字科技前沿应用趋势》中，“多模态智能体加速AGI进程”被列为第二大趋势。该报告认为，通用人工智能渐行渐近，大模型走向多模态，AI智能体（Agent）有望成为下一代平台；端侧大模型加速部署，或...……更多

2024-02-02 17:00:00研究方向,个体,方向,员工,数字,智能

“具身智能小镇”来了！机器人逛超市买菜满街跑，来自上海AI

...通用机器人算法体系。今年5月，该团队还发布了具身多模态大模型Grounded 3D-LLM，能够自动化生成物体到局部区域的场景描述与具身对话数据，有效缓解了目前三维场景理解的局限性。论文地址：https://arxiv.org/abs/2407.10943GitHub地址...……更多

2024-07-23 09:33:00满街,上海,机器人,小镇,机器,超市

云知声荣登甲子光年榜单，彰显AI大模型商业潜力

...现出色，行业领先。2024年8月，云知声正式推出了山海多模态大模型，该模型通过整合跨模态信息，能够接收文本、音频、图像等多种形式的输入，并实时生成文本、音频和图像的任意组合输出，带来了实时多模态拟人交互体验...……更多

2024-12-13 16:22:00甲子,潜力,模型,商业,模型,山海

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecD

...RecDiff团队计划将RecDiff拓展到更多推荐场景中，并结合多模态信息，进一步探索该模型的潜力和应用价值。论文：http://github.com/HKUDS/RecDiff源代码：https://github.com/HKUDS/RecDiff港大数据智能实验室：https://sit……更多

2024-07-30 09:31:00社交,实验室,模型,实验,智能,数据

机器人多模态模型及双臂协作系统在川发布

●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素，综合判断、生成任务并执行任务，是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多

2024-08-13 06:37:00模态,人多,双臂,协作,模型,机器

硅谷顶级VC的最新洞察：AI公司应该专注用户需求，而非模型构

...司，直到ChatGPT的飞速增长引起了广泛关注。我认为不同模态的模型或模型应用领域存在机会，比如视频领域、生物技术、临床医学等。我认为我的基金将大部分投资于应用方向，但目前还投资了一些基础模型公司。Elad Gil：我非...……更多

2024-03-02 13:37:00硅谷,洞察,模型,顶级,需求,用户

小模型正在成为AI界的新宠

...源的 GLM-130B 模型，具有 1.3 万亿参数。 M6：达摩院的多模态预训练模型 M6，拥有 10 万亿参数。然而这种大模型之间的军备竞赛，令业内十分担忧。参数量的增加，就一定能带来显著的性能提升吗？不一定。大模型带来的问题...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

又热闹了！OpenAI的加强版“Her”正式开放，压过了Ge

...然语音对话获得了实时解答。目前，OpenAI尚未提供这项多模态功能的推出时间表。此外高级语音模式也暂时不对欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区开放。尽管如此，终于能亲自上手OpenAI版的“her”，对已经混AI...……更多

2024-09-25 09:54:00升级,开放,生产,开发者,开发,模型

吴泳铭官宣3800亿投入后，阿里云如何打AI这场硬仗？

...要的方向主要是两个，一个是Reasoning推理，一个是Omin全模态融合。”刘伟光提到。在应用方向上，这次大会，阿里云宣布推出AI Agent Store，从生成式AI向代理式AI发展，并表示将首先推动阿里旗下所有服务走向Agent（智能体）。此...……更多

2025-04-10 17:12:00硬仗,阿里,投入,模型,阿里,模态

GPT-4o的识图能力有多牛？四大维度深度体验

...的？后训练功不可没从前述体验看，GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言，新的GPT-4o是OpenAI“有史以来最好的模型”。那么，GPT-4o的多模态能力是如何“炼”成的呢？这背后的秘密或许可以...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

...和吉利汽车联合宣布，将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。其中，包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V，以及行业内首款产品级开源语音交互大模型阶跃Step-A...……更多

2025-02-19 18:43:00文锋,对大,注意力,模型,意味,机制

从空间智能到具身智能，跨维践行Sim2Real AI最高效路

...使用双眼感知世界一样，具身智能要求机器人能够通过多模态传感器进行感知、交互和决策，形成综合的空间认知和操作能力。问：空间智能与具身智能的异同点是什么？贾奎：就像前面提到的，空间智能赋予 AI 感知并理解现...……更多

2024-07-23 09:40:00智能,路径,空间,智能,机器人,机器

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...合提出即插即用的SearchLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

科学家建立新评价基准，助力评估大模型数据分析能力

...更加符合预期的结果。整体来看，缺乏交互式数据分析的基准——是本次研究面临的最大问题之一。为了解决这一问题，他们以“斯坦福小镇”项目为启发，创建了“DECISION COMPANY”。“DECISION COMPANY”是数据分析领域的首个多代...……更多

2024-04-07 10:50:00立新,数据分析,基准,科学家,模型,评估

用过GPT-4 Turbo以后，我们再也回不去了

...年 4 月。定制化：GPT3 16k、GPT4 微调、定制模型服务。多模态：Dall-E 3、GPT4-V 和 TTS 模型现已在 API 中。 Whisper V3 开源（即将推出 API）。与开发者分享收益的 Agent 商店。 GPT4 Turbo 的价格约是 GPT4 的 1/3……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

7个第一，11个首发，讯飞星火放大招，大模型规模化落地可期！

...有的远场高噪、全双工、多语种多方言能力上，升级了多模态能力，新增了超拟人和个性化能力。超拟人数字人首次亮相，多模态的交互从超拟人的语音变成超拟人的数字人，实现语音、视频、图文的全部联动的多模态交互。 ...……更多

2024-10-24 16:48:00讯飞,星火,落地,模型,规模,讯飞

Gemini的展示是剪辑造假？我们亲测了一下，发现…

...场，隆重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT，综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼：Gemini能流畅而准确地识别出...……更多

2023-12-08 16:30:00剪辑,模态,中文,提示,别出,大杯

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...技术人才，成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向，致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用，引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智能（AI）领...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

中国AI最高奖项的唯一特等奖：被京东拿下了

...，“京东黑板报”宣布，京东科技人工智能团队凭借“多模态交互式数字人关键技术及产业应用”项目，获得中国智能科学技术最高奖——吴文俊人工智能科学技术奖的特等奖，也是本年度唯一的特等奖。这是京东继2021年“商...……更多

2025-03-19 19:27:00京东,特等奖,中国,奖项,京东,模态

谷歌版贾维斯即将问世，最强Gemini 2.0加持！AI自主

...，最后就可以完成用户任务。可见，想要把类似GPT-4V的多模态大模型应用于操作系统上，模型还需要具备强大的屏幕解析能力，主要包括两方面：1、准确地识别用户界面中的可交互图标；2、理解屏幕截图中各种元素的语义，并...……更多

2024-10-28 09:51:00贾维斯,贾维,时代,电脑,模型,图标

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...示，在接下来的几个月中，他们预计将推出新功能（如多模态）、更长的上下文窗口、更多不同大小版本的模型和更强的性能，以及 Llama 3 研究论文。另外，Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM Wats.……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要，是实现AGI的必经之路。”对大模型的下一步发展，李璟表示，阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习，提高模型...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...示，这个生成速度在业内已经算非常快了。张鹏认为，多模态模型的探索还处于非常初级的阶段。从生成视频的效果看，对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等，都有非常大的提升空间。从模型本身角度...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

生成式AI：手机厂商高端梦最后的希望

...搬上手机？Amon认为，目前大模型正朝着“轻量化”“多模态”方向发展，以云端作为AI大脑，边缘端和终端作为小脑，这样一种云+端的“混合AI”模式成为技术发展的主要趋势。如何将AI大模型搬到手机上，手机厂商应充分考虑...……更多

2024-01-10 09:58:00高端,生成,厂商,手机,模型,手机

具身智能GPT-2时刻！国内公司做出全球最大端到端统一具身大

...在走。机器之心：这种「大统一」模型与大语言模型、多模态大模型以及之前的机器人模型的关系是？统一具身模型的技术方向，既完全不同于传统机器人学习的小模型技术，也完全不同于以往语言、多模态大模型的技术。首先...……更多

2024-11-08 09:48:00模型,时刻,统一,智能,全球,公司

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

“眼里有活”的斯坦福机器人来一个？数十种家务全包成本约3万

...和平台的发展：1、以机械臂作为物理输入/输出设备的多模态大模型：VIMA、PerAct、RvT（英伟达）、RT-1、RT-2、PaLM-E（谷歌）、RoboCat（DeepMind）、Octo（伯克利、斯坦福、CMU）等；2、弥合 System 1（负责低级控制）和 System 2（负责高.……更多

2024-01-07 11:00:00斯坦,斯坦福,机器人,家务,成本,机器