模态,百灵,模型,能力,模态,助理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

百灵大模型多模态能力全面提升

...IT之家从蚂蚁集团获悉，蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”，能“说”会“画”，可支持音、视、图、文等多模态理解与生成，可以让大模型更像人一样感知和互动，未来...……更多

2024-07-06 17:43:00模态,百灵,模型,能力,模态,助理

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...变小，成为具身智能的「大脑」。解法：垂域大模型、多模态技术与 AI 智能体论坛中，关于可信大模型如何在应用具体落地，呈现出了多种解法，大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

支付宝多模态医疗大模型正式亮相

...2024世界人工智能大会“可信大模型论坛”上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据CNMO了解，支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多

2024-07-06 13:14:00模态,模型,支付,医疗,模态,模型

支付宝发布多模态医疗大模型：支持千亿级视觉识别

...快科技7月5日消息，在2024世界人工智能大会上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据悉，该医疗大模型的基石，源自蚂蚁集团自主研发的蚂蚁百灵大模型，这一先进平台不仅拥有“视听言...……更多

2024-07-05 16:17:00模态,模型,支付,视觉,医疗,支持

AI“明星”选手巅峰对决！记者实测最新谷歌Gemini与GP

...模型能够实现无缝的文本、视频和音频输入，并生成相应模态的输出，真正意义上实现了多模态交互。紧随其后一天，年度Google I/O开发者大会如期而至，谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新，...……更多

2024-05-17 14:26:00实测,巅峰,选手,记者,明星,模型

又一生成式AI助手将“登机”！谷歌发布多模态Bard助理，交

...文本、语音或图像与Bard助理互动——换言之，其具备多模态功能。例如，当用户询问“本周我错过了哪些重要邮件”时，Bard助理会列出各项要点及具体内容，并附上具体对应邮件的链接，还可以帮助用户提取活动地址并在谷歌...……更多

2023-10-07 16:38:00模态,交互式,助理,助手,一生,时代

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

在最近一项研究中，DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向，背后有着多重考量。最初，该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...音乐理解和生成结合在一起的想法比较新颖，论文也是多模态大模型领域的先期工作之一。并且，除了大模型本身，我们提出的针对模型训练的数据集制作流程和整理的数据集，对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

蚂蚁百灵AI大模型将向公众开放

...次通过备案的百灵语言大模型，蚂蚁集团也在研发百灵多模态大模型，并已内测。（蓝鲸记者黄心怡） ……更多

2023-11-06 10:12:00百灵,模型,蚂蚁,公众,开放,科创

群核科技（酷家乐）陈卓：用多模态AI助理赋能设计产业，用合成

...3D空间领域生成式AI引擎，包括底层的超级算力中心、多模态的海量产业数据，以及自研空间AIGC大模型。在这个引擎之上，已经开始生长出丰富的，服务于不同场景和需求的AI应用，它们正在解决每个应用场景中的个性化问题。...……更多

2024-05-28 09:06:00家乐,模态,生产力,助理,大会,产业

出门问问入选「中国AI大模型平台排行榜TOP10」

...技术为核心业务的AI企业，拥有全栈式语音交互能力及多模态大模型自研能力，能够通过各种软硬件解决方案为全球内容创作者、企业级客户及消费者提供AICoPilot服务。作为业内稀缺的产模结合公司，出门问问在自研多模态、可...……更多

2024-06-06 11:45:00中国,模型,排行榜,平台,模型,模态

给机器人装上大模型大脑，「若愚科技」获超5000万天使轮融资

文｜武静静编辑｜邓咏仪36氪获悉，多模态大模型公司「若愚科技」完成超5000万天使轮融资，本轮融资由东方精工领投，昆仲跟投，源合资本担任独家融资顾问。公司称，资金将主要用于产品研发，业务拓展以及团队搭建等方...……更多

2024-03-21 05:19:00机器人,融资,大脑,模型,机器,天使

GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试

...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准，发现现有的多模态模型和 LLM 都表现存在系统性缺陷，同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中，这篇论文获得杰出论文奖。论...……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...径。为什么这样认为。对此，王鹤在具身智能大会具身多模态大模型论坛上给出了解释，科技行者就这一演讲关键内容进行了不改变原意的整理：机器人从动嘴到动手有多难最近，具身多模态大模型非常火，我们看到了OpenAI和Fig...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...择了两条路线分别开拓：一条是 GPT-4o 所代表的端到端多模态大模型的探索，一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上，OpenAI 跨文本、视觉和音频端到端地训练了一个新模型，所有输入和输出都由同一神经...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

AI创新应用矩阵集体亮相蚂蚁技术日首次开放

...让AI像扫码支付一样便利每个人的生活。记者注意到，多模态大模型技术在蚂蚁内部有诸多创新应用，如AI智绘、AI智乐、AIGC数字人等，用户输入一句话、一张图、一段语音，就能生成一张设计图、一段音乐作品、一段动态人像...……更多

2024-05-29 07:07:00矩阵,蚂蚁,集体,开放,应用,技术

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...为了AI发展的最大障碍。当前的数字化世界，信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立，彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

大模型“遍地”都是，谁能真正解放生产力？

...，其苦于人工标注久矣，不想再人工打标视频、图片等多模态信息。但市场现实情况是，供不应求：除了大厂以外，少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然，听到了太多客户关于大模型难以落地...……更多

2023-11-30 14:50:00生产力,模型,解放,生产,模型,考拉

支付宝推出AI毛发自测工具上传照片可测脱发程度

...州市一医院脱发专科门诊医生共同研发，利用蚂蚁百灵多模态大模型识别技术、人工智能与医学图像处理技术。用户只需上传几张头皮照片，AI即可在半分钟内识别出脱发类型和级别，并提供相应的健康建议，用户可以通过支付...……更多

2024-06-07 11:36:00可测,毛发,脱发,程度,支付,照片

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...来自斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

“AI春晚”背后的故事

算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今，仍然面临技术上的诸多挑战。瞄准这些“痛点”，智源研究院放了个大招。在北京智源大会上，涵盖大语言模型、多模态大模型、具身智能大模型...……更多

2024-06-16 23:38:00背后,故事,模型,智能,技术,研究院

全模态对齐框架align-anything来啦：实现跨模态指

... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐，已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中，「有效加速」和「超级对齐」已经成为两个主要的发展动向，...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

蚂蚁井贤栋：通过专业智能体的深度连接，AI会像互联网一样带来

...具备专家知识水平。垂直领域、高质量的数据往往以多种模态存在，体系庞杂，比较分散，对隐私保护和资产价值保护的要求高，很难直接“喂给”通用大模型。井贤栋介绍，蚂蚁依托知识图谱、密态计算等技术，构建了大规模...……更多

2024-07-04 18:07:00代际,蚂蚁,深度,升级,互联网,智能

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

Gemini引领多模态AI热潮，产业发展有望加速

12月11日，多模态AI概念股继续活跃，苏州科达（603660.SH）三连板。截至当日中午收盘，因赛集团（300781.SZ）涨13.32%，苏州科达涨9.96%，宣亚国际（300612.SZ）涨9.7%。消息面上，GoogleAI大模型Gemini近日发布，Gemini是Google到目前为止规……更多

2023-12-11 15:01:00模态,热潮,产业发展,产业,发展,模态

全新的coloros15正式登场，新系统带来全面提升

...而OPPO的一键问屏功能却可以做到边看边说，实现同步多模态的交互。这就意味着用户在浏览内容时，可以立即询问或发出指令，AI能够实时响应，用户不再需要在不同模态之间来回切换操作。OPPO的目标是让AI助理像真人助理一样...……更多

2024-10-20 02:01:00全新,系统,陈希,体验,系统,模态

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...这个金秋，“日日新·商量”又拿了金牌！今日，中文多模态大模型测评基准SuperCLUE-V发布10月榜单：商汤日日新·商量多模态大模型（SenseChat-Vision5.5）凭借多个任务上的出色表现，总得分位列国内大模型第一梯队，智夺金牌。商...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

首个多模态连续学习综述，港中文、清华、UIC联合发布

...址：https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态