模态,模型,科技,模态,模型,场景头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...性创新的今天，OpenAI公司隆重宣布，其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能，更在实时对话、图文分析等方面实现了质的飞跃，被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

群核科技（酷家乐）陈卓：用多模态AI助理赋能设计产业，用合成

...3D空间领域生成式AI引擎，包括底层的超级算力中心、多模态的海量产业数据，以及自研空间AIGC大模型。在这个引擎之上，已经开始生长出丰富的，服务于不同场景和需求的AI应用，它们正在解决每个应用场景中的个性化问题。...……更多

2024-05-28 09:06:00家乐,模态,生产力,助理,大会,产业

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...一款名为 LVAFusion 的模块，旨在更高效、更准确地融合多模态信息。图 | 徐冬阳（来源：徐冬阳）自动驾驶在路上应该具备学习优秀人类驾驶员的能力，因为人类在面对多数场景的时候，可以迅速地定位在关键区域。为了提高端...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

若愚科技推出九天机器人大脑，大模型总参数规模达130亿｜项

...商合作，提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向：一是负责感知层面的感知模型，二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多

2023-12-26 09:36:00九天,机器人,大脑,模型,机器,参数

智源评测体系发布国内外“百模”评估结果出炉

...系，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

百灵大模型多模态能力全面提升

...IT之家从蚂蚁集团获悉，蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”，能“说”会“画”，可支持音、视、图、文等多模态理解与生成，可以让大模型更像人一样感知和互动，未来...……更多

2024-07-06 17:43:00模态,百灵,模型,能力,模态,助理

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

反击OpenAI，谷歌放出最强悍大模型Gemini

... CEO戴密斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

跨模态大模型“白泽”学会藏语

...新藏语内容理解与应用技术，人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后，显著提升了“白泽”对藏语内容的理解和处理能力，为网络空间藏语内容处理提供了全新的技术...……更多

2024-09-23 21:20:00藏语,模态,模型,藏语,模态,智能

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

联通元景大模型亮相2024年中国品牌日打造产业智能化新范式

...供互联网实时资讯问答以及更好的数学计算等服务。在多模态大模型的视觉能力方面,工作人员分别提供了不同场景的视频和图片,“元景看见”迅速对视频、图像画面进行实时识别理解,并以文字描述方式呈现出来。除通用视觉能...……更多

2024-05-13 15:00:00范式,中国,模型,智能,产业,品牌

联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单

...联汇科技预训练大模型拥有国际领先的能力优势，自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一，在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军，大模型...……更多

2023-02-01 10:00:00联汇,之心,中国,重量,机器,年度

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝

“解锁”AI云盘新体验！中国移动云盘通过3项AI算法备案

...中，中国移动云盘3项大模型算法成功通过备案，涵盖多模态大模型、文本生成算法等。去年9月，中国移动云盘启动AI智能工具内测，本次算法备案成功标志着中国移动云盘可正式对外提供深度合成人工智能服务，在国内AI云盘赛...……更多

2024-04-18 23:03:00云盘,中国,算法,中国移动,体验,移动

喜马拉雅音频大模型亮相，AI赋能内容创作者

...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会，在“人工智能+”主题馆吸引众多市民驻足围观体验。AI（人工智能）已经在深刻影响着我们的生活，也影响和改变着内容创作行业。作为在线音...……更多

2024-09-21 09:50:00喜马拉雅,创作者,模型,创作,音频,内容

商汤科技发布日日新5.0大模型

...提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力，与此同时，在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

只有谷歌受伤的世界达成了，但“全能模型”到底该不该跟？

...对二，谷歌就跟四个王。那么，这一次较量的核心——多模态大模型，国内AI行业是否要跟进呢？如果要跟进，又该提前考量到哪些问题呢？每一次新产品问世，如果只跟着新闻“震惊”是很难进步的。不妨和我们一起，认真给G...……更多

2024-05-19 16:32:00全能,模型,只有,世界,模态,模型

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...和案例大部分都是基于大语言模型。面向未来，他认为多模态大模型，抑或是文字、图片、语音、视频等多模态的融合，是基础模型非常重要的长期发展方向，是通往AGI（通用人工智能）的必经之路。而百度在这些领域有着长期...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

...过半，经过一轮“价格战”后，各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点，大模型行业本身也正经历从单模态到多模态，再到全模态的演进。就在本月初的世界人工智能大会上，腾讯集团副总裁...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

文博会观察：大模型为文化产业发展提供新机遇

...前来互动。“面向文化创作领域，腾讯混元正积极发展多模态模型，以进一步加强文生图、文生3D以及文或图生视频能力。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏举例子表示，面对内容制作行业多样化需求，腾讯混元在...……更多

2024-05-26 20:39:00新机,产业发展,模型,观察,产业,发展

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...息处理全国重点实验室两大平台，长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

公路水路交通基础设施数字化转型升级，卓视智通准备好了

...012年成立以来就一直专注于交通视频识别及智能分析、多模态融合感知、多模态大模型等前沿技术的原创研发，并在智慧公路与交通基础设施数字化领域实现了广泛的应用落地，公司连续多年获评“AI+智慧交通”十大优秀企业、...……更多

2024-05-22 12:00:00智通,水路,基础设施,设施,公路,准备

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位，在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

vivo蓝心大模型升级为“自研ai多模态大模型”

...432%。同时黄韬宣布，vivo的蓝心大模型升级为“自研AI多模态大模型”，这项技术通过视觉、声音、空间等多维度感知和理解世界，使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多

2024-05-15 04:08:00模型,模态,升级,黄韬,模型,多维度

WOT全球技术创新大会2024北京站：探索AI 的无限可能

...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中，如何使用多模态AIGC在实际应用中获取价值？万物云如何通过结合文本和图像输入，利用AI算法自动生...……更多

2024-05-31 18:24:00北京站,技术创新,北京,大会,全球,技术

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队