模态,清华,领衔,模型,视频,音视头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

2024云栖大会将是史上汇集AI硬科技最多的一届

...能沉浸式体验3D生成、音视频生成、智能编码等十余项多模态模型如何一步步化作生产力。“值得一提的是，由生数科技团队打造的首个国产纯自研视频大模型Vidu将进行公开展示。”刘湘雯介绍，大会也邀请到十余家多模态模型...……更多

2024-09-04 07:02:00大会,科技,机器人,模型,杭州,机器

京东探索研究院院长、京东科技人工智能业务负责人何晓冬：让大模

...犀大模型，经过不断升级，已从单一的语言处理走向了多模态能力，涵盖了语言、语音、图像、视频和数字人等。这一跨越，得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多

2024-07-31 11:48:00京东,人工智能,院长,研究院,人工,模型

AI智能体将迎爆发点，市场空间近300亿美元！中科金财6天5

...系统，以大型语音模型（LLM）作为核心引擎，基于复杂多模态数据的处理能力，他们可以感知环境，做出决策，并执行任务以实现特定目标。目前，国内外科技巨头都在加速布局AI智能体领域。其中，OpenAI计划在明年1月发布一款...……更多

2024-11-18 17:14:00智能,市场,空间,智能,应用,模型

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

...榜首，再度证明通义开源系列业界最强的竞争力。通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中，通义千问视觉理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V，这款模型已在多家企业落地；代码...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

...过半，经过一轮“价格战”后，各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点，大模型行业本身也正经历从单模态到多模态，再到全模态的演进。就在本月初的世界人工智能大会上，腾讯集团副总裁...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

华中科技大学白翔教授发布多模态大模型

...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”，对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注：多模态大模型是一类可...……更多

2023-12-15 01:14:00华中科技大学,华中,模态,模型,教授,大学

迎着应用爆发的曙光，百度将推出新版文心大模型

...，张冠李戴的幻觉现象普遍存在，这也是为什么今天的多模态大模型还没有什么成规模应用跑出来的原因。今年年初时，在整个中文互联网都为Sora而捶胸顿足的时候，百度决定解决图像生成的幻觉问题。百度最新发布的检索增...……更多

2024-11-22 09:58:00曙光,文心,模型,应用,李彦,模型

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...合成。2.精细化 Token 对齐技术：我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构：我们设计了一种层次混合专家体系结构，用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

2024世界计算大会论道：万兴科技大模型加速改变音视频内容生

本文转自：人民网-湖南频道朱雯雯分享音视频多媒体大模型的应用探索与实践。受访单位供图人民网长沙9月25日电 9月24日，2024世界计算大会在湖南长沙开幕。大会汇聚全球顶尖的计算产业专家、学者、企业家，多维度探讨国...……更多

2024-09-25 17:26:00音视,万兴,模型,成本,大会,结构

拓宽行业应用场景多模态大模型加速通用AI进程

...业内分析认为，该项新产品或将促使大模型厂商加大对多模态大模型的研发投入，并进一步推动AGI（通用人工智能）进程。一直以来，视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后，Sora的发布迎合了...……更多

2024-02-26 08:58:00模态,行业应用,模型,进程,场景,应用

对抗“AI换脸”等风险欺诈，外滩大会首办全球Deepfake

...最年轻的一位是来自东南大学的大三学生唐楚杰，擅长多模态内容生成，即将被保研，目前正在暑期实习。王博毕业于北京大学，他说：“我本身就是学计算机专业的，对网络攻防很有兴趣，区别于黑客、木马病毒等传统信息安...……更多

2024-09-06 13:52:00外滩,挑战赛,对抗,风险,大会,全球

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...导读】面壁小钢炮MiniCPM-V 2.6重磅出击，再次刷新端侧多模态天花板！凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

中信证券：OpenAI推出视频生成模型Sora AI产业围绕

中信证券：OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码【中信证券：OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电，中信证券研报指出，近一周内，OpenAI和谷歌分别推出了他们的最新AI模型，...……更多

2024-02-19 09:23:00中信证券,模态,中信,生成,模型,不断

Gemini引领多模态AI热潮，产业发展有望加速

12月11日，多模态AI概念股继续活跃，苏州科达（603660.SH）三连板。截至当日中午收盘，因赛集团（300781.SZ）涨13.32%，苏州科达涨9.96%，宣亚国际（300612.SZ）涨9.7%。消息面上，GoogleAI大模型Gemini近日发布，Gemini是Google到目前为止规……更多

2023-12-11 15:01:00模态,热潮,产业发展,产业,发展,模态

清华大学孙富春：大模型+机器人可能会导致失业，未来80%的人

...通用的方向发展。“大模型能提高机器人的交互能力、多模态融合感知与任务规划能力，能让机器人实现多任务，进而实现通用化。”孙富春表示。不过，这还需要做很多研究。比如大模型与知识图谱结合，提高机器人的推理能...……更多

2023-10-27 18:02:00富春,清华大学,清华,机器人,失业,人工

Infocomm China2024见闻：大家每天忙于开会，

...是人物讲话、视频内容、共享屏幕还是会议纪要，都是多模态大模型重要的信息来源。”今年，腾讯会议已经将其混元大模型能力融合到会议场景中，以类似于“AI助理”的方式呈现。不仅是腾讯会议，钛媒体还注意到，今年的I...……更多

2024-04-22 17:00:00见闻,会议,腾讯,模型,能力,场景

国内首个音视频多媒体大模型万兴“天幕”发布：支持AI剪辑

...伟1月30日，万兴科技正式发布了国内首个音视频多媒体大模型“天幕”。同时，公司宣布将设立大模型研发中心落户马栏山。据悉，“天幕”以音视频生成式AI技术为基础，支持全球不同语言，并引领了音视频创作闭环解决方案...……更多

2024-01-31 23:00:00音视,万兴,天幕,剪辑,模型,多媒体

百国百业联手深速达智能为数字农业插上智慧翅膀

...视角的音视频信息传输到部署于全球的视频集群,通过多模态识别技术,匹配跨模态的知识图谱,对自然语音和视频图像进行分析推理,并将推理结果实时推送给用户,进而构建人机混合的多方协作,实现人工智能的真正落地,赋能各行...……更多

2023-10-18 16:58:00速达,百业,翅膀,智慧,数字,智能

观薇智能“玄黄大模型”发布，展示AI+健康领域创新实力

...志力等嘉宾，共同开启中医中药+精准营养为垂直应用多模态大模型——“玄黄大模型”。玄黄大模型基于庞大语料词元预训练而成，学习了中国中医科学院中医药信息研究所整理的中医药知识图谱、文献医案，并结合了观薇智...……更多

2024-07-22 17:33:00玄黄,模型,实力,领域,智能,健康

Sora还未公测，“清华博士”李一舟卖AI课年赚5000万！

...表之一，李一舟何许人也？他的抖音介绍贴了几个标签：清华大学博士，三家科技公司创始人，融资数千万，职业经理人，擅长解决AI人工智能，商业模式，知识IP和流量问题。据科创板日报，记者了解发现，李一舟出自清华美...……更多

2024-02-21 20:21:00一舟,公测,清华,博士,一舟,课程

反击OpenAI，谷歌放出最强悍大模型Gemini

... CEO戴密斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

财经观察：提升人机交互效率多模态大模型易用性进一步推进

...晨，美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂（Mira Murati）介绍，GPT-4o可以接收文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合进行...……更多

2024-05-14 13:59:00进一,模态,易用,易用性,人机,模型

Claude 3大模型引起学界关注，业内人士：或将开启科研新

...网）包含三款能力逐级递增的模型，在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域，AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic，则是...……更多

2024-03-12 10:59:00范式,学界,业内人士,模型,业内,科研

智慧互通获批设立国家级博士后科研工作站大力推动产学研深度融合

...级别智能交通技术的世界级人工智能企业。公司专注于多模态感知、AI算法算力、自动化控制及多模态大模型技术等智能科学发展新范式的研发与应用，致力于为用户提供高级别智能交通产品全栈技术和解决方案，其人工智能产...……更多

2024-05-27 10:47:00博士后,工作站,深度,科研,博士,智慧

华为陈海永：创新引领5G-A话音网络演进之路

...G的VoLTE和5G的VoNR，本质都是语音、视频、文字等信息的单模态通信。当前，运营商话音业务正走入新通话时代，新通话在传统通话基础上叠加了高清、智能、交互的能力，通过多模态通信和AIGC带来语音到文字、语音到图片、语...……更多

2024-10-12 13:59:00华为,之路,话音,网络,华为,用户

多模态模型、短剧游戏盘中逆市走强，文娱传媒ETF涨0.11%

2月20日，三大股指低开，多模态模型、短剧游戏盘中逆市走强，截至10:23，文娱传媒ETF（516190）翻红涨0.11%，持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上，春节假期期间，OpenAI发布首个AI视频模型Sora，可生成长达60...……更多

2024-02-20 14:41:00模态,短剧,文娱,模型,传媒,文生

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

...为设计下一代专门用于推理的AI模型提供了概念框架。清华叉院姚期智、袁洋领衔这篇论文由清华交叉信息研究院姚期智、袁洋领衔，论文第一作者为张伊凡。张伊凡张伊凡2021年本科毕业于于北京大学元培学院，现为清华大学...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

AI视野：iPhone16将引入生成式AI；百度AI编程工具

...演模式。????‍????????????聚焦开发者清华系ChatGLM3发布，多模态挑战GPT-4V智谱AI发布了清华系ChatGLM3，全自研、适配国产芯片，多模态模型挑战GPT-4V，搭载国产Code Interpreter，实现代码交互能力。元象大模型向全社会开放元象信息科...……更多

2023-11-13 16:52:00编程工具,视野,生成,编程,工具,模型