• 我的订阅
  • 头条热搜
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。 可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾...……更多
透视一周牛熊股:沪指8连阳,90%个股周内上涨!Sora横空出世,最牛股维海德斩获6连板,周涨近150%
...均超60%。最牛股维海德6连板,属于计算机设备行业、多模态AI概念股:消息面上,龙年开年,OpenAI推出的文生视频模型Sora炸裂登场,视频领域迎来颠覆性变局。春节期间,英伟达官网推出了Chat With RTX,谷歌也宣布迭代出Gemini 1.5...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...生成领域取得了令人瞩目的进展。4月27日,生数科技联合清华大学在中关村论坛未来人工智能先锋论坛上发布了中国首个Sora级别的视频大模型Vidu,引发市场热议。4月28日,AIGC软件A股上市公司万兴科技宣布其国内首个音视频多媒体...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多
...场”,上线了首批184部影视作品。据了解,腾讯自研的多模态长视频理解大模型,可实现对镜头、片段、视频的层级化剧情理解,且能够通过智能识别,自动找全需要补充解说的间隙,并生成画面描述的脚本初稿,供制作人员参...……更多
阿里通义听悟发布“高校公益计划”,向所有国内高校师生赠送500小时教育福利
...口语、做脑图音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。“作为一款工作...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...并得到最终反馈标签。之后,设计了一种基于ViT和T5X的多模态Transformer模型RAHF,使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图 使用卷积层和全连接层预测4个方面的评分 使用Trans...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...从不同角度筛选出了部分看好标的。如中国银河证券在多模态大模型方面推荐了万兴科技、科大讯飞等上市公司。华福证券在阅读场景方面推荐掌阅科技、荣信文化和中文在线三家公司。同花顺梳理的热门国产AI及其概念股中,掌...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
2023网易未来大会开幕 共话中国科技和AGI未来
...国脑科学计划的筹建者和推动者之一张建伟,发表了《多模态具身智能与未来机器人》主题演讲。他提出,大模型未来有四个发展趋势,包括多模态巨模型;重要应用中的高质量、稳定、可信;摆脱高计算成本;可解释。 知名...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
「衔远科技」,以ChatGPT助企业数智化创新
...的速度、提升爆款概率。领衔CIP平台,基于人工智能的多模态理解、推理与生成能力,通过深刻洞察消费者、场景、商品、品参、研发,并通过生成式人工智能帮助产品创新,并通过ProductGPT支持多轮对话,与专业人员深度交互...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
...及Pika和Runway等公司为代表的AI生视频技术持续革新,AI多模态能力持续演进,更广泛的应用场景如影视、游戏、营销、电商、教育等有望迎来生产工具层的革新,推动更高效且优质的内容创作。核心业务的应用场景有望受益的公...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会,在“人工智能+”主题馆吸引众多市民驻足围观体验。AI(人工智能)已经在深刻影响着我们的生活,也影响和改变着内容创作行业。作为在线音...……更多
软件30ETF上涨2%,中证软件服务指数强势上涨
...浙商证券指出,近期OpenAI、谷歌、Meta等厂商相继发布多模态AI模型,在图像、音视频、以及具身智能等领域的能力取得突破。在多模态能力加持下,AI大模型有望在更广泛的细分行业及场景中发挥重大价值,AI商业化进程有望加...……更多
更多关于科技的资讯:
长春巨型“充电宝”并网投运
本文转自:人民日报海外版《人民日报海外版》(2024年12月27日第 02 版)在国网长春供电公司积极推进建设下,吉林长春五棵树220千伏变电站内的磷酸铁锂储能电站项目日前顺利并网投运
2024-12-27 04:38:00
企元数智免费小程序:企业内容营销的破局利刃
一、企元数智免费小程序——企业营销的新曙光在当今数字化浪潮的席卷下,企业营销领域正经历着深刻的变革与激烈的竞争。众多企业纷纷陷入营销困境
2024-12-27 05:44:00
企元数智免费小程序:开启企业智能客服升级新篇章
在数字化浪潮汹涌澎湃的当下,企业的服务质量和效率成为了竞争的关键利器。客户对于快速、准确、个性化服务的期望日益攀升,传统客服模式在应对这一挑战时显得力不从心
2024-12-27 05:50:00
解析企元数智免费小程序如何增强企业用户粘性
在当今数字化商业浪潮中,用户粘性已成为企业能否持续发展壮大的关键因素之一。而企元数智免费小程序的出现,为企业提升用户粘性提供了一条创新且高效的途径
2024-12-27 05:54:00
本文转自:人民日报江苏推进“智改数转网联”,累计实施改造项目约5.6万个给工厂装“大脑”  让产线上“云端”(高质量发展看亮点·走一线)本报记者  王伟健核心阅读上门诊断
2024-12-27 06:15:00
2.0版本“上新”!海量信息触手可及 “解锁”一张指尖上的就业地图
从手绘纸卷到数字影像,地图从来都不只是地理标识,而是探索未知、追逐梦想的指南。在今日的杭州,就有一张特殊的地图,它不绘于纸张
2024-12-27 07:02:00
2024年,杭州产业发展热潮涌动,新旧动能转换澎湃有力。人形机器人、智能网联车、《黑神话·悟空》、演唱会、新生代杭商……一个个充满活力的“细胞”
2024-12-27 07:02:00
马斯克的“省钱大师”登陆华盛顿:正为美国政府效率部招兵买马
综合多家媒体报道,埃隆·马斯克的长期副手史蒂夫·戴维斯(Steve Davis)正帮助美国拟设立的“政府效率部”招聘员工
2024-12-27 07:07:00
复旦教授呼吁年轻人减少欲望:过度追求易陷入不满与失落的循环
12月27日消息,近日,复旦教授梁永安在演讲中呼吁年轻人减少欲望,强调个人欲望减法对社会做加法的重要性,引发广泛关注。当下
2024-12-27 07:07:00
郭有才说走红像“做梦一样”:爆红是一种偶然
12月27日消息,据媒体报道,因翻唱《诺言》出圈,郭有才上半年走入了流量中心。半年多过去后,郭有才在接受采访时表示,他走红像“做梦一样”
2024-12-27 07:07:00
怎么找工作、领补贴?杭州就业创业一张图帮到你
制图 刘婧楠近日,杭州拿下重量级大奖——中国年度最佳促进就业城市。这是一个综合评定政府就业服务水平的奖项,从城市就业人口情况
2024-12-27 07:33:00
iPhone SE 4领衔!苹果2025上半年新品爆发:5款大作已在路上
快科技12月27日消息,据媒体报道,尽管iPhone通常在9月份亮相,但在2025年上半年,苹果将带来包括iPhone在内的5款重磅新品
2024-12-27 07:37:00
70岁董明珠谈从格力退休:股民、员工都不想我退休
快科技12月27日消息,日前,格力电器董事长董明珠与新浪财经CEO邓庆旭对话时再次谈及了“明年是否会退休”的话题。邓庆旭表示
2024-12-27 07:37:00
理想同学上架苹果App Store、小米应用商店:语音交互丝滑如真人 识物秒懂
快科技12月27日消息,理想同学App今日正式上架苹果App Store和小米应用商店,其他安卓应用商店预计将陆续上架
2024-12-27 07:37:00
中国什么时候可以100%用自动驾驶 李想:给我三年的时间!
快科技12月26日消息,今晚,在2024理想AI Talk对话节目中,当主持人问及“什么时候可以100%用自动驾驶”时
2024-12-26 21:07:00