• 我的订阅
  • 头条热搜
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。 可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾...……更多
透视一周牛熊股:沪指8连阳,90%个股周内上涨!Sora横空出世,最牛股维海德斩获6连板,周涨近150%
...均超60%。最牛股维海德6连板,属于计算机设备行业、多模态AI概念股:消息面上,龙年开年,OpenAI推出的文生视频模型Sora炸裂登场,视频领域迎来颠覆性变局。春节期间,英伟达官网推出了Chat With RTX,谷歌也宣布迭代出Gemini 1.5...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...生成领域取得了令人瞩目的进展。4月27日,生数科技联合清华大学在中关村论坛未来人工智能先锋论坛上发布了中国首个Sora级别的视频大模型Vidu,引发市场热议。4月28日,AIGC软件A股上市公司万兴科技宣布其国内首个音视频多媒体...……更多
...场”,上线了首批184部影视作品。据了解,腾讯自研的多模态长视频理解大模型,可实现对镜头、片段、视频的层级化剧情理解,且能够通过智能识别,自动找全需要补充解说的间隙,并生成画面描述的脚本初稿,供制作人员参...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
阿里通义听悟发布“高校公益计划”,向所有国内高校师生赠送500小时教育福利
...口语、做脑图音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。“作为一款工作...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...并得到最终反馈标签。之后,设计了一种基于ViT和T5X的多模态Transformer模型RAHF,使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图 使用卷积层和全连接层预测4个方面的评分 使用Trans...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...从不同角度筛选出了部分看好标的。如中国银河证券在多模态大模型方面推荐了万兴科技、科大讯飞等上市公司。华福证券在阅读场景方面推荐掌阅科技、荣信文化和中文在线三家公司。同花顺梳理的热门国产AI及其概念股中,掌...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
2023网易未来大会开幕 共话中国科技和AGI未来
...国脑科学计划的筹建者和推动者之一张建伟,发表了《多模态具身智能与未来机器人》主题演讲。他提出,大模型未来有四个发展趋势,包括多模态巨模型;重要应用中的高质量、稳定、可信;摆脱高计算成本;可解释。 知名...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
「衔远科技」,以ChatGPT助企业数智化创新
...的速度、提升爆款概率。领衔CIP平台,基于人工智能的多模态理解、推理与生成能力,通过深刻洞察消费者、场景、商品、品参、研发,并通过生成式人工智能帮助产品创新,并通过ProductGPT支持多轮对话,与专业人员深度交互...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
...及Pika和Runway等公司为代表的AI生视频技术持续革新,AI多模态能力持续演进,更广泛的应用场景如影视、游戏、营销、电商、教育等有望迎来生产工具层的革新,推动更高效且优质的内容创作。核心业务的应用场景有望受益的公...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
软件30ETF上涨2%,中证软件服务指数强势上涨
...浙商证券指出,近期OpenAI、谷歌、Meta等厂商相继发布多模态AI模型,在图像、音视频、以及具身智能等领域的能力取得突破。在多模态能力加持下,AI大模型有望在更广泛的细分行业及场景中发挥重大价值,AI商业化进程有望加...……更多
2月十大牛股出炉:克来机电超207%涨幅问鼎榜首
...。维海德在回复深交所关注函中表示,公司自主研发的多模态白平衡算法,并非是当前市场关注的与OpenAI相关的多模态AI大模型,多模态白平衡算法与多模态AI大模型存在本质区别。资料显示,维海德主要从事高清及超高清视频...……更多
视频大模型 快手美图殊途同归
...a早成立一个月,主要业务集中在图像、3D、视频等原生多模态大模型的研发。2024年4月,生数科技联合清华大学发布的视频大模型Vidu,支持一键生成16秒、分辨率1080P的高清视频内容。6月初,生数科技宣布,已完成数亿元Pre-A轮...……更多
2024年最值得关注的AIGC企业公布,中关村科金上榜
...户关注的重点领域、关键问题。围绕AI大模型+音视频+多模态交互三大数字时代的智能基础设施,聚焦知识平权、决策平权和体验平权“三大方向”,推出大模型落地的“八大应用”,即大模型+知识助手、大模型平台、大模型+人...……更多
我国自研视频大模型面向全球上线
...上手体验。Vidu的技术突破源于研发团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队在2022年就提出并持续开展自主研发。来源 新华社编辑 骆航念二审 杨韬三审 周文君 ……更多
谷歌之后,OpenAI也要给新闻网站付费了?
...,大模型愈发像人一样可以创作文字、图片、音视频等多模态内容。包含社交娱乐到工作学习等场景的内容生成,能力越来越强的大模型,将深刻改变未来世界。快速发展背后,大模型侵权问题频繁爆发。01今年4月末,包括《纽...……更多
更多关于科技的资讯:
本文转自:人民日报中国锦屏地下实验室——在极深地下探寻前沿领域(新春走基层·探访新质生产力)本报记者  王明峰  林  渊《人民日报》(2025年02月04日第 02 版)从四川西昌市驱车两个多小时
2025-02-04 05:45:00
效率提升20倍近日,记者走进杭州大雅信息科技有限公司(以下简称“大雅科技”),看到了一番忙碌的景象:设计师们正忙着出设计图
2025-02-04 08:00:00
日本“灾害级大雪”来袭:官方呼吁非必要不外出
快科技2月3日消息,就在今日,日本气象部门预报,该国多地4日起将遭遇今冬以来最强寒潮,部分地区恐出现“灾害级”强降雪。受强冷空气及冬季气压分布影响
2025-02-04 00:11:00
蛇年春节,我市消费市场一片红红火火,餐饮、文旅和影院作为传统的“三驾马车”依然强劲,而今年又有了生力军,在国补政策的加持下
2025-02-04 07:46:00
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
北京时间2月3日上午,OpenAI正式推出面向深度研究领域的智能体产品深度研究(Deep research)功能。 曾经一位经验丰富的行业分析师需要花费数天甚至数周才能完成的专业研究报告
2025-02-04 04:25:00
消防通道乱停阻碍出警:小区民众齐心协力掀翻两台车
2月3日消息,消防通道是“生命通道”,在火灾等紧急情况下,它能为消防救援提供便利,确保人员迅速疏散和消防车辆快速到达现场
2025-02-03 23:41:00
华硕官方解释Q-Release Slim快拆设计:方法正确不会损伤板卡
快科技2月3日消息,近日有用户反映质疑华硕的PCIe Q-Release Slim快拆设计方案不完善、存在缺陷,有可能会损伤显卡的金手指
2025-02-03 23:41:00
微软砍刀部发声:弃用Win11/10功能并不是终点
快科技2月3日消息,微软时不时会在其官方网站上宣布停用某项Windows功能或服务,而这些被弃用的功能通常是使用率太低
2025-02-03 22:41:00
印度、日本双双发射区域导航卫星:都是2025年的第一次
快科技2月3日消息,北京时间1月29日8点23分,印度使用GSLV-F15火箭成功发射了NVS-02区域导航卫星,而在4天后的2月2日16点30分
2025-02-03 17:40:00
《哪吒2》百万条锁链有多难做:特效老师电脑开机开了2个小时
快科技2月3日消息,《哪吒之魔童闹海》毫无意外拿下春节档票房冠军,影片爆火背后,是制作团队的用心。据悉,比起前作《哪吒之魔童闹海》整个故事更宏大
2025-02-03 18:10:00
D8888次动车出发!吉祥又霸气
快科技2月3日消息,对于国人来说,8、6都是吉利数字,连续出现更是吉利翻倍,今天就来看看超级吉祥、超级霸气的D8888次动车列车
2025-02-03 18:10:00
1nm工艺!曝台积电将建设全球最先进晶圆厂
快科技2月3日消息,最新报道称,全球最大晶圆代工厂台积电正计划在中国台湾台南建设一座拥有最先进1nm工艺节点制程技术产线的晶圆厂
2025-02-03 18:10:00
全网最低价!百度智能云上线DeepSeek-R1/V3:还有限时免费
快科技2月3日消息,今天百度智能云正式宣布DeepSeek-R1和DeepSeek-V3模型已在百度智能云千帆平台上架
2025-02-03 19:10:00
活久见!美国超市冷藏柜拉出一只活狼:现场群众无不吃惊
快科技2月3日消息,世界之大,无奇不有,近日,美国芝加哥Aldi超市发布公告称,超市冷藏柜中有只狼,当警方赶到现场后用工具将狼抓住
2025-02-03 19:40:00
阿里云支持一键部署DeepSeek-V3/R1!仅需3步、0代码
快科技2月3日消息,今天阿里云宣布,阿里云PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1
2025-02-03 19:40:00