• 我的订阅
  • 头条热搜
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。 可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾...……更多
透视一周牛熊股:沪指8连阳,90%个股周内上涨!Sora横空出世,最牛股维海德斩获6连板,周涨近150%
...均超60%。最牛股维海德6连板,属于计算机设备行业、多模态AI概念股:消息面上,龙年开年,OpenAI推出的文生视频模型Sora炸裂登场,视频领域迎来颠覆性变局。春节期间,英伟达官网推出了Chat With RTX,谷歌也宣布迭代出Gemini 1.5...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...究团队及其合作者旨在为足球视频理解开发一个全面的多模态框架。具体来说,他们做出了以下贡献:(1)他们提出了 SoccerReplay-1988,这是迄今为止最大的多模态足球数据集,其中包括来自 1988 场完整比赛的视频和详细注释,...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...生成领域取得了令人瞩目的进展。4月27日,生数科技联合清华大学在中关村论坛未来人工智能先锋论坛上发布了中国首个Sora级别的视频大模型Vidu,引发市场热议。4月28日,AIGC软件A股上市公司万兴科技宣布其国内首个音视频多媒体...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多
...场”,上线了首批184部影视作品。据了解,腾讯自研的多模态长视频理解大模型,可实现对镜头、片段、视频的层级化剧情理解,且能够通过智能识别,自动找全需要补充解说的间隙,并生成画面描述的脚本初稿,供制作人员参...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
阿里通义听悟发布“高校公益计划”,向所有国内高校师生赠送500小时教育福利
...口语、做脑图音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。“作为一款工作...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...并得到最终反馈标签。之后,设计了一种基于ViT和T5X的多模态Transformer模型RAHF,使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图 使用卷积层和全连接层预测4个方面的评分 使用Trans...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...从不同角度筛选出了部分看好标的。如中国银河证券在多模态大模型方面推荐了万兴科技、科大讯飞等上市公司。华福证券在阅读场景方面推荐掌阅科技、荣信文化和中文在线三家公司。同花顺梳理的热门国产AI及其概念股中,掌...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
2023网易未来大会开幕 共话中国科技和AGI未来
...国脑科学计划的筹建者和推动者之一张建伟,发表了《多模态具身智能与未来机器人》主题演讲。他提出,大模型未来有四个发展趋势,包括多模态巨模型;重要应用中的高质量、稳定、可信;摆脱高计算成本;可解释。 知名...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
科技巨头齐聚MEET2025:共话AI、Agent、具身智能机器人等浪潮趋势
...自今年年初OpenAI旗下视频生成模型Sora惊艳亮相以来,多模态大模型和生成技术便迅速成为了科技界和产业界竞相追逐的风口赛道。在多模态大模型的推动下,AI技术不再局限于单一的数据形式或应用场景,而是能够跨越文本、图...……更多
「衔远科技」,以ChatGPT助企业数智化创新
...的速度、提升爆款概率。领衔CIP平台,基于人工智能的多模态理解、推理与生成能力,通过深刻洞察消费者、场景、商品、品参、研发,并通过生成式人工智能帮助产品创新,并通过ProductGPT支持多轮对话,与专业人员深度交互...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
...及Pika和Runway等公司为代表的AI生视频技术持续革新,AI多模态能力持续演进,更广泛的应用场景如影视、游戏、营销、电商、教育等有望迎来生产工具层的革新,推动更高效且优质的内容创作。核心业务的应用场景有望受益的公...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
更多关于科技的资讯:
顶配2.9万!AMD锐龙9 9955HX3D游戏本可能要等4月初
快科技2月4日消息,AMD年初发布了面向高端游戏本的锐龙9000HX系列处理器,其中旗舰型号为锐龙9 9955X3D,第二次在移动端集成3D缓存
2025-02-04 21:41:00
ASML CEO:DeepSeek成功不代表芯片管制没效果
快科技2月4日消息,据媒体报道,ASML的CEO Christophe Fouquet近日表示,中国AI公司DeepSeek的成功显示了企业在面对AI市场时
2025-02-04 21:41:00
RTX 5090/5080还没买到 RTX 5070 Ti这就来了!大杀器
快科技2月4日消息,RTX 5090/D、RTX 5080虽然上市了,但能买到的人寥寥无几,而后续新卡正在接连不断地赶来
2025-02-04 22:41:00
年龄越大越健忘 其实这是大脑在不断进步
很多人认为,遗忘本身不是一件好事,我们应当尽可能将所有事情铭记于心。但实际上,“遗忘”是大脑具备的重要功能之一。可以说
2025-02-04 23:11:00
RTX 5090被黄牛炒至天价!网友想妙招对付抢购机器人
快科技2月4日消息,NVIDIA最新推出的RTX 5090和RTX 5080显卡在全球范围内都是一卡难求,由于供应有限
2025-02-04 23:11:00
微软推出新款Surface USB4扩展坞:轻至206克
快科技2月4日消息,据报道,微软近期发布了新款Surface USB4扩展坞,定价为199.99美元(大约相当于1450
2025-02-04 23:41:00
限时观测!就在明晚 月面X要现身了
2月5日,正月初八,天宇将迎来一轮上弦月。如果你抬头望向月亮,会发现月球表面浮现出类似字母“X”的光影,这也是今年第一场“月面X”
2025-02-04 23:41:00
任天堂谈Switch 2供应:我们正在为发售做充分准备
据外媒nintendoeverything报道,任天堂社长古川俊太郎在日前公布的财务报告里简要评论了Switch 2在今年晚些时候发售时的供应情况
2025-02-04 23:41:00
三星电子:Q1开始供应供应改良版HBM3E
快科技2月4日消息,据报道,预计从第二季度开始,三星电子改良版HBM3E的供应量将迎来全面增长,这一趋势与美国政府实施的尖端半导体出口管制政策紧密相关
2025-02-05 00:11:00
日本核电站中央控制室发生火灾:未对发射线管理区域外造成影响
快科技2月4日消息,据报道,当地时间2月4日,日本原子力发电公司发布紧急通报,指出当天下午,位于茨城县东海村的东海第二核电站中央控制室突发火灾
2025-02-05 00:11:00
能打过RTX 5070 Ti吗!AMD RX 9070系列2月底纸面发布
快科技2月5日消息,AMD原本计划在1月份就发布新一代RX 9070系列显卡,但因为性能、价格多方面的因素而被迫推迟,官方确认要到3月份才会上市(传闻到3月底)
2025-02-05 00:41:00
太疯狂了!高中生成功实现在PDF中运行Linux
快科技2月4日消息,在不久前,一位国外的高中生成功将1993年发布的射击名作《毁灭战士》移植到了PDF文件中,直接用浏览器打开文件就能玩
2025-02-05 00:41:00
一周打赏20万!各个品牌为做“榜一大哥”正在疯狂撒钱
顶流直播间刷礼物可以有多猛?5 分钟左右,接近 30 个嘉年华。按照一个嘉年华 3000 元一个计算,9 万,这满屏都是金钱燃烧的味儿 ↓ ↓如此高频的礼物刷屏
2025-02-05 00:41:00
为什么人类的耳朵不会动:2500万年前就消失了
很多动物都会竖起耳朵来倾听,这个时候它们通常看起来十分警惕,例如猫、狗和鹿都是如此。其实,如果您仔细观察的话,那么您会发现这些动物的耳朵不仅仅会竖起来
2025-02-05 00:41:00
我敢打赌 今年一定会有人买错电脑!万分谢谢Intel、AMD
虽说NVIDIA确实抢了不少风头,但隔壁 AMD 和 Intel 的新品,当然也都有关注。这篇文章就是来和大家聊聊,今年这两家的新处理器的
2025-02-05 01:11:00