• 我的订阅
  • 头条热搜
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。 可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾...……更多
透视一周牛熊股:沪指8连阳,90%个股周内上涨!Sora横空出世,最牛股维海德斩获6连板,周涨近150%
...均超60%。最牛股维海德6连板,属于计算机设备行业、多模态AI概念股:消息面上,龙年开年,OpenAI推出的文生视频模型Sora炸裂登场,视频领域迎来颠覆性变局。春节期间,英伟达官网推出了Chat With RTX,谷歌也宣布迭代出Gemini 1.5...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...究团队及其合作者旨在为足球视频理解开发一个全面的多模态框架。具体来说,他们做出了以下贡献:(1)他们提出了 SoccerReplay-1988,这是迄今为止最大的多模态足球数据集,其中包括来自 1988 场完整比赛的视频和详细注释,...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
数智技术赋能产业发展 湘江实验室再发布10项科技创新产品
...机器人解决了机器人在“场景理解、大模型任务规划、多模态持续学习”等方面技术瓶颈,在家庭服务领域开展了成功应用,达到国内领先水平;湘江翼航低空智能无人值守蜂巢平台突破多机蛙跳、无人机系留及高速图数同传等...……更多
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...生成领域取得了令人瞩目的进展。4月27日,生数科技联合清华大学在中关村论坛未来人工智能先锋论坛上发布了中国首个Sora级别的视频大模型Vidu,引发市场热议。4月28日,AIGC软件A股上市公司万兴科技宣布其国内首个音视频多媒体...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多
...场”,上线了首批184部影视作品。据了解,腾讯自研的多模态长视频理解大模型,可实现对镜头、片段、视频的层级化剧情理解,且能够通过智能识别,自动找全需要补充解说的间隙,并生成画面描述的脚本初稿,供制作人员参...……更多
阿里通义听悟发布“高校公益计划”,向所有国内高校师生赠送500小时教育福利
...口语、做脑图音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。“作为一款工作...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...并得到最终反馈标签。之后,设计了一种基于ViT和T5X的多模态Transformer模型RAHF,使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图 使用卷积层和全连接层预测4个方面的评分 使用Trans...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...从不同角度筛选出了部分看好标的。如中国银河证券在多模态大模型方面推荐了万兴科技、科大讯飞等上市公司。华福证券在阅读场景方面推荐掌阅科技、荣信文化和中文在线三家公司。同花顺梳理的热门国产AI及其概念股中,掌...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
全球顶尖人工智能科学家加盟 阿里AI To C业务布局再提速
...出任阿里集团副总裁,向吴嘉汇报,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。近期,阿里AI To C业务大动作频频,引入世界级顶尖人才,组建顶级AI算法研究和工程团队,将进一步刷新国内AI应用赛道...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
2023网易未来大会开幕 共话中国科技和AGI未来
...国脑科学计划的筹建者和推动者之一张建伟,发表了《多模态具身智能与未来机器人》主题演讲。他提出,大模型未来有四个发展趋势,包括多模态巨模型;重要应用中的高质量、稳定、可信;摆脱高计算成本;可解释。 知名...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
「衔远科技」,以ChatGPT助企业数智化创新
...的速度、提升爆款概率。领衔CIP平台,基于人工智能的多模态理解、推理与生成能力,通过深刻洞察消费者、场景、商品、品参、研发,并通过生成式人工智能帮助产品创新,并通过ProductGPT支持多轮对话,与专业人员深度交互...……更多
科技巨头齐聚MEET2025:共话AI、Agent、具身智能机器人等浪潮趋势
...自今年年初OpenAI旗下视频生成模型Sora惊艳亮相以来,多模态大模型和生成技术便迅速成为了科技界和产业界竞相追逐的风口赛道。在多模态大模型的推动下,AI技术不再局限于单一的数据形式或应用场景,而是能够跨越文本、图...……更多
更多关于科技的资讯:
倒计时3天!小米汽车宣布将在SU7 Ultra发布会前关闭小定通道
快科技2月24日消息,小米汽车即将在2月27日晚7点举行小米SU7 Ultra的发布会,并宣布届时将关闭小订通道。雷军此前在微博表示
2025-02-24 21:03:00
号称能缓解高血压!老人2万买治疗仪竟把自己电到头疼
2月24日消息,据媒体报道,一位陈姓老人称,他花费19300元购买了一台高电位治疗仪,销售称这台仪器可以缓解高血压、糖尿病
2025-02-24 21:03:00
时评 | 从演出经济看城市的“流量密码”
一场演唱会带火一座城,一场音乐节激活一片海……2月22日,除了连唱三天的“张学友60+”巡回演唱会外,汽水音乐海边派对也在海口同时上演
2025-02-24 21:23:00
iPhone 17系列外观引发争议!苹果设计师太激进
近日,爆料者Majin Bu在社交平台上公布了据称是iPhone 17系列的CAD设计图,揭示了苹果即将推出的新机型的一些关键设计细节
2025-02-24 21:33:00
这才是真正的生产力工具!OPPO Find N5远控Mac实测
移动办公早已不是什么新鲜事。随着移动办公的普及,全球近9亿人群正从传统办公模式逐步向移动化、智能化转型。尤其是2025年
2025-02-24 21:33:00
胎儿全身发白 竞因给妈妈“倒输血”:病例罕见
2月24日消息,据媒体报道,一位妈妈遭遇罕见的胎母输血综合征,腹中胎儿持续“倒输血”给母亲。孩子出生后,其皮肤非常白,可能有严重贫血
2025-02-24 21:33:00
为原生鸿蒙而生 华为首款新形态手机到底会是什么样
在春节前,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东向外界透露了一个重磅消息,他表示华为会在3月份发布一款打破常规
2025-02-24 21:33:00
深圳一企业员工如厕须带“离岗证”:每次不超过7分钟
2月24日消息,据媒体报道,有网友反映,他之前就职的深圳一家公司限制员工上厕所的时间和次数。该网友称,这家公司要求每个员工4小时只能去2次
2025-02-24 21:33:00
深圳机场加快拓展人工智能全场景应用
本文转自:人民网人民网深圳2月24日电 (王星)近日,深圳机场在深圳市国资委指导下,完成人工智能大模型“Deep Seek R1”本地化部署
2025-02-24 21:45:00
曝小米15 Ultra将于3月18日在印度发布,小米15首当其冲沦为百元机
之前,小米官方就已经对外预告过,小米15系列,其中涵盖了全新的小米15Ultra,将会在3月2日的MWC2025上进行全球范围的发布
2025-02-24 21:47:00
博主称iPhone 17和16几乎没有区别,iPhone 15沦为千元机改写历史
近日,有博主指出,单从外观以及材质这两方面来看的话,iPhone17和iPhone16之间好像并没有太大的差别,它们在工艺以及内部结构方面都颇为相似
2025-02-24 21:47:00
曝华为今年独占技术很多,Pura70现感人价花粉直呼亮瞎眼!
有一位数码博主发布文章透露了相关消息,称华为在今年所拥有的独占技术数量比较多,甚至比之前预期的还要更多一些。按照相关爆料信息来看
2025-02-24 21:48:00
博主:厂商想要学华为得花大成本,Mate60价比千元机遭疯抢!
每当华为推出新机的时候,总是能够为大家带来令人眼前一亮的新技术。就拿去年来说,Mate70系列搭载了业界首发的红枫原生影像技术
2025-02-24 21:48:00
卢伟冰爆料小米未来发布会直播,小米15沦为百元机米粉直呼不敢看
2月22日晚,小米集团合伙人、总裁,同时身兼手机部总裁以及小米品牌总经理的卢伟冰开启了一场直播,在直播过程中,透露了诸多关于即将举办的发布会里新品的相关消息
2025-02-24 21:50:00
三星S25 Edge真机视频泄露,S24低至千元网友直呼不敢看
近日,网络上的一段视频,让我们第一次得以看到三星S25Edge设备实际的表现情况,同时也知晓了关于这款手机的一些颇具价值的细节内容
2025-02-24 21:51:00