• 我的订阅
  • 头条热搜
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...或将发挥在国产视频大模型的“鲇鱼效应”,激励国产多模态大模型突破创新。 可见,万兴科技天幕大模型的能力表现与之相比仍有一定差距。但也有声音认为,国产视频生成模型仍处于初级阶段,早期效果不佳可以理解。艾...……更多
透视一周牛熊股:沪指8连阳,90%个股周内上涨!Sora横空出世,最牛股维海德斩获6连板,周涨近150%
...均超60%。最牛股维海德6连板,属于计算机设备行业、多模态AI概念股:消息面上,龙年开年,OpenAI推出的文生视频模型Sora炸裂登场,视频领域迎来颠覆性变局。春节期间,英伟达官网推出了Chat With RTX,谷歌也宣布迭代出Gemini 1.5...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
Vidu再燃AI视频生成赛道 万兴天幕加速音视频大模型应用落地
...生成领域取得了令人瞩目的进展。4月27日,生数科技联合清华大学在中关村论坛未来人工智能先锋论坛上发布了中国首个Sora级别的视频大模型Vidu,引发市场热议。4月28日,AIGC软件A股上市公司万兴科技宣布其国内首个音视频多媒体...……更多
火山引擎的云长什么样,看看这场大会就知道
...邀请函。尽管对科技圈人士来说,这已经是比较普遍的多模态生成技术的应用了,市面上基于AI算法、输入文字或图片即可生成相应的高质量图片的产品并不少,但火山引擎的优势在于这一智能绘图产品性能更强可以更快速的出...……更多
小红书布局大模型:多媒体算法负责人牵头、上线AI绘画应用 | Long China 50独家
...负责AI和音视频算法方向。在更早期,他还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。除了成立大模型团队以外,36氪了解到,小红书内部还有多个独立部门同时推进AIGC方向的落地探索。今年4月份,小红书...……更多
...场”,上线了首批184部影视作品。据了解,腾讯自研的多模态长视频理解大模型,可实现对镜头、片段、视频的层级化剧情理解,且能够通过智能识别,自动找全需要补充解说的间隙,并生成画面描述的脚本初稿,供制作人员参...……更多
阿里通义听悟发布“高校公益计划”,向所有国内高校师生赠送500小时教育福利
...口语、做脑图音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。“作为一款工作...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
苏州科达:AI已成为公司产品和解决方案竞争力重要组成部分
...代表的大模型时代的来临和语音、文字、图像与视频等多模态AI技术快速崛起,将带来更广泛的数据形态、更丰富的应用场景和更深入的应用体验。在音视频数据训练、小样本行为识别、垂直行业知识应用等领域,大模型和多模...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...并得到最终反馈标签。之后,设计了一种基于ViT和T5X的多模态Transformer模型RAHF,使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图 使用卷积层和全连接层预测4个方面的评分 使用Trans...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...从不同角度筛选出了部分看好标的。如中国银河证券在多模态大模型方面推荐了万兴科技、科大讯飞等上市公司。华福证券在阅读场景方面推荐掌阅科技、荣信文化和中文在线三家公司。同花顺梳理的热门国产AI及其概念股中,掌...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
2023网易未来大会开幕 共话中国科技和AGI未来
...国脑科学计划的筹建者和推动者之一张建伟,发表了《多模态具身智能与未来机器人》主题演讲。他提出,大模型未来有四个发展趋势,包括多模态巨模型;重要应用中的高质量、稳定、可信;摆脱高计算成本;可解释。 知名...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
...及Pika和Runway等公司为代表的AI生视频技术持续革新,AI多模态能力持续演进,更广泛的应用场景如影视、游戏、营销、电商、教育等有望迎来生产工具层的革新,推动更高效且优质的内容创作。核心业务的应用场景有望受益的公...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
「衔远科技」,以ChatGPT助企业数智化创新
...的速度、提升爆款概率。领衔CIP平台,基于人工智能的多模态理解、推理与生成能力,通过深刻洞察消费者、场景、商品、品参、研发,并通过生成式人工智能帮助产品创新,并通过ProductGPT支持多轮对话,与专业人员深度交互...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
腾讯云智能媒体AI中台3.0全新升级!助力媒资高效管理、内容生产
...、泛化性更高。同时全面升级智能检索能力,不仅支持多模态检索,还支持对于图片、视频、文稿等媒资素材的跨模态检索。腾讯云智能传媒行业负责人韩利明表示:“AI大模型等技术发展被普遍关注,其在传媒领域也拥有广泛...……更多
软件30ETF上涨2%,中证软件服务指数强势上涨
...浙商证券指出,近期OpenAI、谷歌、Meta等厂商相继发布多模态AI模型,在图像、音视频、以及具身智能等领域的能力取得突破。在多模态能力加持下,AI大模型有望在更广泛的细分行业及场景中发挥重大价值,AI商业化进程有望加...……更多
更多关于科技的资讯:
英伟达 Jim Fan 预测未来 2-3 年机器人领域迎来“GPT-3 时刻”
IT之家 9 月 19 日消息,科技媒体 The Decoder 昨日(9 月 18 日)发布博文,报道称英伟达高级科学家 Jim Fan 预测
2024-09-20 10:00:00
距离一年一度的11.11还有两个月的时间,为支持京东平台商家将更多优惠让利给用户,同时保证用户更便捷舒适的购物体验,免费上门退换将全面降低运费险价格
2024-09-20 10:15:00
“7 思妙饷” 梦饷科技宣布运营三大升级破解私域增长迷局
今天(9月19日),梦饷科技举行“7 思妙饷”盛典活动,与各界嘉宾、合作伙伴等上千人探讨行业增长方向,共商未来高质量发展之路
2024-09-20 10:23:00
微信朋友圈能发实况照片了!网友:为啥我不行?
9月19日,微信派公众号发布信息:微信朋友圈可以发实况照片了!发布流程为:打开朋友圈-从手机相册选择,即可选中并发布实况照片
2024-09-20 10:25:00
Anthropic 预告将推新 Claude AI 桌面应用
IT之家 9 月 19 日消息,科技媒体 testingcatalog 昨日(9 月 18 日)发布博文,报道称 Anthropic 公司正准备推出全新的 Claude AI 桌面应用
2024-09-20 12:05:00
Hawk Point 有望再战一年:AMD 被曝计划明年推出锐龙 200 处理器
IT之家 9 月 19 日消息,消息博主 @金猪升级包 昨晚爆料称,AMD 计划将现有的锐龙 8040“Hawk Point”系列 APU 于明年改名为不属于锐龙 AI 家族的锐龙 200 系列马甲处理器继续售卖
2024-09-20 13:31:00
新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式
IT之家 9 月 19 日消息,科技媒体 testingcatalog 昨日(9 月 18 日)发布博文,报道称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式
2024-09-20 13:31:00
导航APP怎么知道红灯即将变绿?
随着科技的不断进步,现代交通系统正在经历一场前所未有的变革。其中,智能交通管理系统正在逐渐成为未来交通发展的重要方向。许多导航APP的用户都注意过这件事
2024-09-20 13:32:00
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max
2024-09-20 13:33:00
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
几天前 OpenAI 新模型 o1 的发布,再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”
2024-09-20 13:33:00
AI探索宇宙结构新突破!超精准场级模拟,半秒完成冷暗物质仿真
【新智元导读】AI开启模拟宇宙!近日,来自马克斯·普朗克研究所等机构,利用宇宙学和红移依赖性对宇宙结构形成进行了场级仿真
2024-09-20 13:34:00
重磅!国产AI写作模型比ChatGPT强1000%,360前员工AI团队取得重大突破
AI办公写作赛道迎来重磅 “炸场” 级产品!近日,360前员工的AI团队耗时半年打磨的创业项目——厉害猫AI,正式亮相
2024-09-20 13:35:00
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
看一眼菜品图就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis
2024-09-20 13:35:00
硕博招生!AI排名跻身前15,全球首所人工智能大学MBZUAI实力大增
全世界第一所人工智能大学 MBZUAI 全球招贤纳才。自 2019 年 10 月成立以来,全球第一所人工智能大学 MBZUAI 便吸引了整个学术界的关注
2024-09-20 13:36:00
突发,CPU公司被曝考虑卖身!
芯东西9月20日消息,据外媒昨日报道,CPU领域的新生代、Arm阵营的明星服务器CPU公司Ampere Computing
2024-09-20 13:36:00