• 我的订阅
  • 头条热搜
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...2024年迎来基础大模型的关键之年早在1956年夏天,计算机科学家约翰·麦卡锡(John McCarthy)等人在具有传奇色彩的“达特茅斯会议”上创造“人工智能”这个术语,被认为标志着 AI 技术的正式诞生。之后半个世纪当中,计算机技...……更多
本周(4.8-4.14)AI界发生了什么?
...,曾任谷歌大脑深度学习项目创始人兼负责人、百度首席科学家、斯坦福大学人工智能实验室主任。OpenAI解雇两名核心团队成员4月12日,据The Information,近期两名OpenAI的研究员因涉嫌泄露机密信息而遭到解雇。其中一位是OpenAI ...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年是国内大语言模型狂飙的元年。2024年,OpenAI携可生成60秒视频的模型Sora再次...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...AI搜索,相比New Bing搜索和谷歌AI搜索,它的最大特色是多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...大学人工智能研究院副院长、生数科技联合创始人兼首席科学家朱军教授发布了长时长、高一致性、高动态性视频大模型Vidu,可以一键生成长达16秒的视频。此次技术更新,Vidu视频最长可以生成32秒。2024年,整个大模型赛道经...……更多
AI音乐创作、水墨画、3D空间重建、6DoF,腾讯多媒体实验室领先技术亮相数贸会
...。”腾讯云副总裁、腾讯多媒体实验室负责人、腾讯杰出科学家刘杉博士表示。返回搜狐,查看更多责任编辑: ……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...这个领域迎来了新的投资人:1972年,汇聚了该领域顶尖科学家的P/DP小组在犹他大学成立,标志着计算机图形学的研究重心从麻省理工学院逐渐转向了西海岸,好莱坞开始持续在这一领域投入资金,著名的3D艺术品“犹他茶壶”...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...智能技术,需要全社会不断地对它加深认知,需要政府、科学家、企业、媒体、资本等共同参与,这样才能促使其获得更好的良性发展。 据悉,「灵动AI」目前已上线近千个商品图场景,初步形成AI工具矩阵。由于拥有特定风格...……更多
视频生成群雄逐鹿,哪些重要问题待解?
...业。 曾任领域知名人工智能(自然语言处理)企业首席科学家,中国科学院副主任(2012),多个国家科技重大专项课题负责人。中国与美国发明专利软件著作权约70+项(约50+项发明专利已授权)。著有《Sora大模型技术精要—...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...系。此外,他们还将打造地理科研协作大平台,为每一位科学家和科研团队提供专属的地理大模型服务,通过共享数据、模型与研究思路等方式促进全球范围内的科研合作与知识交流,共同推动地理科学的繁荣发展。【本文结束...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...那么广为人知,但资格杠杠的——图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun),联合纽约大学等在今年6月推出。号称是“全球首个无法作弊的LLM基准测试”。而这次冷不丁杀出来的黑马,其实比较熟悉国内大模型竞争格局...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...做呢,月之暗面Kimi发布视觉思考模型k1;腾讯微信推出多模态大模型POINTS1.5;巨人网络发布千影有声游戏生成大模型,还有不胜枚举的初创公司带着自家模型的新进展试图刷个脸熟。所以呢,豆包又又又更新了。(图源:雷科技...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被...……更多
我国自研视频大模型面向全球上线
...布。清华大学人工智能研究院副院长、北京生数科技首席科学家朱军介绍,Vidu具有“长时长、高一致性、高动态性”的特点,可根据文字和图片生成高清视频,且能保持高流畅、高动态的画面效果。截至目前,Vidu可支持一次性...……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...社交音乐舞蹈类AIGC应用 具体来说,鹦鹉人是一款基于多模态AI大模型PARO构建的,聚焦虚拟数字人形象、虚拟唱歌、虚拟舞蹈、虚拟陪伴和语聊的消费级AIGC应用。用户上传照片后,即可在鹦鹉人APP中生成个性化的3D虚拟形象。系...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。在产品能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至9月,豆包语言模型的日均token...……更多
全面AIGC时代,豆包模型家族准备好了
...片、音乐、视频的AIGC全家桶共计13款模型,不断增加各类模态,并进入规模化调用时代。在4个月2次迭代的过程中,据火山引擎披露,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
...危及患者信息安全、有损算法的可信度等。世卫组织首席科学家杰里米·法勒说,生成式人工智能技术具有改善医疗保健水平的潜力,但前提是研发、监管和使用这些技术的人必须识别并充分考虑相关风险。人们需要透明的信息...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
AI视频新战场:字节对决快手、反击Sora
...早。2023年8月,该公司上线首个大语言模型“豆包”及多模态大模型BuboGPT。其抖音云雀大模型通过首批《生成式人工智能服务管理暂行办法》备案,面向公众开放;字节跳动基础模型发力语言和图像两种模态方向。而在AI应用层...……更多
今年 WISE大会的“AIGC”含量有多高?超有料揭秘提前看
...自动化、智能化的方式,将文本、图像、音频、视频等多模态数据重新组合,创造全新和从未有过的内容,在降低成本的同时,也打破了各个模态之间的“技术壁垒”,这就是视频AI的优势所在。11月8日,36氪WISE2023主题视频重磅...……更多
更多关于科技的资讯:
深度融合!奈特瑞科技AI强势进阶
1月23日,北京奈特瑞科技有限公司(以下简称“奈特瑞科技”)携手顶呱呱科技、医者AI战略合作升级。奈特瑞科技董事长兼CEO曲毅
2025-01-23 16:00:00
又一国产机器狗“云深处山猫”秀肌肉:腾空飞跃、金鸡独立!
快科技1月23日消息,继宇树科技之后,又一家中国企业云深处科技秀出了最新的机器狗视频,这台名为“山猫”的机器狗首次展现了各种灵巧的技能
2025-01-23 16:02:00
初代苹果Mac mini诞生20周年:用的还是ATI显卡
快科技1月23日消息,20年前的今天(美国时间2005年1月22日),苹果推出了初代Mac mini。初代Mac mini的发布代表着苹果首次真正进军低端消费市场
2025-01-23 16:02:00
直接对标头部品牌!卢伟冰首晒米家中央空调:正在漠河冬测
快科技1月23日消息,卢伟冰最新发文透露,此刻在中国最北的漠河,米家空调正在-35℃的气温下进行冬测,其中就包括大家期待已久的米家中央空调
2025-01-23 16:02:00
24小时免费道路救援!鸿蒙智行新春出行保障服务上线
快科技1月23日消息,鸿蒙智行近日推出“新春出行保障”服务,为问界、智界、享界全系车主提供24小时免费道路救援等多重保障服务
2025-01-23 16:02:00
1分钟44次!22岁女孩做引体向上刷新世界纪录
快科技1月23日消息,据报道,22岁的江西姑娘谢婷以1分钟44次引体向上的成绩,成功刷新“一分钟做最多的引体向上(女性)”吉尼斯世界纪录
2025-01-23 16:02:00
理想汽车公布充电超时收费:不光得治标也得治本!
快科技1月23日消息,今日,理想汽车微博官方账号正式发布了理想汽车超充站占用费标准。据其占用费政策规定:在理想超充站充电结束后15分钟内未将充电枪插回充电桩
2025-01-23 16:02:00
从街头到雪境,碧橙子公司扬趣携手AIGLE持续探索场景化营销
多元化、碎片化的消费时代,如何精准触达目标消费者,是众多品牌面临的共同挑战。场景化营销,作为一种以消费者为中心,通过构建特定场景来激发消费者需求与情感的营销策略
2025-01-23 16:03:00
记录春节团聚时刻,华为云空间为你珍藏美好
全家福、年夜饭、走亲访友拜年……农历新年临近,年味蔓延。从“春运”返乡路到团圆欢聚时,岁末迎新的团聚,承载每个国人期待已久的思念
2025-01-23 16:10:00
长白山全须生晒参4盒99元年货速囤(赠2礼袋)
天猫长白山人参旗舰店,全须生晒参20g标价300元,今日下单4件,立减+领券后4盒实付99元包邮。每套折合49.5元(2盒一套)
2025-01-23 16:32:00
华为Pocket 3蓄势待发 博主:友商们意想不到的巨作
快科技1月23日消息,博主定焦数码爆料,华为Pocket 3预计会在3月份登场,这是友商们意想不到的一款新品巨作。据悉
2025-01-23 16:32:00
消费级蓝光光盘再见:索尼下月起停产 无后续产品!
快科技1月23日消息,按照索尼的说法,他们已经要停产蓝光光盘。索尼存储媒体解决方案公司今日宣布,预计将于2025年2月全面停止生产刻录用蓝光光盘
2025-01-23 16:32:00
今年春运 北京站售出纸质车票:0张!
快科技1月23日消息,截至1月22日9时,铁路12306在春运期间已累计发售票2.57亿张,而曾经的纸质车票,已经寥寥无几
2025-01-23 16:32:00
特仑苏有机纯牛奶梦幻盖24包限时大促 64元专享价
特仑苏有机纯牛奶梦幻盖250ml x 24包日常标价卖198元,今日下单可领5元优惠券,叠加下单立减129元,到手64元
2025-01-23 16:32:00
柯洁不接受韩国处罚退赛!棋士连笑发声:非常愤怒 咱不受这个委屈了
1月23日消息,LG杯决赛,棋手柯洁选择退赛,韩国选手卞相壹夺冠。随后,棋士连笑 发文:“学棋至今,看过多少前辈大棋士 经过的熏陶首先都是坦坦荡荡
2025-01-23 16:32:00