• 我的订阅
  • 头条热搜
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...2024年迎来基础大模型的关键之年早在1956年夏天,计算机科学家约翰·麦卡锡(John McCarthy)等人在具有传奇色彩的“达特茅斯会议”上创造“人工智能”这个术语,被认为标志着 AI 技术的正式诞生。之后半个世纪当中,计算机技...……更多
本周(4.8-4.14)AI界发生了什么?
...,曾任谷歌大脑深度学习项目创始人兼负责人、百度首席科学家、斯坦福大学人工智能实验室主任。OpenAI解雇两名核心团队成员4月12日,据The Information,近期两名OpenAI的研究员因涉嫌泄露机密信息而遭到解雇。其中一位是OpenAI ...……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...其足够“聪明”、“通人性”的关键原因之一。开源社区科学家助力 打造更懂中文的对话式AI产品“天工”在开发过程中也得到了开源社区上百位AI科学家助力。昆仑万维CEO方汉1994年就参与倡导开源运动,是中文Linux的奠基人之...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年是国内大语言模型狂飙的元年。2024年,OpenAI携可生成60秒视频的模型Sora再次...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
AI音乐创作、水墨画、3D空间重建、6DoF,腾讯多媒体实验室领先技术亮相数贸会
...。”腾讯云副总裁、腾讯多媒体实验室负责人、腾讯杰出科学家刘杉博士表示。返回搜狐,查看更多责任编辑: ……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...这个领域迎来了新的投资人:1972年,汇聚了该领域顶尖科学家的P/DP小组在犹他大学成立,标志着计算机图形学的研究重心从麻省理工学院逐渐转向了西海岸,好莱坞开始持续在这一领域投入资金,著名的3D艺术品“犹他茶壶”...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...更加强大的多模态大模型。”商汤科技联合创始人、首席科学家王晓刚表示。而为了满足这些大型复杂AI模型的训练需求,商汤也续优化分布式计算平台、节能数据中心、高速网络架构、高性能存储系统、训练容错与可靠性、数...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...智能技术,需要全社会不断地对它加深认知,需要政府、科学家、企业、媒体、资本等共同参与,这样才能促使其获得更好的良性发展。 据悉,「灵动AI」目前已上线近千个商品图场景,初步形成AI工具矩阵。由于拥有特定风格...……更多
小红书布局大模型:多媒体算法负责人牵头、上线AI绘画应用 | Long China 50独家
...负责AI和音视频算法方向。在更早期,他还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。除了成立大模型团队以外,36氪了解到,小红书内部还有多个独立部门同时推进AIGC方向的落地探索。今年4月份,小红书...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
AIGC按下昆仑万维的全球化加速度
...yText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。有意思的是,昆仑天工起先源于规...……更多
...危及患者信息安全、有损算法的可信度等。世卫组织首席科学家杰里米·法勒说,生成式人工智能技术具有改善医疗保健水平的潜力,但前提是研发、监管和使用这些技术的人必须识别并充分考虑相关风险。人们需要透明的信息...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
京东要给实体产业做个GPT
...人效,优化客户体验。2018年,随着何晓冬等一大批顶尖科学家加入,京东开始赋予智能客服更多智慧乃至情感。2年后便推出了业内首个大规模商用情感智能客服系统 ——“言犀”,在大规模服务场景中沉淀AI能力。自诞生之际...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。大会上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片...……更多
今年 WISE大会的“AIGC”含量有多高?超有料揭秘提前看
...自动化、智能化的方式,将文本、图像、音频、视频等多模态数据重新组合,创造全新和从未有过的内容,在降低成本的同时,也打破了各个模态之间的“技术壁垒”,这就是视频AI的优势所在。11月8日,36氪WISE2023主题视频重磅...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...小米集团小爱总经理王刚在与商汤科技联合创始人、首席科学家王晓刚对话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”左为小米...……更多
中国AIGC创新 一场“逆互联网”式创业
...深智也探索出了虚拟人动作表情驱动的深层次技术——多模态大模型技术。根据成维忠的设想,虚拟人生成技术将会突飞猛进。几年内,AI将能完成动画电影级别的制作,80%以上的动画产品都可以利用AI生成,未来电影工业或许...……更多
...串词语后面的下一个文本。美国佛罗里达国际大学计算机科学家马克·芬利森说,这种能力对处理文本的人很有用。他说:“它非常擅长生成通用的、中学水平的英语,这是一个很好的起点,可以完成人们日常写作中80%的工作。...……更多
万字长文:产品经理视角下的AI绘画全解析
...大概描述一个这样的场景:人均寿命提升到1000岁,但是科学家开始真正开始科研的岁数是100岁,因为他从头到尾要学习的内容就是这么多。当文明的寿命长度,不足支撑个体完成文明知识的学习后,文明的发展就被锁死了。收...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
Sora为何没能诞生在中国?
...闻周刊》解释,这是基于Transformer架构模型的“硬伤”。科学家曾希望人工智能像人类一样能“演绎推理”,但努力多年,依然无法实现。Transformer成功让AI产生了令人惊艳的生成能力。但硬币的另一面,它不会像人类一样思考,...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而下一代的输入法...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...数字世界或许已经近在咫尺。英伟达人工智能研究院首席科学家JimFan称“这是视频生成领域的GPT-3时刻”。360董事长周鸿祎称“Sora意味着AGI(通用人工智能)实现将从10年缩短到1年”。图:主流文生视频模型对比数据来源:易方...……更多
更多关于科技的资讯:
中国公务航空维修市场步入关键转型期(附图片)
本文转自:中国民航报本报记者刘九阳全球航空运输业的强劲复苏带动了商用飞机售后服务市场的稳步增长。据《航空周刊》预测,2024年~2033年
2024-05-08 00:47:00
电子飞行包 “链接”智能空中交通新未来(附图片)
本文转自:中国民航报本报记者王艺超作为技术密集型产业的代表,民航业汇聚了众多前沿的航行新技术。然而,长期以来,由于缺乏有效的技术协同运行机制
2024-05-08 00:47:00
小米su7智能泊车功能解析
5月6日消息,小米汽车今日继续更新“小米SU7答网友问”,主要涉及智能化及部分用车场景相关问题。关于“授权登录账号持续多久后需重新授权”
2024-05-08 00:50:00
蔚来旗下乐道汽车官方网站正式上线,其他信息未知
5月6日消息,蔚来旗下乐道汽车官方网站今日正式上线,显示“首款车型L60敬请期待”。除展示ONVO乐道汽车官方Logo样式外
2024-05-08 00:53:00
本文转自:淮安日报动能不竭 终点必达——记全国五一劳动奖章获得者曾惠敏■通 讯 员 蒋 蕖 陈文姝朱正花融媒体记者 王 舒“师傅
2024-05-08 00:54:00
《巫师3:狂猎》redkit模组编辑器上线Steam平台
5月7日消息,据CDPR官方微博,游戏《巫师3:狂猎》REDkit游戏引擎模组编辑工具将于5月21日正式上线Steam平台
2024-05-08 01:04:00
openai生成式ai聊天机器人将取得突破性进展
5月7日消息,OpenAI首席运营官布拉德・莱特卡普(BradLightcap)近日表示,以ChatGPT为代表的生成式AI聊天机器人将在未来12个月内取得突破性进展
2024-05-08 01:06:00
三星为拿下英伟达高端内存订单组建“精英团队”
5月7日消息,据韩国科技媒体KEDGlobal报道,三星电子为了拿下英伟达下一代人工智能图形处理器(AIGPU)的高端内存(HBM)订单
2024-05-08 01:07:00
魅族上架“魅友共创myspace抗菌棒球帽”,耐穿耐洗
5月7日消息,据“魅族科技”官方微博,魅族今天在自家商城上架一款“魅友共创MYSPACE抗菌棒球帽”,号称“5A抗菌,重磅纯棉
2024-05-08 01:08:00
石头h5手持无尘吸尘器上架京东,配备12万转电机
5月7日消息,石头H5手持无尘吸尘器目前已经上架京东,这款吸尘器将于5月31日开售,主打“158AW吸力”,首发价999元
2024-05-08 01:11:00
ayaneoag01将于5月18日发布,采用“宇宙星舰”设计
5月7日消息,AYANEO负责人@尾巴大叔昨晚官宣旗下新品——AG01,并表示将在5月18日开启产品分享会,带来多款概念产品
2024-05-08 01:13:00
nasa发布360度沉浸式视频,探索黑洞内部
5月7日消息,黑洞自被发现以来,一直因其强大引力效应让光都无法逃逸的特性而令世人着迷。近日,美国宇航局(NASA)发布了一段360度沉浸式视频
2024-05-08 01:18:00
华硕rog幻16airamd游戏本现身南非电商平台
5月7日消息,将于Computex2024台北电脑展发布的华硕ROG幻16AirAMD版游戏本已现身南非电商平台onlinetechsa
2024-05-08 01:19:00
梦百合0压智能床l7开售:支持鸿蒙智联等功能
5月7日消息,梦百合0压智能床L7开售,采用一体式电动智能床设计,支持鸿蒙智联、免穿戴睡眠监测、实时打鼾干预、背部+腿部按摩等功能
2024-05-08 01:20:00
三星galaxyzfold6手机cad渲染图曝光,边角方正
5月7日消息,美国手机保护套厂商Thinborne近日发布推文,分享了三星GalaxyZFold6手机的CAD渲染图(目前推文已删除)
2024-05-08 01:21:00