• 我的订阅
  • 头条热搜
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...2024年迎来基础大模型的关键之年早在1956年夏天,计算机科学家约翰·麦卡锡(John McCarthy)等人在具有传奇色彩的“达特茅斯会议”上创造“人工智能”这个术语,被认为标志着 AI 技术的正式诞生。之后半个世纪当中,计算机技...……更多
本周(4.8-4.14)AI界发生了什么?
...,曾任谷歌大脑深度学习项目创始人兼负责人、百度首席科学家、斯坦福大学人工智能实验室主任。OpenAI解雇两名核心团队成员4月12日,据The Information,近期两名OpenAI的研究员因涉嫌泄露机密信息而遭到解雇。其中一位是OpenAI ...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年是国内大语言模型狂飙的元年。2024年,OpenAI携可生成60秒视频的模型Sora再次...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
AI音乐创作、水墨画、3D空间重建、6DoF,腾讯多媒体实验室领先技术亮相数贸会
...。”腾讯云副总裁、腾讯多媒体实验室负责人、腾讯杰出科学家刘杉博士表示。返回搜狐,查看更多责任编辑: ……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...这个领域迎来了新的投资人:1972年,汇聚了该领域顶尖科学家的P/DP小组在犹他大学成立,标志着计算机图形学的研究重心从麻省理工学院逐渐转向了西海岸,好莱坞开始持续在这一领域投入资金,著名的3D艺术品“犹他茶壶”...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...智能技术,需要全社会不断地对它加深认知,需要政府、科学家、企业、媒体、资本等共同参与,这样才能促使其获得更好的良性发展。 据悉,「灵动AI」目前已上线近千个商品图场景,初步形成AI工具矩阵。由于拥有特定风格...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
...危及患者信息安全、有损算法的可信度等。世卫组织首席科学家杰里米·法勒说,生成式人工智能技术具有改善医疗保健水平的潜力,但前提是研发、监管和使用这些技术的人必须识别并充分考虑相关风险。人们需要透明的信息...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
今年 WISE大会的“AIGC”含量有多高?超有料揭秘提前看
...自动化、智能化的方式,将文本、图像、音频、视频等多模态数据重新组合,创造全新和从未有过的内容,在降低成本的同时,也打破了各个模态之间的“技术壁垒”,这就是视频AI的优势所在。11月8日,36氪WISE2023主题视频重磅...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...小米集团小爱总经理王刚在与商汤科技联合创始人、首席科学家王晓刚对话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”左为小米...……更多
...串词语后面的下一个文本。美国佛罗里达国际大学计算机科学家马克·芬利森说,这种能力对处理文本的人很有用。他说:“它非常擅长生成通用的、中学水平的英语,这是一个很好的起点,可以完成人们日常写作中80%的工作。...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而下一代的输入法...……更多
Sora为何没能诞生在中国?
...闻周刊》解释,这是基于Transformer架构模型的“硬伤”。科学家曾希望人工智能像人类一样能“演绎推理”,但努力多年,依然无法实现。Transformer成功让AI产生了令人惊艳的生成能力。但硬币的另一面,它不会像人类一样思考,...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...数字世界或许已经近在咫尺。英伟达人工智能研究院首席科学家JimFan称“这是视频生成领域的GPT-3时刻”。360董事长周鸿祎称“Sora意味着AGI(通用人工智能)实现将从10年缩短到1年”。图:主流文生视频模型对比数据来源:易方...……更多
2023世界成都科幻大会“当科技与科幻相遇”华为主题沙龙圆满落幕 
...幻对于孩子们的影响是泛化的,不是说看一个小说就成为科学家。科幻作品并不能对人生就起到决定性的作用,但的确可以给他们心里面种下一颗种子,好的科幻作品,可以在他们的成长路上添一瓢水。青年科幻作家、银河奖、...……更多
AIGC工具测评:生成式AI的产品表现如何
...力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格,其简洁的设计语言和优化的...……更多
高通aihub正式发布:支持75个ai模型
...示了全球首个在搭载第三代骁龙8的安卓手机上运行的多模态大模型(LMM)。在这一演示中,高通展示了一个超过70亿参数的LMM,其支持文本、语音和图像输入,并能够基于输入的内容进行多轮对话。同时高通还在搭载全新骁龙XEl...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Laurent Sifre或与同事Karl Tuyls离开公司创业,新公司将专注于构建新的AI模型,首轮融资可能将超过2亿欧元。1.19位OpenAI「黑手党」出走创业,融资近80亿美元!华人科...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...是倾盆大雨前的一场雨,是一个分水岭。”这是OpenAI首席科学家伊利亚·苏茨克维对ChatGPT诞生的形容。一年来,ChatGPT从只能处理文字信息的应用,演变成了同时处理文字、语音、图像信息的超级应用,每周吸引上亿人使用。OpenA...……更多
用AI当导演,一个人就能拍电影?
...的例子,它始于2017年,这个项目是由艺术家与人工智能科学家合作开发的。它引发了人们对电影创作方式的重新思考。 在这个项目中,通过自动文本生成、场景生成、对话生成以及视频检索、文本语音合成及音乐合成方面的研...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...字小说的内容生成能力;•多,图生小说、文生插图等多模态交互能力;•长,一次读懂长达100万字小说的内容理解力。大:全球首个万字创作大模型,一键生成万字小说唐太宗办亚运会,孙悟空遇到钢铁侠,皮卡丘闯入天空之...……更多
更多关于科技的资讯:
四川青川:年产10万吨纳米碳酸钙生产线预计8月建成投产
近日,在青川经济开发区庄子产业园内,青川华纳新材料有限公司年产30万吨纳米碳酸钙项目建设现场繁忙而有序。施工人员正在进行机械焊接作业青川华纳新材料有限公司成立于2023年8月
2024-06-17 15:05:00
梦想当“燃”| “链”上奔跑,浪潮这个团队最盼“守得云开见月明”
产业链供应链是大国经济循环畅通的关键,维护其安全稳定是构建新发展格局的重要基础,但在当下,产业链供应链还存在诸多“断点”“堵点”
2024-06-17 15:32:00
中移物联智慧酒店亮相郑州数智化赋能酒店高质量发展大会
6月6日,由河南省旅游饭店业协会主办的“数智化赋能酒店高质量发展大会”在郑州圆满召开,200余名酒旅行业专家、企业创始人
2024-06-17 15:43:00
全民参与、多元创新,2024阿拉善SEE气候周圆满闭幕
2024年6月9日,以“全民参与·创新驱动·绿色未来”为主题的阿拉善SEE气候周(下称气候周)在北京闭幕。从6月6日至9日
2024-06-17 15:45:00
家电安装收费为何总也说不清
中国消费者报报道(记者桑雪骐)免费安装是大多数需要安装的家电产品的销售承诺,但在限制条件之外的收费问题也常受到消费者的质疑
2024-06-17 15:45:00
鑫源摩托“慢捣公元”6月15开业,打造重庆摩托新地标
看到那七八层楼高,一整面玻璃墙的摩托阵了吗?——帅吧,那可是“摩托之都”最拉风的打卡地标! 看到那颗用摩托零件搭建的金属大树了吗
2024-06-17 15:46:00
超大规模免息券补贴 京东白条推出全场12期免息券
6月15日0点,京东突然上线了618全场12期免息券,领券就享全场12期免息券。小米pad 6 pro,每月只要167元
2024-06-17 15:47:00
遂川县新盛旅游开发有限公司:旅游业革新者的蓝图
在旅游业蓬勃发展的今天,遂川县新盛旅游开发有限公司凭借其创新思维和深度洞察,以“衣食住行旅游服务平台”为核心,重新定义了旅行体验
2024-06-17 15:50:00
从小众走向大众,无糖茶为何成为茶饮界“顶流”?
茶饮赛道的战争,已经卷到了“无糖”这个概念。6月3日,喜茶再上新轻负担饮品,同时发布“果茶控糖宣言”,宣布“全面展开果茶控糖计划”
2024-06-17 15:59:00
清能股份全新AEM电解槽,实测效率高达95%!
在电解制氢领域,相较于其他技术,阴离子交换膜(AEM)电解技术因其强大的动态响应能力、更低的设备成本和超高的效率,展现出其极高的竞争潜力
2024-06-17 16:00:00
光明乳业荣膺2024NHNE营养星球大赏年度影响力品牌金奖
近日,2024NHNE营养星球大赏召开。光明乳业受邀参加,并在此次活动中荣获年度影响力品牌金奖。本届NHNE营养星球大赏旨在“链接每一位卓越营养人”
2024-06-17 16:07:00
最高补贴19000元 成都市成华区汽车生活周火热来袭
消费日报网讯(记者 冯举)6月15-16日,成华汽车生活周通过“汽车、家电、家居展销+音乐表演+美食市集+体验游戏”打造美好生活嘉年华
2024-06-17 16:17:00
本报讯 (记者 王 洋)随着消费者不断趋于智性消费,当下零售商正经历大浪淘沙的生存之战,为应对消费者追求极致质价比的挑战
2024-06-17 16:18:00
必胜客携手它基金在广州打造动物友好餐厅,践行动物关爱公益
近日,必胜客作为北京爱它动物保护公益基金会(以下简称它基金)的公益合作伙伴,官宣了在全国18座城市推出了21家“必胜客 x它基金动物友好公益主题餐厅”
2024-06-17 16:19:00
从短剧“少爷”到直播间“销冠”,抖音霸总变形记
(转载/原作者:刺猬公社)摘要:一种很新的直播模式,一次很爆的营销新尝试。“就让我亲手把你投上总裁宝座吧。”“我还没有试过说话被打断的滋味
2024-06-17 16:24:00