• 我的订阅
  • 头条热搜
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
GPT整合进iOS?苹果被曝联手OpenAI,实现AI修...
...了由升级版Gemini驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及支持多模态输入的AI搜索引擎等等。微软也在Build开发者大会上介绍了团队助理Team Copilot、全新Agent功能、Phi-3模型系列新成员等各类围绕AI展开的更新...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...编辑|邓咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet...……更多
最前线 | APUS发布千亿级天燕大模型AiLMe,toC应用发力,toB服务蓄力
...基于AiLMe,推出了问答大师、简笔成画、墨染等7款涵盖“文生文”“图生图”“文生图”等多模态交互的AI消费端产品。问答大师可用于通用问答场景,也可以选择特定领域的场景。图源:36氪测试简笔成画可根据用户的简笔画...……更多
Sora“杀死”苹果汽车
...I仍然处于快车道。就在近10天前,OpenAI公布最新“王炸”文生视频产品Sora,给AIGC再添了一把火。Stability紧随其后,将其Stable Video开放公测,文生图领域另一重磅公司Midjourney也透露可能会在其下一版本中更新相关功能。就连苹果...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...大型研究,协同探索人工智能发展创新。本次推出“有AI模型”系列报道,南都研究员与南方都市报“AI治理与创新智联体”专家一同走访广东人工智能大模型研发企业,看AI大模型如何赋能千行百业。第一期,走进广东省首批战...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
...新的重点方向。 升级后的世优波塔AI数字人,在算法与模型层面不断突破,能够更好地与用户进行沟通与连接,满足用户信息获取与情感交流的需求,帮助医疗行业提升工作效率和病患服务体验,确保高效、稳定地将AI数字人成...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...大发展趋势:1. 生成式AI将继续快速发展2022年下半年,AI文生图软件首先点燃了生成式AI的热度,而这股热潮随着ChatGPT的发布达到了巅峰。“生成式AI”的搜索量在2023年出现激增。来源:Exploding Topics在生成式AI受到瞩目之前,大...……更多
别等Sora了!这些国产AI视频大模型,款款都超能打
...在国内众多视频大模型中,体验足以位列前三。可灵支持文生视频和图片生成视频(也可以加入文字描述)两种模式,而且可以调整创意想象力和创意相关性。可灵1.5大模型免费用户使用文生视频功能,最高可生成5秒高品质视...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...频:模糊卡顿、物体扭曲,且仅4秒;四个月后,Runway将文生视频的视频效果拉到了4K的超逼着高度,实现了镜头的连贯稳定。而视频的最大长度也从4秒,提升到了18秒——这也是2023年文生视频的“时长天花板”。然而,就在北...……更多
“最懂你的AI助手”来了!讯飞星火大模型,成了打工人职场搭子?
文丨金融八卦女作者:月月· · ·大模型的风吹了两年,这次打工人真的可以解放双手了?6月27日,科大讯飞正式发布讯飞星火大模型V4.0,亮点非常多,八妹大致总结了一下:1、发布了多款新产品和应用,包括但不限于讯飞星...……更多
鑫闻界|长一岁的大模型不能失“算”,今年底“山东算网”可商用
...歌继续高歌猛进。前两天,OpenAI推出新的AI大模型Sora,该文生视频大模型可通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。如OpenAI在2022年底将ChatGPT-3.5公之于众一般,Sora在发布当日也立刻引起全球关注。谷歌也发...……更多
Infocomm China2024见闻:大家每天忙于开会,却还没吃透怎么用好AI
图片来源@钛媒体拍摄(下同)大模型在B端应用的焦虑感正在向会议办公场景袭来。在本周开幕的Infocomm China 2024展会上,全球400家巨头和新兴品牌展出超过500款新品,但只有零星品牌公开了在会议场景中大模型能力可能有的样...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...EglhJA与此同时,智谱还重磅宣布,该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后,相关能力还将上线视频通话,为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址:https://github.com/THUDM/GLM-4-Voice自...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型V3.0,七大能力持续提升,整体超越ChatGPT,医疗领域超越GPT-4。星火3.0升级启发式对话、AI人设功能,能够打造更个性化的AI助手。面向应用场景,讯飞星火面向行业进...……更多
集顶尖模型和常用工具于一身,套壳AI产品在拉美火了
...”、“平替版”的需求呼之欲出,短时间内,冲出了不少文生应用。头部互联网公司也纷纷通过自研模型、投资等方式布局此赛道,期间也引来了很多产品间的效果测试与对比。不过,大部分产品都处于发展初期,且侧重功能不...……更多
阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
...源的多模态大模型。”他提到的这两款模型是300亿参数的文生视频模型,以及1300亿参数的语音模型Step Audio。“我们希望通过这两款多模态大模型的的开源,助力开发者创建出更丰富多彩的应用出来。”姜大昕还透露,阶跃正在...……更多
...谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。智谱AI也是首批通过国家大模型备案并提供公众服务的8家企业之一。联想控股一直以“科技创新”为战略引领,所布局的产业领域中,AI是其密切关注...……更多
AI加持,造就“一人电商”!微盟凭借大模型打破”不可能三角”
...一键套用,拥有\"客户定制风格LoRA\"能力,基于图生图、文生图、文生文等功能,可进行爆款仿写、批量输出图文并激发商家灵感。此外,WIME还可按商家风格生成匹配不同渠道的内容素材。微盟集团AI负责人裘皓萍透露,未来WIME...……更多
百度李彦宏:一个只靠想法赚钱的时代来了
...。”今日,百度发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”,并杀入智能眼镜领域。李彦宏还预计,智能体是AI应用的最主流形态,即将迎来爆发点,它将成为AI原生时代,内容、信息和服...……更多
机器人、机器狗、重卡?李彦宏携AI神器及5000万大奖亮相开发者大会
...《周处除三害》,就会根据《晋书》和《世说新语》的原文生成故事。进入漫画制作界面,用户可以从光影、写实、卡通等多种风格中进行选择,再在百度文库的智能漫画编辑器里对每一个画面进行编辑、修改和精调,比如,在...……更多
最快六月露面!GPT-5七大震撼能力首次揭秘
完全颠覆影视行业、为机器人提供智慧大脑、人工智能模型自主开发、构建虚拟世界预测未来结果、接入手机等电子设备创建个人智能生态…….虽然GPT-5在官网写的Q4左右会对外正式发布,但根据微软项目有关朋友的信息预测,...……更多
...家讨论的关注焦点之一。2月20日有消息称,在Sora引爆“文生视频”赛道前,字节跳动也推出了一款创新性视频模型Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。随后,字...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...大模型能力显著提升,可提供纯语言、多图理解、语音、文生图、拟人、端侧模拟、行业模型等多模态、多版本、强场景Agent形态。 前瞻构造高阶思维逻辑数据,用推理能力增强AI大模型智能如今,复杂推理成为各模型之间的重...……更多
猎豹CEO傅盛2024年预言:千亿大模型过半凋零,人形机器人必定不能量产【附AIGC市场现状分析】
...驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。——AIGC行业热度高,受资本追捧截止2023年4月,AIGC赛道目前在国外已出现了7家...……更多
抢占大模型红利,28家企业成为文心千帆大模型平台生态伙伴
...公在意图理解、PPT大纲生成、范文书写、生成待办列表、文生图等多模态生成的场景上,与百度智能云的联合开发已经取得了进展。大模型时代正在催生全新的AI基础设施大模型的大计算、大参数、高成本,对大模型时代的AI基...……更多
AI智能体将迎爆发点,市场空间近300亿美元!中科金财6天5
...ent是一种模拟人类智能行为的人工智能系统,以大型语音模型(LLM)作为核心引擎,基于复杂多模态数据的处理能力,他们可以感知环境,做出决策,并执行任务以实现特定目标。目前,国内外科技巨头都在加速布局AI智能体领...……更多
Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
...成视频以假乱真,AI监管迎新挑战2月16日,OpenAI宣布推出文生视频大模型“Sora”,迅速引发AI圈的关注。Sora展示的全新影像画面精细生动,远胜于此前生成式AI所生产的动画内容。这款模型不仅能理解用户的要求,还了解物体在...……更多
Sora爆火96小时国内大模型进场
...人,直接对标Sora。今年1月,字节跳动也发布了MagicVideo-V2文生视频模型,通过文生图大模型先生成一张符合当前输入文本的图片,然后使用图片与文本描述利用图生成视频模型生成简单的视频,并使用视频到视频模型,对当前的...……更多
更多关于科技的资讯:
《阿凡达3:火与灰》12月19日上映!卡梅隆:试映反馈良好 绝对是三部里最好的一部!
快科技2月23日消息,《阿凡达》是有史以来全球票房最高的电影,詹姆斯·卡梅隆却说,第三部可能是迄今为止最好的。近日,传好莱坞奇导演詹姆斯·卡梅隆 (James Cameron)接受新西兰媒体Stuff采访时透露
2025-02-23 17:31:00
高铁乘务员小姐姐怎么总看“手机”:原来有5大功能
快科技2月23日消息,经常坐高铁的话,你肯定注意到了,乘务员小姐姐或者小哥哥会经常盯着一台看着像手机又不像手机的设备,这是什么呢
2025-02-23 18:01:00
医生称DeepSeek有三甲医院专家水平:可帮忙诊断超复杂脑瘤
快科技2月23日消息,据报道,北京某医院神经外科主任医师分享了一段使用DeepSeek辅助诊断复杂脑瘤患者的经历,并对DeepSeek的表现给予了高度评价
2025-02-23 18:01:00
仰望U8同级!猛士917L长轴距版曝光:现款63.77万起
快科技2月23日消息,东风猛士科技计划在今年上半年发布猛士917L长轴距版高定车型,同时将在下半年推出与华为合作的全新智电越野产品
2025-02-23 18:01:00
前波士顿动力研究所展示智能自行车UMV:跑酷轻松跳上桌
快科技2月23日消息,近期,机器人领域可谓热闹非凡。中国宇树机器人凭借其灵巧的身姿和强大的运动能力,在国内外掀起一股热潮
2025-02-23 18:31:00
105公里、速度提升4760倍!中国量子直接通信迈向实用
快科技2月23日消息,最近,北京量子信息科学研究院与清华大学、北方工业大学合作,提出单向量子直接通信理论,并成功研制出实用化系统
2025-02-23 18:31:00
蔚来乐道:L90最快将于2季度亮相 3季度上市
快科技2月23日消息,乐道汽车宣布其第二款车型,旗舰产品乐道L90 SUV,专为大家庭设计的“大三排”车型,计划最快于2025年第二季度亮相
2025-02-23 18:31:00
小鹏汽车:计划2025年进入60个国家和地区
快科技2月23日消息,小鹏汽车宣布了其2025年的全球扩张计划,届时将进入60个国家和地区,并建立超过300个海外售后服务网点
2025-02-23 19:01:00
AMD RX 9070 XT理论跑分首曝:居然逼近RX 7900 XTX!
快科技2月23日消息,AMD RX 9070系列显卡即将在本月底正式发布,3月5日解禁、6日上市开卖,现在我们看到了第一份理论跑分
2025-02-23 19:01:00
价格不到国内三分之一,医美“特种兵”涌向韩国
原标题 | 价格不到国内三分之一,医美“特种兵”涌向韩国精打细算的打工人们,正在捧热“特种兵式轻医美”。在上海工作的王敏
2025-02-23 20:48:00
厉害了!智慧医疗新突破!吉大一院成功完成DeepSeek本地化部署
近年来,在国家大力推动“人工智能+医疗”深度融合的宏观背景下,医疗大模型凭借强大的自然语言理解、推理能力及多模态处理性能
2025-02-23 19:38:00
AMD RX 7650 GRE显卡价格松动了:1979元就能到手
快科技2月23日消息,AMD日前发布了新款中国特供显卡RX 7650 GRE,官方定价2049元起,叠加首发优惠到手价1999元起
2025-02-23 20:32:00
这个日本男人 结婚前才发现:未婚妻已65岁!比他大了25岁
这个男人叫Yoshitaka,2014年,他因为离婚经常在一家酒吧借酒消愁。时间长了,他就和酒吧老板娘Aki认识了,两人的经历很相似
2025-02-23 21:02:00
一图速读2025年中央一号文件“关键词”
编辑:黄灵责编:廖异 审核:阮鹏程
2025-02-23 21:56:00
江南时报讯 近日,在2025年苏州市“人工智能+”创新发展推进大会上,常熟农商银行自主研发的新市民信用评分模型成功入选苏州市级培育人工智能大模型名单
2025-02-23 21:58:00