• 我的订阅
  • 头条热搜
火爆全球的AI音频大模型,最新技术细节揭秘
智东西7月24日消息,Satbility AI于7月19日在Arxiv上分享了Stable Audio Open的研究论文,公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1k……更多
全面进化的骁龙,打响端侧AI时代的发令枪
...爆火,AIGC的发展不断提速,生成式AI一跃成为科技圈中最火爆的领域之一,这也开启了以AI为主的全新时代,但是现在来看以云端为主的生成式AI,难以消除的高成本、高时延等问题。但随着生成式AI加速渗透的趋势变得不可阻挡...……更多
AI正在改变物理世界!2024云栖大会开幕 AI硬科技集结 共创“无法计算的价值”
...务、人工智能平台和模型服务,全景式呈现AI时代云计算最新技术形态和产品进展。在计算馆,有一个展位人气异常火爆。不少观众在体验用无影云电脑玩最近爆火的《黑神话:悟空》。“之前如果想要玩一款大型游戏或者进行...……更多
抖音豆包火爆,视觉中国沾光录得8天5板
近日,抖音豆包概念席卷A股市场。12月12日,相关概念股持续活跃,截至收盘,省广集团、引力传媒、视觉中国等多股涨停。消息面上,12月10日,字节跳动旗下视频生成模型PixelDance在豆包电脑版正式开启内测。量子位数据显示...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...在互动平台表示,公司在Transformer架构方面积极跟踪业内最新技术,未来将根据技术研发和业务需求的实际情况,适时采用类似架构。国脉文化(600640)去年12月12日在互动平台表示,公司在文生视频方面,已内部开发基于大模型...……更多
欧盟《人工智能法案》如何影响开源模型监管?
...某些条款将在今年内适用。值得注意的是,免费、开源的模型的确获得了《法案》中的某些豁免。但如果它们被认为构成“系统性风险“,开源并不能成为其免于遵守规定的理由,这表明更强大的开源模型仍将面临监管。清华大...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
头图由天工AI生成随着中国加速研发 AI 大模型技术,追赶美国,如今已迎来新的节点。北京时间4月18日,Meta推出了新版开源大模型Llama 3,并推出了8B和70B的预训练和指令微调版本,在众多性能上都大幅超越了Llama 2。Meta官方还...……更多
规范深度合成技术中国走在全球前列(专家解读)
...提出的生成对抗网络(GANs)、2020年提出的生成式预训练模型(GPT-3),大幅提升了多媒体数据合成的逼真程度,推动了“人工智能生成内容”和“元宇宙”等一系列新型智能应用形态。目前,深度合成技术已衍生出面部替换、...……更多
让霉霉说地道中文,背后玩家竟来自中国,7个月收入百万美元
...内的一个初创团队做的。全网爆火,HeyGen被网友疯玩全网火爆,网友纷纷动手玩了起来。网友@Gorden Sun也复刻了一段霉霉说中文的视频,在排队等待7000个视频后,用HeyGen制作的视频翻译终于完成了。并直言:“效果绝对目前最好...……更多
喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会
...新的自研语音技术成果,包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统,为参会者展示AIGC与文娱音频产业深度融合的最新成果。据了解,喜马拉雅珠峰语音生成式大模型是喜马拉雅的一项创新性技术,具备快...……更多
周鸿祎参演!“AI+影视”,即将爆发?
...质量。著名制片人、编剧白一骢坦言,自己“开着四个AI模型辅助写剧本”。他也强调,取代编剧的不是AI,而是观众手中的选择权。他说:“AI已能写出比多数人更好的剧本,编剧要么做到顶尖,要么被淘汰。”著名编剧汪海林...……更多
2025开年,DeepSeek助力企业AI招聘系统放大招!
...AI应用如雨后春笋般破土而出之际,一款名为DeepSeek迅速火爆全球,在全球掀起了一场AI革命。DeepSeek究竟是何方神圣?火爆全球的背后,又会对企业人才招聘带来哪些影响?让我们来一探究竟。一、2025开年,DeepSeek火爆全球在2025...……更多
百元机皇!西圣Mike专业无线麦克风来了
...通过开创\"预处理、分割、降噪、提升\"的多重降噪算法模型,配合1+1麦克风阵列技术、ALPT高密度拾音技术以及采用更高标准的32位浮点数计算的DSP发烧级Ai降噪芯片,将,声音清晰度高达98%、抗噪性达到了92%。为了做到更好收音...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GPT-4o...……更多
...究经验,在行业研究领域利用行业生命周期理论、SCP分析模型、PEST分析模型、波特五力竞争分析模型、SWOT分析模型、波士顿矩阵、波特钻石理论模型等,形成了自身独特的研究方法和产业评估体系。下表展示了本报告所采用的...……更多
西圣AVA2Pro开拓半入耳降噪新境,破百元之限,引领行业
...术瓶颈,全面提升用户体验AVA2Pro搭载全新4重PSNE降噪算法模型,融合3+3阵列麦克风矩阵、ALPT高密度拾音技术,通过“预处理、分割、降噪、提升”的全流程优化,能够精准识别并消除复杂环境中的噪音,降噪性能相比上一代提...……更多
GPT-4“颠覆”打工人公办方式,谷歌多轮对阵落败,48岁微软为何能重新起舞?
...等,并将其作为平台提供给其他企业使用。随后微软就将火爆的ChatGPT集成在搜索引擎上推出新版Bing,并将其视为挑战占据垄断地位的谷歌的新机会。虽然其后也暴露出威胁、PUA用户等新问题,但ChatGPT的确也吸引了更多的用户使...……更多
创新科技CREATIVE携最新音频力作亮相深圳国际音频展
...耳机通过SuperX-Fi®空间全息技术,巧妙地将声音的每一个细节放大,带来如同音乐会现场一般的真实感受。无论是低音的厚重回响,还是高音的清澈飘扬,都能在耳中呈现出令人惊叹的立体感,仿佛每一个音符都在你耳边舞动。S...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...沿技术研究和提供企业级解决方案。我们目前围绕四个大模型(生成式3D大模型、生成式音频大模型、生成式动作大模型、对话大模型)在开展技术自研,后续将推动规模化落地应用。前段时间GPT-4o的问世,相信大家都看到很多...……更多
融资1600万美元,这家法国AI创企推新语音转录引擎,支持100种语言
...识别他的法语口音。他说:“考虑到目前大多数语音识别模型主要在英语音频数据上训练,存在固有的偏见,Gladia优先构建了第一个真正多语言的实时产品。”此外,Gladia引擎的特别之处在于能够即时从对话中提取信息,如来电...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
它来了它来了,苹果的Apple Intelligence终于与果粉见面了!随着iOS 18.1 Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。最明显的一处就是Siri的全面换新,变身成了Apple Intelligence & Siri。另一项重磅更新就是写...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
RTE2023 泛娱乐论坛精彩回顾
...平台以用户搜索为主,所以针对国内的产品更强调游戏的火爆程度和辨识度,在《萌宠宠之战》中,Starscape也是基于这两大特点将游戏设计得更激烈,更具对抗性。技术上,由于国内的用户基数很大,大规模的渲染以及高负载也是弹幕游...……更多
虚拟和现实世界已分不清!OpenAI首个AI视频模型发布:60秒视频全AI生成
...秒的视频,并非真实拍摄,而是OpenAI最新的“文生视频”模型Sora,这一段文字描述就是段Prompt(提示词)。当地时间2月15日,人工智能(AI)巨头OpenAI宣布,正在研发“文生视频”模型Sora,可以创建长达60秒的视频,其中包含高...……更多
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
...视频的长度。与阿里 EMO、微软 VASA 等最新涌现的 AI 视频模型不同,旷视 MegActor 将采用开源的方式,提供给开发者社区使用。MegActor 能够呈现出丝毫毕现的效果,面部细节更加丰富自然,画质更出色。为了进一步展示其泛化性,...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai...……更多
广东新增联合实验室打造生成式音频大模型
...韵律、情绪的可编辑音频,打造业界领先的生成式音频大模型。香港中文大学(深圳)趣丸科技联合实验室成立。香港中文大学(深圳)供图随着《广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见》出台,广东...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...破百万,而到达这个数字,推特用了两年。因为 ChatGPT 的火爆,OpenAI 在大语言训练模型领域的积累也逐渐被看到——ChatGPT采用最新的GPT3.5模型,模型中首次采用 RLHF(从人类反馈中强化学习)方式。OpenAI 最初于 2017 年提出的 GPT...……更多
2024世界计算大会论道:万兴科技大模型加速改变音视频内容生产的成本结构
...视频行业呈现短剧频出、爆款不断的态势;平台层面社媒火爆、付费火热,全球主流社媒平台已全面视频化;技术层面伴随AI技术深化应用,音视频产业已迎来效率提升和价值增长新机遇。“大模型正在从1.0图文时代加速进入以...……更多
谷歌之后,OpenAI也要给新闻网站付费了?
大模型的发展离不开语料,但语料可不是凭空产生。在吞完免费内容后,付费的优质内容,必然成为大模型的选择对象,这样以来,就涉及到成本问题了。近两年,大模型喷涌,它们在文字、图片、音视频等内容形态的生成上...……更多
更多关于科技的资讯:
劳力士手表价格暴跌 有人卖块表赔了一台保时捷
快科技3月10日消息,据报道,二手劳力士手表价格近期正在持续下跌。“熊猫迪”已从40万元跌到19万元,一些型号更是跌破了劳力士发行的公价
2025-03-10 19:48:00
182.3米世界坝体最高!江苏句容抽水蓄能电站3号机组并网发电
快科技3月10日消息,据央视新闻报道,今天位于江苏句容市的国网新源江苏句容抽水蓄能电站3号机组正式并网发电。至此,该站首批3台机组已全部投运
2025-03-10 19:48:00
出色影像加持,华为nova 13 Pro氛围感照片触手可得
在这个时代,一张好看的照片胜过千言万语。你是否曾经因为拍不出美照而错失记录生活的机会?是否曾因为不会给女朋友拍照而被嫌弃
2025-03-10 19:48:00
网友买到三只松鼠发霉面包要求道歉 客服:赔偿2000元 道歉信没有
近日,据媒体报道,有网友买到三只松鼠发霉面包。该网友称,该发霉面包是从三只松鼠电商旗舰店购得,入口后闻到臭味,发现面包发霉现象
2025-03-10 19:48:00
网友脑洞大开!华为Pura 80鬼才设计图曝光
快科技3月10日消息,有网友放出了一张华为Pura 80的“鬼才设计图”,其最大看点是镜头模组是四分之一圆,四台手机组合在一起就能拼成一个完成的圆形
2025-03-10 19:48:00
对话全国政协委员、康希诺朱涛:疫苗出海需创新与差异化,国家免疫规划扩容是必然趋势
“我们不可能一天就把免疫计划扩容到跟发达国家一样多的品种。随着国内企业在疫苗供给、疫苗质量和技术水平方面的逐步提高,国家免疫规划扩容必然会来临
2025-03-10 19:54:00
秒“算”神机,西部大山为“哪吒”生出澎湃算力|贵州有“数”
据网络平台数据:《哪吒之魔童闹海》(《哪吒2》)全球电影票房(含预售及海外)超越《复仇者联盟3:无限战争》进入全球票房榜前6名
2025-03-10 20:15:00
13万就有激光雷达智驾!零跑B10搭同级唯一高通8650智驾芯片
快科技3月10日消息,零跑汽车今日晚间举办零跑B10预售发布会。零跑汽车介绍,B10为13万级首搭激光雷达高阶智驾的车型
2025-03-10 20:18:00
“县城贵妇”们开始纷纷加入二手经济
快科技3月10日消息,近日,转转集团发布2024女性二手消费洞察。数据显示,2024年转转平台女性用户同比增长70%,女性用户在高价值品类的交易中占比显著提升
2025-03-10 20:18:00
10倍长!微信正式官宣:朋友圈可以发5分钟视频了
快科技3月10日消息,微信,作为我们日常生活中不可或缺的社交工具,一直在不断创新和优化,为用户带来更加丰富的使用体验。以往
2025-03-10 20:18:00
鲁网3月10日讯(记者 陈珊珊 通讯员 韩巧苓)在人工智能技术飞速发展的当下,楼宇经济作为城市产业的关键支撑,正面临着数字化
2025-03-10 20:43:00
本文转自:人民日报客户端全国政协委员、中国载人航天工程副总设计师杨利伟接受人民日报“两会面对面”系列访谈时提到,从登月载人飞船梦舟到着陆器
2025-03-10 21:30:00
调查显示:超七成宁波女性消费者每年都出游
中国消费者报报道(记者郑铁峰)在“她经济”持续崛起的背景下,女性消费者正以多元化的需求重塑消费市场格局。近日,浙江省宁波市消保委面向18至60周岁的宁波女性消费者开展消费调查
2025-03-10 21:59:00
警惕!伪装成学习工具的色情软件威胁孩子健康成长
在数字化时代,手机应用为孩子们的学习和娱乐提供了便利。然而,网络中潜伏的危险却不容忽视。近日,河南郑州的一则事件敲响警钟
2025-03-10 22:32:00
长城汽车:坦克300是一台可以载入全球汽车编年史的越野车 女性用户占比35%
快科技3月10日消息,今日晚间,坦克300 2025款上市发布会正式举办。发布会一开始,坦克品牌执行副总经理谷玉坤率先回顾了坦克300上市4年来取得的成绩
2025-03-10 20:48:00