最新技术,火爆,模型,细节,音频,全球头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

智东西7月24日消息，Satbility AI于7月19日在Arxiv上分享了Stable Audio Open的研究论文，公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型，可免费生成长达47秒的样本和音效，还可生成44.1k……更多

2024-07-25 09:22:00最新技术,火爆,模型,细节,音频,全球

全面进化的骁龙，打响端侧AI时代的发令枪

...爆火，AIGC的发展不断提速，生成式AI一跃成为科技圈中最火爆的领域之一，这也开启了以AI为主的全新时代，但是现在来看以云端为主的生成式AI，难以消除的高成本、高时延等问题。但随着生成式AI加速渗透的趋势变得不可阻挡...……更多

2023-10-27 10:12:00发令枪,进化,时代,高通,平台,前代

AI正在改变物理世界！2024云栖大会开幕 AI硬科技集结

...务、人工智能平台和模型服务，全景式呈现AI时代云计算最新技术形态和产品进展。在计算馆，有一个展位人气异常火爆。不少观众在体验用无影云电脑玩最近爆火的《黑神话：悟空》。“之前如果想要玩一款大型游戏或者进行...……更多

2024-09-20 07:27:00共创,物理,正在,大会,价值,世界

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...在互动平台表示，公司在Transformer架构方面积极跟踪业内最新技术，未来将根据技术研发和业务需求的实际情况，适时采用类似架构。国脉文化（600640）去年12月12日在互动平台表示，公司在文生视频方面，已内部开发基于大模型...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

欧盟《人工智能法案》如何影响开源模型监管？

...某些条款将在今年内适用。值得注意的是，免费、开源的模型的确获得了《法案》中的某些豁免。但如果它们被认为构成“系统性风险“，开源并不能成为其免于遵守规定的理由，这表明更强大的开源模型仍将面临监管。清华大...……更多

2024-03-16 13:06:00人工智能,法案,监管,人工,模型,影响

4000亿参数，国产大模型硬刚Llama 3？｜钛媒体AGI

头图由天工AI生成随着中国加速研发 AI 大模型技术，追赶美国，如今已迎来新的节点。北京时间4月18日，Meta推出了新版开源大模型Llama 3，并推出了8B和70B的预训练和指令微调版本，在众多性能上都大幅超越了Llama 2。Meta官方还...……更多

2024-04-19 16:00:00模型,国产,参数,媒体,天工,模型

规范深度合成技术中国走在全球前列（专家解读）

...提出的生成对抗网络（GANs）、2020年提出的生成式预训练模型（GPT-3），大幅提升了多媒体数据合成的逼真程度，推动了“人工智能生成内容”和“元宇宙”等一系列新型智能应用形态。目前，深度合成技术已衍生出面部替换、...……更多

2023-01-30 05:36:00专家解读,中国,前列,深度,专家,全球

让霉霉说地道中文，背后玩家竟来自中国，7个月收入百万美元

...内的一个初创团队做的。全网爆火，HeyGen被网友疯玩全网火爆，网友纷纷动手玩了起来。网友@Gorden Sun也复刻了一段霉霉说中文的视频，在排队等待7000个视频后，用HeyGen制作的视频翻译终于完成了。并直言：“效果绝对目前最好...……更多

2023-10-23 19:41:00中文,中国,地道,背后,收入,玩家

喜马拉雅珠峰语音生成技术实现5秒极速克隆，亮相云栖大会

...新的自研语音技术成果，包括喜马拉雅珠峰语音生成式大模型和第二代智能语音交互系统，为参会者展示AIGC与文娱音频产业深度融合的最新成果。据了解，喜马拉雅珠峰语音生成式大模型是喜马拉雅的一项创新性技术，具备快...……更多

2023-11-01 17:06:00喜马拉雅,语音,生成,大会,技术,喜马拉雅

百元机皇！西圣Mike专业无线麦克风来了

...通过开创\"预处理、分割、降噪、提升\"的多重降噪算法模型，配合1+1麦克风阵列技术、ALPT高密度拾音技术以及采用更高标准的32位浮点数计算的DSP发烧级Ai降噪芯片，将，声音清晰度高达98%、抗噪性达到了92%。为了做到更好收音...……更多

2024-04-30 16:19:00风来,麦克,百元,无线,专业,麦克

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能

...新的今天，OpenAI公司隆重宣布，其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能，更在实时对话、图文分析等方面实现了质的飞跃，被誉为钢铁侠中全能AI管家贾维斯的现实版。GPT-4o...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

模拟机架式调音台市场运行机制研究及发展趋势分析报告

...究经验，在行业研究领域利用行业生命周期理论、SCP分析模型、PEST分析模型、波特五力竞争分析模型、SWOT分析模型、波士顿矩阵、波特钻石理论模型等，形成了自身独特的研究方法和产业评估体系。下表展示了本报告所采用的...……更多

2024-10-31 09:24:00调音台,机架式,机架,分析报告,机制,趋势

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...沿技术研究和提供企业级解决方案。我们目前围绕四个大模型（生成式3D大模型、生成式音频大模型、生成式动作大模型、对话大模型）在开展技术自研，后续将推动规模化落地应用。前段时间GPT-4o的问世，相信大家都看到很多...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

创新科技CREATIVE携最新音频力作亮相深圳国际音频展

...耳机通过SuperX-Fi®空间全息技术，巧妙地将声音的每一个细节放大，带来如同音乐会现场一般的真实感受。无论是低音的厚重回响，还是高音的清澈飘扬，都能在耳中呈现出令人惊叹的立体感，仿佛每一个音符都在你耳边舞动。S...……更多

2024-09-13 14:52:00音频,力作,深圳,国际,科技,声音

融资1600万美元，这家法国AI创企推新语音转录引擎，支持1

...识别他的法语口音。他说：“考虑到目前大多数语音识别模型主要在英语音频数据上训练，存在固有的偏见，Gladia优先构建了第一个真正多语言的实时产品。”此外，Gladia引擎的特别之处在于能够即时从对话中提取信息，如来电...……更多

2024-10-17 09:45:00法国,融资,语音,语言,引擎,支持

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替

它来了它来了，苹果的Apple Intelligence终于与果粉见面了！随着iOS 18.1 Beta版的上线，注册开发者从即日起就能体验到苹果AI的部分功能。最明显的一处就是Siri的全面换新，变身成了Apple Intelligence & Siri。另一项重磅更新就是写...……更多

2024-07-31 09:39:00情商,火爆,模型,苹果,模型,苹果

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

RTE2023 泛娱乐论坛精彩回顾

...平台以用户搜索为主,所以针对国内的产品更强调游戏的火爆程度和辨识度,在《萌宠宠之战》中,Starscape也是基于这两大特点将游戏设计得更激烈,更具对抗性。技术上,由于国内的用户基数很大,大规模的渲染以及高负载也是弹幕游...……更多

2023-10-27 18:02:00精彩回顾,娱乐,论坛,直播,玩法,产品

虚拟和现实世界已分不清！OpenAI首个AI视频模型发布：6

...秒的视频，并非真实拍摄，而是OpenAI最新的“文生视频”模型Sora，这一段文字描述就是段Prompt（提示词）。当地时间2月15日，人工智能（AI）巨头OpenAI宣布，正在研发“文生视频”模型Sora，可以创建长达60秒的视频，其中包含高...……更多

2024-02-16 14:19:00视频,生成,模型,现实,世界,视频

旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包

...视频的长度。与阿里 EMO、微软 VASA 等最新涌现的 AI 视频模型不同，旷视 MegActor 将采用开源的方式，提供给开发者社区使用。MegActor 能够呈现出丝毫毕现的效果，面部细节更加丰富自然，画质更出色。为了进一步展示其泛化性，...……更多

2024-06-28 09:41:00人像,生成,表情,输入,照片,视频

AI“明星”选手巅峰对决！记者实测最新谷歌Gemini与GP

...代”。GPT-4o的“o”代表“omni”，一词意为“全能”，该模型能够实现无缝的文本、视频和音频输入，并生成相应模态的输出，真正意义上实现了多模态交互。紧随其后一天，年度Google I/O开发者大会如期而至，谷歌CEO Sundar Pichai...……更多

2024-05-17 14:26:00实测,巅峰,选手,记者,明星,模型

AI 已死？不，AIGC 给我们带来了新的希望 | 氪记 2

...破百万，而到达这个数字，推特用了两年。因为 ChatGPT 的火爆，OpenAI 在大语言训练模型领域的积累也逐渐被看到——ChatGPT采用最新的GPT3.5模型，模型中首次采用 RLHF（从人类反馈中强化学习）方式。OpenAI 最初于 2017 年提出的 GPT...……更多

2023-01-05 09:26:00模型,生成,用户,技术,应用,图像

广东新增联合实验室打造生成式音频大模型

...韵律、情绪的可编辑音频，打造业界领先的生成式音频大模型。香港中文大学(深圳)趣丸科技联合实验室成立。香港中文大学(深圳)供图随着《广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见》出台，广东...……更多

2024-05-21 20:24:00广东,生成,实验室,模型,音频,实验

2024世界计算大会论道：万兴科技大模型加速改变音视频内容生

...视频行业呈现短剧频出、爆款不断的态势；平台层面社媒火爆、付费火热，全球主流社媒平台已全面视频化；技术层面伴随AI技术深化应用，音视频产业已迎来效率提升和价值增长新机遇。“大模型正在从1.0图文时代加速进入以...……更多

2024-09-25 17:26:00音视,万兴,模型,成本,大会,结构

谷歌之后，OpenAI也要给新闻网站付费了？

大模型的发展离不开语料，但语料可不是凭空产生。在吞完免费内容后，付费的优质内容，必然成为大模型的选择对象，这样以来，就涉及到成本问题了。近两年，大模型喷涌，它们在文字、图片、音视频等内容形态的生成上...……更多

2024-07-10 15:13:00新闻,网站,模型,内容,新闻,版权

AIGC音乐的中场战事：从技术、产品到商业规则

...”。11月16日，谷歌旗下 DeepMind发布了最新的AIGC音乐生成模型Lyria，并与YouTube合作打造了两个重要应用场景：Dream Track和Music AI tools。同时，谷歌和YouTube还将AI识别工具SynthID扩展到音乐领域，为Lyria生成的AI作品打上水印……更多

2023-11-22 13:47:00战事,规则,商业,产品,技术,音乐