• 我的订阅
  • 头条热搜
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
亚马逊开发史上最大文本转语音模型
2月18日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音(TTS)、自动语音识别(ASR)或翻译,在其他模态数据和任务上的泛化能力十分有限。在大型语言模型(LLM)性能不断提升的情...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...起来了~接下来,具体康康获奖论文有哪些~上交大CMU等团队获最佳论文此次共有5项研究成果获得EMNLP’24最佳论文奖。1、An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance(图像能表达千言万语……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...进一步加强模型的语音推理能力。另一方面,本文所采用训练方案可有效迁移至任意语言大模型,通过增加少量参数及分阶段训练,在尽可能保留模型原始推理能力的同时,为模型加上 「听、说」的语音交互能力。 为了验证方...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...来深度学习的快速进步,用录音室环境下的干净单人语音训练模型,已经可以达到人类同等水平的质量,但零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中,模型只能参照一段简短的陌生语音样本,用相同的...……更多
...太空中收集能量。据外媒,来自美国加州理工学院的科研团队近期在这个方向上迈出了关键一步,他们成功利用轨道卫星收集到太阳能,并成功将其传输到地球。点评:这项实验为未来的太空太阳能站的建设和运营提供了重要的...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经网络处理。行业内认为,这是一种可以将音频直接映射到音频作为一级模态的技术方法,涉及 Token 化和架构等方面的研...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 50 亿参数的 PaLI-3 重新点燃了关于复杂 VLM 核心组成部分的研究,可能推动新一代规模更大的模型的发展。 更高分辨率的多模态学习最近,大型视觉语言...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Lab 的技术创新与突破为了解决上述难题,巨人网络 AI Lab 团队中的算法专家和语言学家共同努力,基于中国方言体系,构建了涵盖 20 种方言、超过 20 万小时的普通话和方言数据集。通过这一庞大的数据集,我们训练出了第一个...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...分钟;“三声有幸”项目,累计服务1368万人,助力公益团队创建无障碍应用超3万个。未来:智能语音+认知大模型,用人工智能建设美好世界记者了解到,因2021年、2022年国家科学技术奖暂停的缘故,2023年度国家科学技术奖积累...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的速度已经接近人类速度Figure 的创始人 Brett Adcock 和 AI 团队的负责人 Corey Lynch 在 X 上解释了此次视频中机器人互动背后的原理。此次的突破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...上做出大突破。与DALL・E一样,两点依旧是CLIP模型,除了训练数据庞大,CLIP基于Transformer对图像块建模,并采用对比学习训练,最终帮助DALL・E2取得了不错的生成效果。下图是DALL・E2根据“一只戴着贝雷帽、穿黑色高领毛衣的柴...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...ma2自己给自己微调,性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法,使得微调后的Llama 2-70B模型在AlpacaEval 2.0排行榜中超越了GPT-4、Claude 2和Gemini Pro等领先的大语言模型。这项研究的突...……更多
...是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练;星辰语音大模型也是业内首个...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...,Figure 01不管是在理解能力,还是推理反应都非常强大。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。并且整段视频没有任何加速,也没有任何剪辑,全部一镜到底拍摄。根据Figure团队负责人Cor...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...语形式流传,缺乏对应文字,并且难以收集,可用于模型训练的方言语料数据偏少。信也科技算法科学家倪博溢。10月24日,第八届信也科技杯算法大赛总决赛上,9支人工智能队伍角逐,探索利用AI技术识别和还原语音数据中的...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...音,也不能输出笑声、歌声或情感表达。利用GPT-4o,OpenAI训练了一个跨文本、视觉和音频的端到端新模型,这意味着所有输入和输出都由同一个神经网络处理,这是OpenAI第一个结合所有这些模式的模型,OpenAI仍在探索模型的功能...……更多
05后华人高中生兄弟创业AI教育,用AI给在街上游荡的孩子们讲故事
...备交给孩子。除了软件,敲敲门还配有相应的硬件产品,团队对不同的硬件设备做了适配。比如白天,孩子们可以在不伤眼的墨水书上使用AI绘本。来源:敲敲门AI而到了晚上,家长还可以用投影仪把故事投到天花板上,和孩子...……更多
...战。米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。据介绍,用户可有数量限制地免费使用GPT-...……更多
美AI巨头被控秘密“侵吞”数据
...本报记者 张佳欣人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他...……更多
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...生成没采集过的声音,并与录音部分保持音色一致。言犀团队使用的声学模型,也从自回归模型转向非自回归,推理更加稳定。到如今,言犀团队使用主流的freespeech2模型,训练和合成语音的速度更快,音质也超过所有自回归模...……更多
谷歌发布Translatotron 3 模型
...2023年5月27日发布的一篇论文中,宣布正在部署新方法,训练Translatotron3。研究人员称,Translatotron2已经提供了卓越的翻译质量、语音鲁棒性(Robust)和语音自然度,而Translatotron3实现“第一个完全无监督直接语音到语音翻译的端...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
四大新功能让生成式AI“如虎添翼”
...人工智能(AI)技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络等方法,自动生成各种类型的内容,例如文章、视频、图片、音乐、代码等。AIGC代表了AI技术发展的新趋势。过去传统AI偏向分析能力,而现...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...多种语言的支持。Cowen向VentureBeat透露道,得益于他们的训练过程,EVI 2实际上自主学习了多种语言,不需要由工程师进行人为的训练。“我们没有专门训练模型输出某些特定的语言,但它从训练数据中学会了说法语、西班牙语、...……更多
融资1600万美元,这家法国AI创企推新语音转录引擎,支持100种语言
...adia代表了我们在XAnge所推崇的品质:一支大胆的全球科技团队,处于AI创新的前沿,拥有成熟的商业模式,能够为各个行业带来新机遇。在快节奏的AI环境中,Jean-Louis Quéguiner和他的团队表现非常出色,我们很自豪能够支持Gladia...……更多
更多关于科技的资讯:
400名OpenAI员工迎股票套现机会 每人最多1000万美元
快科技12月18日消息,近期,约400名OpenAI的现任及前任员工即将迎来一笔意外之财——数百万美元的套现机会。这一举动源自于旧金山的这家创新巨头与日本软银集团达成的一项特殊股票回购协议
2024-12-18 21:21:00
全网唯一!AMD X870E主板完美达成192GB DDR5:6400MHz高频、C28低时序
快科技12月18日消息,佰维宣布,已经达成192GB容量、6400MHz频率、C28时序的单系统内存配置,各项参数都堪称完美
2024-12-18 21:21:00
别担心了!iPhone 17 Pro后摄还是三角排列
快科技12月18日消息,近日,关于iPhone 17 Pro的外观爆料引发全网激烈讨论,消息称苹果将带来六年最大设计换代
2024-12-18 21:51:00
折叠屏手机鼻祖柔宇宣告破产:名下资产首拍无果 二拍降价近2.5亿元
快科技12月18日消息,不久前宣告破产的国内柔性显示屏独角兽——深圳柔宇显示技术有限公司名下资产一拍以流拍告终。据最新报道称
2024-12-18 21:51:00
广汽飞行汽车AirJet亮相:8轴8桨与双涵道构型 续航超200km
快科技12月18日消息,广汽今日举办了广汽飞行汽车发布会,发布全新飞行汽车品牌GOVY(高域),第二款飞行汽车产品GOVY AirJet也首发亮相
2024-12-18 22:21:00
华为AR-HUD规模化上车:超过20款在研车型将搭载
快科技12月18日消息,华为今天与十余家供应商完成智能车载光业务合作签约,范围涵盖智能HUD、车灯模组领域。据了解,华为智能车载光领域创建于2021年
2024-12-18 22:21:00
DC新《超人》电影先导预告来了:超人一飞冲天
快科技12月18日消息,DC电影宇宙即将带来全新力作——《超人》的30秒先导预告片即将到来,预示着一场视觉盛宴的序幕正式拉开
2024-12-18 22:51:00
母女二人睡觉正酣 插线板竟“放火”烧家
据北京大兴消防消息,近日,北京市大兴区一居民楼8层某住户家中清晨6时许突发火灾。接警后,消防部门迅速响应并赶往现场。幸运的是
2024-12-18 23:51:00
非洲矿业大国控告苹果公司使用“罪恶金属”
根据媒体周二报道,以丰富矿产资源著称的刚果民主共和国,已经在法国和比利时对苹果公司提出刑事控告,指控科技巨头在供应链中使用来自该国犯罪组织的金属矿产
2024-12-18 23:51:00
车主办完贷款被告知车卖给了别人 宝马4S店给银行的登记证书是假的
快科技12月18日消息,日前,一位车主发网上发帖投诉称,自己的宝马新车在4S店被盗了。车主提供的情况说明中显示,他今年7月份
2024-12-18 23:51:00
海外媒体宣发:打开国际传播的新大门
一、何为海外媒体宣发?(一)定义阐述海外媒体宣发,简单来说,就是把产品、活动或品牌等相关信息,借助海外的新闻媒体、社交媒体
2024-12-18 21:31:00
三星在印度推送One UI 7 Beta 面向S24用户
【CNMO科技消息】据外媒报道,近日,三星正式面向印度的GalaxyS24系列用户开放了OneUI7Beta测试计划。用户现在可以通过SamsungMembers应用程序报名参与测试
2024-12-18 22:43:00
华为在马来西亚举行旗舰新品发布会 Mate X6将亮相
【CNMO科技消息】据CNMO了解,华为将于12月18日,即今日在马来西亚举行旗舰新品发布会,推出MateX6折叠屏手机
2024-12-18 22:44:00
苹果地图网页版迎来升级!新增支持“环顾四周”功能
【CNMO科技消息】苹果于7月份首次推出的网页版苹果地图已经升级,支持“环顾四周”功能。该功能本质上相当于谷歌街景。在支持的区域中
2024-12-18 22:44:00
海信电视用户满意度连续10年蝉联第一 含金量满满!
【CNMO科技消息】12月13日,在南宁举办的“2024年满意中国大会”上,中国质量协会发布了2024年用户满意等级评价结果
2024-12-18 22:45:00