• 我的订阅
  • 头条热搜
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
亚马逊开发史上最大文本转语音模型
2月18日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...进一步加强模型的语音推理能力。另一方面,本文所采用训练方案可有效迁移至任意语言大模型,通过增加少量参数及分阶段训练,在尽可能保留模型原始推理能力的同时,为模型加上 「听、说」的语音交互能力。 为了验证方...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...来深度学习的快速进步,用录音室环境下的干净单人语音训练模型,已经可以达到人类同等水平的质量,但零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中,模型只能参照一段简短的陌生语音样本,用相同的...……更多
...太空中收集能量。据外媒,来自美国加州理工学院的科研团队近期在这个方向上迈出了关键一步,他们成功利用轨道卫星收集到太阳能,并成功将其传输到地球。点评:这项实验为未来的太空太阳能站的建设和运营提供了重要的...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 50 亿参数的 PaLI-3 重新点燃了关于复杂 VLM 核心组成部分的研究,可能推动新一代规模更大的模型的发展。 更高分辨率的多模态学习最近,大型视觉语言...……更多
雷军杀入大模型
...型发展定调!继任命栾剑担任技术委员会AI实验室大模型团队负责人后,雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC的看法。除了定下发展基调,雷军还透露,对于大模型,小米“正在研发一些有趣的技术和产品...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Lab 的技术创新与突破为了解决上述难题,巨人网络 AI Lab 团队中的算法专家和语言学家共同努力,基于中国方言体系,构建了涵盖 20 种方言、超过 20 万小时的普通话和方言数据集。通过这一庞大的数据集,我们训练出了第一个...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...分钟;“三声有幸”项目,累计服务1368万人,助力公益团队创建无障碍应用超3万个。未来:智能语音+认知大模型,用人工智能建设美好世界记者了解到,因2021年、2022年国家科学技术奖暂停的缘故,2023年度国家科学技术奖积累...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的速度已经接近人类速度Figure 的创始人 Brett Adcock 和 AI 团队的负责人 Corey Lynch 在 X 上解释了此次视频中机器人互动背后的原理。此次的突破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...上做出大突破。与DALL・E一样,两点依旧是CLIP模型,除了训练数据庞大,CLIP基于Transformer对图像块建模,并采用对比学习训练,最终帮助DALL・E2取得了不错的生成效果。下图是DALL・E2根据“一只戴着贝雷帽、穿黑色高领毛衣的柴...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...ma2自己给自己微调,性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法,使得微调后的Llama 2-70B模型在AlpacaEval 2.0排行榜中超越了GPT-4、Claude 2和Gemini Pro等领先的大语言模型。这项研究的突...……更多
...是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练;星辰语音大模型也是业内首个...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...,Figure 01不管是在理解能力,还是推理反应都非常强大。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。并且整段视频没有任何加速,也没有任何剪辑,全部一镜到底拍摄。根据Figure团队负责人Cor...……更多
Bonus独家 | 揭秘腾讯大模型新项目组「混元助手」人才地图
...职场Bonus从多处信源得知:该项目组将联合腾讯内部多方团队构建大参数语言模型,目标是“通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手,并能成为国内的业界标杆”。腾讯的底气之一,是...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...语形式流传,缺乏对应文字,并且难以收集,可用于模型训练的方言语料数据偏少。信也科技算法科学家倪博溢。10月24日,第八届信也科技杯算法大赛总决赛上,9支人工智能队伍角逐,探索利用AI技术识别和还原语音数据中的...……更多
“百模大战”,国产 GPT 大全
...叫小冰框架。微软小冰是微软 Bing(“必应”)搜索中国团队发布的一款智能聊天机器人,集成了微软在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,具有非常强大的机器学习能力,是全球第一个以培养情...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...音,也不能输出笑声、歌声或情感表达。利用GPT-4o,OpenAI训练了一个跨文本、视觉和音频的端到端新模型,这意味着所有输入和输出都由同一个神经网络处理,这是OpenAI第一个结合所有这些模式的模型,OpenAI仍在探索模型的功能...……更多
详解京东产业版GPT:千亿级大模型拟今年发布,已明确有垂直客户需求
...息抽取、情感分类五大应用。而这一系列技术均由何晓冬团队研发的。(详见钛媒体App前文:)据何晓冬介绍,早在2020年,京东全球科技探索者大会上首次发布“言犀”平台,可以看作是京东 AI 技术商业化的重要一步。两年半...……更多
05后华人高中生兄弟创业AI教育,用AI给在街上游荡的孩子们讲故事
...备交给孩子。除了软件,敲敲门还配有相应的硬件产品,团队对不同的硬件设备做了适配。比如白天,孩子们可以在不伤眼的墨水书上使用AI绘本。来源:敲敲门AI而到了晚上,家长还可以用投影仪把故事投到天花板上,和孩子...……更多
...战。米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。据介绍,用户可有数量限制地免费使用GPT-...……更多
美AI巨头被控秘密“侵吞”数据
...本报记者 张佳欣人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他...……更多
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...生成没采集过的声音,并与录音部分保持音色一致。言犀团队使用的声学模型,也从自回归模型转向非自回归,推理更加稳定。到如今,言犀团队使用主流的freespeech2模型,训练和合成语音的速度更快,音质也超过所有自回归模...……更多
下一个AI颠覆性应用发生在音乐领域?
...在,AI正在下一个领域掀起浪潮。近期,谷歌的一个研究团队发布了新的AI模型MusicLM,这是一种可将文本信号转换为音频片段的音乐生成器。继ChatGPT之后,音乐或将成为AI生成的前沿领域。这是创意AI在短短几年内创新步伐飞速的...……更多
谷歌发布Translatotron 3 模型
...2023年5月27日发布的一篇论文中,宣布正在部署新方法,训练Translatotron3。研究人员称,Translatotron2已经提供了卓越的翻译质量、语音鲁棒性(Robust)和语音自然度,而Translatotron3实现“第一个完全无监督直接语音到语音翻译的端...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...原始代码是公开的,但每个版本的开发过程由一个专属的团队管控;一种是市集模式,原始代码同样是公开的,不过是放在互联网上供人检视及开发,最直接的例子就是Linux。最终“市集模式”证明了开源比闭源更加高效,全球9...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
更多关于科技的资讯:
本文转自:人民网-广西频道近日,南方电网广西电网公司创新开发推出首个3D数字藏品“小赫兹‘壮壮’‘美美’零碳游山水”,向社会传递广西电网“零碳绿电”举措助力桂林世界级旅游城市建设的美好寓意
2024-10-01 12:46:00
澎湃OS体验增强版Beta发力:多款机型获推新版本
在操作系统方面,小米手机一直都极具争议声,虽然这几年的市场发展速度非常迅速,但在操作系统方面的压力还是很大的。一方面,如今各大手机厂商都在系统方面进行了很大幅度的发力
2024-10-01 12:50:00
红米K80系列:续航、影像、性能均清晰,有望重现“焊门员”
如今的中端手机市场竞争很激烈,对于预算不足,又或者是喜欢高性价比的消费者来说,确实很容易产生选择的欲望。而说到性价比方向
2024-10-01 12:51:00
魅族Lucky 08已正式发布
期待许久的魅族Lucky08终于正式发布了,而红米Note14系列也是进入了发布倒计时阶段,产品本身的配置参数也是没有什么悬念
2024-10-01 12:51:00
澎湃OS体验增强版Beta已推送:动效升级,游戏功耗大降!
每次提及操作系统优化的时候,小米手机总是被吐槽的一位,甚至直到现在,也是有很多消费者对澎湃OS系统进行疯狂吐槽。不过自从8月份大更新之后
2024-10-01 13:53:00
OPPO发力:ColorOS 9月大升级出炉
如今的手机厂商不仅内卷新机,系统优化方面也是没有闲着,或许只有这样,才能够在竞争激烈的市场中取得好的成功。不过这也让整个手机市场变得非常内卷
2024-10-01 13:54:00
终来到!鸿蒙NEXT系统:10月公测
说实在的,在这个科技飞速发展的时代,鸿蒙NEXT诞生之后的市场吸引力真的很强,甚至让很多厂商都对其进行了适配。因为这不仅仅是一个操作系统的名称
2024-10-01 13:54:00
vivo X200 Pro再迎曝光:30W无线+2亿大底潜望
当手机市场很内卷的时候,消费者对于手机的期待已经不仅仅局限于基本的通讯功能,而是更加关注其在影像、性能、续航等方面的综合表现
2024-10-01 13:54:00
一加13通过3C认证,确认配备100W超级快充
根据最近泄露的消息,一款型号为PJZ110的设备已经在中国获得了3C认证,被认为一加13。认证信息显示一加13将采用100W快充
2024-10-01 13:55:00
来了!纯血鸿蒙,开始面向普通用户推送!
在前段时间举办的华为秋季发布会上,余承东表示,华为原生鸿蒙操作系统——HarmonyOSNEXT将于10月8日开启公测
2024-10-01 13:55:00
快于友商!vivo X200系列突然官宣,关键配置基本没悬念
vivoX200系列作为vivo品牌的年度旗舰之作,自曝光以来便备受关注,也让很多消费者对其产生了极高的期待值和关注度
2024-10-01 13:55:00
芯片成本飙升!骁龙8 Gen4新机和天玑9400新机
在科技日新月异的今天,智能手机行业始终保持着快速迭代的步伐,尤其是性能方面的提升幅度,更是可以用夸张来进行形容。前几年的时候
2024-10-01 13:56:00
小米MIX5再次被确认:四微曲设计搭配屏下镜头,或明年发布!
不可否认,如今的手机市场中诞生了很多给力的新机,但大多数新机所内卷的方向都很一致,有的主打性价比,有的主攻配置参数。比如如今很多手机厂商都在采用大电池设计
2024-10-01 13:56:00
鸿蒙NEXT 0.0.70 Beta版全面推送
提及华为手机,这几年带来的惊喜真的非常多,无论是卫星通讯的加入,还是图库AI消除功能的创新,都展现了华为在技术创新上的不懈努力
2024-10-01 13:56:00
小米15 Pro设计大揭秘:银色玻璃+联名影像
不得不说,当各大手机厂商的新机节奏都在加快的时候,一些关于新机的消息也逐渐和大家进行见面了,甚至官方也会进行预热。无论是隔壁的vivo还是OPPO
2024-10-01 13:56:00