• 我的订阅
  • 头条热搜
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
亚马逊开发史上最大文本转语音模型
2月18日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...起来了~接下来,具体康康获奖论文有哪些~上交大CMU等团队获最佳论文此次共有5项研究成果获得EMNLP’24最佳论文奖。1、An image speaks a thousand words, but can everyone listen? On image transcreation for cultural relevance(图像能表达千言万语……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...进一步加强模型的语音推理能力。另一方面,本文所采用训练方案可有效迁移至任意语言大模型,通过增加少量参数及分阶段训练,在尽可能保留模型原始推理能力的同时,为模型加上 「听、说」的语音交互能力。 为了验证方...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...来深度学习的快速进步,用录音室环境下的干净单人语音训练模型,已经可以达到人类同等水平的质量,但零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中,模型只能参照一段简短的陌生语音样本,用相同的...……更多
...太空中收集能量。据外媒,来自美国加州理工学院的科研团队近期在这个方向上迈出了关键一步,他们成功利用轨道卫星收集到太阳能,并成功将其传输到地球。点评:这项实验为未来的太空太阳能站的建设和运营提供了重要的...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经网络处理。行业内认为,这是一种可以将音频直接映射到音频作为一级模态的技术方法,涉及 Token 化和架构等方面的研...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 50 亿参数的 PaLI-3 重新点燃了关于复杂 VLM 核心组成部分的研究,可能推动新一代规模更大的模型的发展。 更高分辨率的多模态学习最近,大型视觉语言...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Lab 的技术创新与突破为了解决上述难题,巨人网络 AI Lab 团队中的算法专家和语言学家共同努力,基于中国方言体系,构建了涵盖 20 种方言、超过 20 万小时的普通话和方言数据集。通过这一庞大的数据集,我们训练出了第一个...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...分钟;“三声有幸”项目,累计服务1368万人,助力公益团队创建无障碍应用超3万个。未来:智能语音+认知大模型,用人工智能建设美好世界记者了解到,因2021年、2022年国家科学技术奖暂停的缘故,2023年度国家科学技术奖积累...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的速度已经接近人类速度Figure 的创始人 Brett Adcock 和 AI 团队的负责人 Corey Lynch 在 X 上解释了此次视频中机器人互动背后的原理。此次的突破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...上做出大突破。与DALL・E一样,两点依旧是CLIP模型,除了训练数据庞大,CLIP基于Transformer对图像块建模,并采用对比学习训练,最终帮助DALL・E2取得了不错的生成效果。下图是DALL・E2根据“一只戴着贝雷帽、穿黑色高领毛衣的柴...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...ma2自己给自己微调,性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法,使得微调后的Llama 2-70B模型在AlpacaEval 2.0排行榜中超越了GPT-4、Claude 2和Gemini Pro等领先的大语言模型。这项研究的突...……更多
...是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练;星辰语音大模型也是业内首个...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...,Figure 01不管是在理解能力,还是推理反应都非常强大。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。并且整段视频没有任何加速,也没有任何剪辑,全部一镜到底拍摄。根据Figure团队负责人Cor...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...语形式流传,缺乏对应文字,并且难以收集,可用于模型训练的方言语料数据偏少。信也科技算法科学家倪博溢。10月24日,第八届信也科技杯算法大赛总决赛上,9支人工智能队伍角逐,探索利用AI技术识别和还原语音数据中的...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...音,也不能输出笑声、歌声或情感表达。利用GPT-4o,OpenAI训练了一个跨文本、视觉和音频的端到端新模型,这意味着所有输入和输出都由同一个神经网络处理,这是OpenAI第一个结合所有这些模式的模型,OpenAI仍在探索模型的功能...……更多
05后华人高中生兄弟创业AI教育,用AI给在街上游荡的孩子们讲故事
...备交给孩子。除了软件,敲敲门还配有相应的硬件产品,团队对不同的硬件设备做了适配。比如白天,孩子们可以在不伤眼的墨水书上使用AI绘本。来源:敲敲门AI而到了晚上,家长还可以用投影仪把故事投到天花板上,和孩子...……更多
...战。米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。据介绍,用户可有数量限制地免费使用GPT-...……更多
美AI巨头被控秘密“侵吞”数据
...本报记者 张佳欣人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他...……更多
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...生成没采集过的声音,并与录音部分保持音色一致。言犀团队使用的声学模型,也从自回归模型转向非自回归,推理更加稳定。到如今,言犀团队使用主流的freespeech2模型,训练和合成语音的速度更快,音质也超过所有自回归模...……更多
谷歌发布Translatotron 3 模型
...2023年5月27日发布的一篇论文中,宣布正在部署新方法,训练Translatotron3。研究人员称,Translatotron2已经提供了卓越的翻译质量、语音鲁棒性(Robust)和语音自然度,而Translatotron3实现“第一个完全无监督直接语音到语音翻译的端...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
四大新功能让生成式AI“如虎添翼”
...人工智能(AI)技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络等方法,自动生成各种类型的内容,例如文章、视频、图片、音乐、代码等。AIGC代表了AI技术发展的新趋势。过去传统AI偏向分析能力,而现...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...多种语言的支持。Cowen向VentureBeat透露道,得益于他们的训练过程,EVI 2实际上自主学习了多种语言,不需要由工程师进行人为的训练。“我们没有专门训练模型输出某些特定的语言,但它从训练数据中学会了说法语、西班牙语、...……更多
融资1600万美元,这家法国AI创企推新语音转录引擎,支持100种语言
...adia代表了我们在XAnge所推崇的品质:一支大胆的全球科技团队,处于AI创新的前沿,拥有成熟的商业模式,能够为各个行业带来新机遇。在快节奏的AI环境中,Jean-Louis Quéguiner和他的团队表现非常出色,我们很自豪能够支持Gladia...……更多
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...安全了”,美国 CISA 等多家机构联合警告!▶周星驰 Web3 团队将上线独立 App;Gemini 刚发就惹质疑:效果视频疑似剪辑;Meta 推独立AI图像生成器|极客头条▶Linux 之父 Linus Torvalds:写代码很容易,人际关系太难了!返回搜狐,查...……更多
更多关于科技的资讯:
11月28日至30日,2024中国数字化年会在成都举行。其间举行2024第七届数字化转型与创新评选颁奖典礼,来自我市的太原罗克佳华工业有限公司
2024-12-01 07:39:00
高质量发展调研行天津北方网讯:10公里温降不超过1℃,远距离传输时温度基本没有衰减。一条天津本土的保温管,凭借出色的性能屡屡被海南博鳌论坛
2024-12-01 09:16:00
写在第二届链博会闭幕之际:续写更多“共赢链”之约的故事
本文转自:人民网唐佳第二届中国国际供应链促进博览会现场。人民网唐佳摄东方有约,万商云集。11月30日,第二届中国国际供应链促进博览会(以下简称“链博会”)圆满闭幕
2024-12-01 09:31:00
南报网讯(记者张甜甜)11月28日,第七届江苏人工智能大会在江苏扬州举行,多家南京企业现场亮出AI“科技绝活”,展示人工智能如何赋能千行百业
2024-12-01 09:59:00
何以中国·弦歌不辍丨探秘地心的造“梦”者
本文转自:人民网何以中国·弦歌不辍丨探秘地心的造“梦”者——访“梦想”号副总设计师赵建亭方经纶2024年11月,我国自主设计建造的首艘大洋钻探船“梦想”号正式入列
2024-12-01 10:12:00
本文转自:人民网-湖南频道人民网长沙11月30日电 近日,国网湖南综合能源公司自主研发的基于区块链技术的新型储能智慧集控平台
2024-12-01 10:15:00
新一代量子金刚石磁力仪在合肥高新区诞生
大皖新闻讯 电子学模块仅一个充电宝大小、产品主要参数达到国际领先水平、可用于航磁物探等领域……11月28日,由辖区企业国盛量子自主研发的新一代量子金刚石磁力仪QDM-100在合肥高新区正式发布
2024-12-01 10:15:00
铲铲猫砂工厂投产仪式暨小兽科技“王如花”品牌新品发布会圆满举行
大众网记者 宋学敏 潍坊报道11月28日,铲铲猫砂工厂投产仪式暨小兽科技“王如花”品牌新品发布会在小兽科技铲铲猫砂产业园隆重举行
2024-12-01 10:17:00
本文转自:人民网11月30日,2024-2025赛季单板及自由式滑雪大跳台世界杯继续在北京首钢“雪飞天”进行。作为此次赛事官方合作伙伴
2024-12-01 10:22:00
潜成思源公司:以工匠精神书写高质量发展新篇 扫码阅读手机版
天津北方网讯:党的十八大以来,我国把绿色低碳和节能减排摆在突出位置。在津南区小站工业园区,一家潜水电泵生产企业,正以工匠精神潜心钻研
2024-12-01 10:27:00
中国柒牌携手欧睿发布五项全球领先数据
11月29日,中国柒牌携手欧睿国际举办了全球声明发布会。会上,权威市场调查机构欧睿向中国柒牌正式签署并颁发了“中华立领新中式男装全球销量第一”在内的五项声明成就
2024-12-01 10:47:00
片仔癀化妆品荣获“大国好货·2024年度品牌企业”
怀大国匠心,造品质好货。2024年11月28日,第31届中国国际广告节大国好货嘉年华在福建厦门国际会议展览中心B1馆盛大启幕
2024-12-01 10:49:00
九牧携手比亚迪仰望联合发布,硬核科技亮相全球!
11月29日,“大国好货嘉年华——九牧以旧换新全国发布仪式”在厦门隆重举行。本次发布会不仅是九牧集团积极响应国家“以旧换新”政策号召的一项重大行动
2024-12-01 10:53:00
综合AutoNews及Carscoops今日报道,大众与美国造车新势力Rivian斥资58亿美元(IT之家备注:当前约420
2024-12-01 00:03:00
首发 AMD锐龙77840HX处理器的微星雷影17新品将于12月1日0点上市,补贴前7599元。这款游戏本采用了AMD锐龙77840HX移动处理器
2024-12-01 00:06:00