• 我的订阅
  • 头条热搜
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
LLaMA-Omni能够接收语音指令,同步生成文本和语音响应,响应延迟低至 226ms,低于 GPT-4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限...……更多
亚马逊开发史上最大文本转语音模型
2月18日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...进一步加强模型的语音推理能力。另一方面,本文所采用训练方案可有效迁移至任意语言大模型,通过增加少量参数及分阶段训练,在尽可能保留模型原始推理能力的同时,为模型加上 「听、说」的语音交互能力。 为了验证方...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...来深度学习的快速进步,用录音室环境下的干净单人语音训练模型,已经可以达到人类同等水平的质量,但零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中,模型只能参照一段简短的陌生语音样本,用相同的...……更多
...太空中收集能量。据外媒,来自美国加州理工学院的科研团队近期在这个方向上迈出了关键一步,他们成功利用轨道卫星收集到太阳能,并成功将其传输到地球。点评:这项实验为未来的太空太阳能站的建设和运营提供了重要的...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... Faster, Stronger”为题,已发表到预印本网站 arXiv 上。研究团队认为,仅有 50 亿参数的 PaLI-3 重新点燃了关于复杂 VLM 核心组成部分的研究,可能推动新一代规模更大的模型的发展。 更高分辨率的多模态学习最近,大型视觉语言...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Lab 的技术创新与突破为了解决上述难题,巨人网络 AI Lab 团队中的算法专家和语言学家共同努力,基于中国方言体系,构建了涵盖 20 种方言、超过 20 万小时的普通话和方言数据集。通过这一庞大的数据集,我们训练出了第一个...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...分钟;“三声有幸”项目,累计服务1368万人,助力公益团队创建无障碍应用超3万个。未来:智能语音+认知大模型,用人工智能建设美好世界记者了解到,因2021年、2022年国家科学技术奖暂停的缘故,2023年度国家科学技术奖积累...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的速度已经接近人类速度Figure 的创始人 Brett Adcock 和 AI 团队的负责人 Corey Lynch 在 X 上解释了此次视频中机器人互动背后的原理。此次的突破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...上做出大突破。与DALL・E一样,两点依旧是CLIP模型,除了训练数据庞大,CLIP基于Transformer对图像块建模,并采用对比学习训练,最终帮助DALL・E2取得了不错的生成效果。下图是DALL・E2根据“一只戴着贝雷帽、穿黑色高领毛衣的柴...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...ma2自己给自己微调,性能超越了GPT-4Meta和纽约大学的研究团队最近提出了一种创新的“自我奖励语言模型”方法,使得微调后的Llama 2-70B模型在AlpacaEval 2.0排行榜中超越了GPT-4、Claude 2和Gemini Pro等领先的大语言模型。这项研究的突...……更多
...是国内支持最多方言、覆盖人口最多的语音大模型;研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练;星辰语音大模型也是业内首个...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...,Figure 01不管是在理解能力,还是推理反应都非常强大。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。并且整段视频没有任何加速,也没有任何剪辑,全部一镜到底拍摄。根据Figure团队负责人Cor...……更多
...具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国一些研究团队也陆续发布各类检测工具,如西湖大学文本智能实验室研发的Fast-DetectGPT。人类的创作与AIGC之间存在哪些差异?AI检测工具如何根据...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...语形式流传,缺乏对应文字,并且难以收集,可用于模型训练的方言语料数据偏少。信也科技算法科学家倪博溢。10月24日,第八届信也科技杯算法大赛总决赛上,9支人工智能队伍角逐,探索利用AI技术识别和还原语音数据中的...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...音,也不能输出笑声、歌声或情感表达。利用GPT-4o,OpenAI训练了一个跨文本、视觉和音频的端到端新模型,这意味着所有输入和输出都由同一个神经网络处理,这是OpenAI第一个结合所有这些模式的模型,OpenAI仍在探索模型的功能...……更多
05后华人高中生兄弟创业AI教育,用AI给在街上游荡的孩子们讲故事
...备交给孩子。除了软件,敲敲门还配有相应的硬件产品,团队对不同的硬件设备做了适配。比如白天,孩子们可以在不伤眼的墨水书上使用AI绘本。来源:敲敲门AI而到了晚上,家长还可以用投影仪把故事投到天花板上,和孩子...……更多
...战。米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。据介绍,用户可有数量限制地免费使用GPT-...……更多
美AI巨头被控秘密“侵吞”数据
...本报记者 张佳欣人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他...……更多
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...生成没采集过的声音,并与录音部分保持音色一致。言犀团队使用的声学模型,也从自回归模型转向非自回归,推理更加稳定。到如今,言犀团队使用主流的freespeech2模型,训练和合成语音的速度更快,音质也超过所有自回归模...……更多
谷歌发布Translatotron 3 模型
...2023年5月27日发布的一篇论文中,宣布正在部署新方法,训练Translatotron3。研究人员称,Translatotron2已经提供了卓越的翻译质量、语音鲁棒性(Robust)和语音自然度,而Translatotron3实现“第一个完全无监督直接语音到语音翻译的端...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...有益的。值得一提的是,这篇论文来自 OpenAI 的超级对齐团队,其中几位作者在今年早些时候已经离开 OpenAI,团队也已经分崩离析。其中一位作者透露,这是该团队的最后一篇论文。 一个直观的例子为了提高模型输出的可读性...……更多
四大新功能让生成式AI“如虎添翼”
...人工智能(AI)技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络等方法,自动生成各种类型的内容,例如文章、视频、图片、音乐、代码等。AIGC代表了AI技术发展的新趋势。过去传统AI偏向分析能力,而现...……更多
抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩
...多种语言的支持。Cowen向VentureBeat透露道,得益于他们的训练过程,EVI 2实际上自主学习了多种语言,不需要由工程师进行人为的训练。“我们没有专门训练模型输出某些特定的语言,但它从训练数据中学会了说法语、西班牙语、...……更多
Gemini 超越 GPT-4 靠作弊?谷歌承认:是的,演示视频经过了剪辑
...安全了”,美国 CISA 等多家机构联合警告!▶周星驰 Web3 团队将上线独立 App;Gemini 刚发就惹质疑:效果视频疑似剪辑;Meta 推独立AI图像生成器|极客头条▶Linux 之父 Linus Torvalds:写代码很容易,人际关系太难了!返回搜狐,查...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...外前沿科技公司和科研机构基本上都形成了顶尖的大模型团队,这源于对创新型顶尖人才的汇聚,以及对基于大模型的AGI之路的执着和技术积累。OpenAI曾经在看不到前景和没有明显效果的阶段(2018~2021年),仍然坚定地投入大量人...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...ohnSchulman在接受科技播客主持人DwarkeshPatel采访时透露,后训练是提高模型性能的关键因素。GPT-4o的识图能力有多牛?四大维度深度体验基于图片类型,记者将识图功能的测评分为4大维度,分别为普通图像、特定专业领域的图像...……更多
火爆全球的Chat GPT,想毁灭人类?
...衍射情况,进而推算出蛋白质分子的结构。如今,DeepMind团队利用Alpha Fold构建了一个包含2亿多种蛋白质3D结构的数据库(几乎囊括了科学界所有已知的植物、细菌、真菌和动物产生的蛋白质),通过神经网络算法学习这些数据,...……更多
更多关于科技的资讯:
理想MEGA高速跑123km/h车主被扣12分罚200:或因错误识别
快科技12月25日消息,通常而言,在限速120km/h的高速路上,开小型客车如果超速在10%以内通常不会面临罚款或扣分
2024-12-25 18:06:00
《黄仁勋:英伟达之芯》作者:他内心仍把自己当中国人
快科技12月25日消息,近日腾讯科技采访了《黄仁勋:英伟达之芯》一书的作者斯蒂芬·威特,其中探讨了英伟达创始人黄仁勋的个人品质及其与企业文化的关系
2024-12-25 18:06:00
你去玩吗!日本面向中国公民新设10年旅游签:可停留天数延长至30天
12月25日消息,据报道,日本外相岩屋毅于12月25日在访问北京期间,表示针对中国公民签证的放宽措施。具体包括设立有效期10年的旅游签证
2024-12-25 18:06:00
变废为宝!全球最大甲酸钙装置投产
快科技12月25日消息,据报道,全球单套规模最大的甲酸钙生产装置日前在山东顺利开车投产。该装置为钢厂尾气高值化利用制甲酸钙装置
2024-12-25 18:06:00
《白雪公主》真人电影新剧照:邪恶皇后照魔镜
近日迪士尼《白雪公主》真人电影新剧照曝光,邪恶皇后出现在魔镜前。还有张剧照中,白雪公主和男主角乔纳森牵手。该片由瑞秋·泽格勒(《饥饿游戏
2024-12-25 18:06:00
男子为省停车费网购假车牌 结果行拘20天、罚款6000元
快科技12月25日消息,安徽警方今日披露了一起使用网购假号牌省停车费的案例。据介绍,近日,芜湖无为交警在开展日常路面整治工作中
2024-12-25 18:06:00
一箭11星!力箭一号冲击中国航天2024最后一发 淘宝88VIP冠名
12月25日,中科宇航官方宣布,力箭一号遥六运载火箭即将执行一箭11星发射任务,命名为“淘宝88VIP探索号”,并公布了任务徽章
2024-12-25 18:06:00
飞机上哪个座位最安全:后排中间
快科技12月25日消息,今日,阿塞拜疆航空公司的一架Embraer 190型飞机在哈萨克斯坦阿克套机场降落时与地面相撞
2024-12-25 18:36:00
九州风神推出FL12R系列机箱反叶风扇:配备36颗第二代ARGB灯珠
快科技12月25日消息,据报道,九州风神宣布推出FL12R系列机箱反叶风扇,提供了黑色和白色版本。售价139元起。FL12R机箱反叶风扇搭载了36颗第二代ARGB灯珠
2024-12-25 18:36:00
脑洞大开!小伙研发冬季防静电装置:我给自己接了跟地线
快科技12月25日消息,近日,一小伙自主研发了一个防静电装置的视频在网络走红。视频中,起因是小伙天天被静电电的哇哇叫,于是他脑洞大开
2024-12-25 18:36:00
柔宇资产二拍降价2.5亿又流拍!每月维护费用都要500万
快科技12月25日消息,柔宇显示公司资产12.3亿元起拍流拍后,又进行了降价二拍,起拍价仅9.8亿,目前已经结束,再次流拍
2024-12-25 18:36:00
全国统一心理援助热线:12356即将开通
内心烦恼,无人倾诉?现在好了,你可以直接拨打“12356”,咨询心理健康的相关知识,自有人替你排忧解难。据国家卫生健康委
2024-12-25 18:36:00
贵州首次!南航在黔开启空客A320飞机拆解工作
“吊起来,慢一点……好,放下……”2024年12月24日,南航贵州飞机维修厂(以下简称“维修厂”)机库内,一架空客A320飞机的拆解工作正在逐项有序开展
2024-12-25 22:44:00
突破行业局限,东郊到家如何打通健康与科技的无缝连接?
随着科技的不断进步和人们对健康关注度的提高,传统按摩行业正面临着新的挑战与机遇。如何将健康服务与现代科技结合,突破行业固有局限
2024-12-25 22:46:00
网友意外钓到“水老虎”:能吃的不像话 同类都不放过
最近在江西省,有位幸运的钓友成功钓起了一条大鱼,目测大概有七公斤半。从视频中看,这条鱼有着巨大且较尖的头部,上半身呈灰色
2024-12-25 18:36:00