• 我的订阅
  • 科技

抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩

类别:科技 发布时间:2024-09-21 09:47:00 来源:智东西

抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩

智东西9月19日消息,据VentureBeat今日报道,AI情感创企Hume AI于9月11日发布了Empathic Voice Interface 2(EVI 2)。

EVI被宣称为全球首个具有情商的对话式AI。EVI能够通过分析用户的语音,如口音、语气、语调、拟声词、节奏和停顿等,来理解用户的情绪和心理状态,并做出实时响应。

与EVI 1相比,新发布的EVI 2的响应延迟减少了40%,且成本降低了30%。此外,新一代EVI还进行了一系列功能增强与更新:语音质量的提高,情商与同理心的增强,支持自定义语音……

Hume AI由前谷歌DeepMind研究员Alan Cowen于2021年创立,他现在担任该公司的首席执行官兼首席科学家。该公司于今年3月27日完成了5000万美元的B轮融资。

抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩

官网地址:https://www.hume.ai/

一、功能增强:语音质量和情商的提升,还支持自定义语音

EVI 2集成了一个先进的语音生成模型和情感大型语言模型(eLLM),能够处理和生成文本及音频。这种多模态方法使得EVI 2生成的语音听起来更自然,语调更恰当,表现力更高,输出更连续。

此外,在同一模型中处理语音和语言,使得EVI 2可以更好地理解用户输入内容的情感倾向,从而做出相应调整,在内容和语气方面生成更具有同理心的响应。

除了在语音质量和情商方面的提升,新一代EVI 2还支持用户自定义语音。开发人员可以设置音调、鼻音和性别等参数,根据特定的应用需求定制EVI 2的语音,比如应用于客服机器人、虚拟AI助手。

EVI 2还支持用户在交互过程中通过语音提示,动态修改EVI 2的说话风格。例如,“说得更快”、“语调听起来很兴奋”,甚至还可以“进行说唱“。

根据Hume AI的介绍,EVI 2还能够与其他应用程序、大语言模型进行集成,在客服通话、网页搜索等功能中使用。

Cowen在上周与VentureBeat的视频通话中谈道:“我们希望开发者能够将这个模型集成到任何应用中,创建他们想要的品牌语音,并根据他们的用户需求进行调整,使其品牌语音变得值得信赖且具有个性。”

此外,他透露道,EVI 2并不打算提供语音克隆的功能。

“我们当然可以用我们的模型克隆声音,但我们没有提供这一功能,因为它的风险太高、益处也不清晰。”他解释道,“人们真正想要的是能够定制声音。我们开发了新的语音,让用户可以创建不同的个性化语音。相比于克隆特定声音,开发者似乎对创建新语音更感兴趣。”

抢先OpenAI!Hume AI发布第二代情感智能AI,支持自定义语音,在线可玩

定制语音功能体验地址:https://platform.hume.ai/evi/voices

二、性价比提高:响应延迟降低40%,定价降低30%,年底预计能支持更多语言

EVI 2与EVI 1相比,延迟降低了40%,现在平均响应时间在500到800毫秒之间。速度的改进使对话响应更快、更像人类。

EVI 2还有一大亮点是其成本效益的提高。Hume AI将EVI 2的定价降低了约30%,从第一代的每分钟0.102美元降低到每分钟0.072美元。企业用户还可以享受批量折扣。

不过,根据VentureBeat的计算,OpenAI目前提供的文本转语音服务(非新推出的ChatGPT高级语音模式)要比Hume AI的EVI 2便宜很多。OpenAI的文本转语音服务每1000字符收费0.015美元(大约每分钟语音0.015美元),而Hume AI的EVI 2为每分钟0.072美元。

EVI 2目前仅支持英语,Hume AI计划在2024年底之前推出对西班牙语、法语和德语等多种语言的支持。

Cowen向VentureBeat透露道,得益于他们的训练过程,EVI 2实际上自主学习了多种语言,不需要由工程师进行人为的训练。

“我们没有专门训练模型输出某些特定的语言,但它从训练数据中学会了说法语、西班牙语、德语、波兰语等多种语言。”Cowen解释道。

结语:先于竞争对手公开发布,有望抢占市场

据传,Hume AI潜在的竞争对手Anthropic正在重新打造其投资方亚马逊的Alexa语音助手并准备推出。

另一方面,OpenAI在今年5月展示的由GPT-4o模型支持的ChatGPT高级语音模式,目前只对少数用户开放,在候补名单中的用户仍需等待。

尽管Hume AI并没有像OpenAI或Anthropic那样广为人知,但Hume AI已经抢先于它们公开推出了一个人性化语音助手,并且客户现在就可以立即将其投入使用。这可能为Hume AI在竞争激烈的市场中抢占一席之地。

来源:VentureBeat

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-21 11:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

行业首个!吉利智能汽车全域AI技术 可支持500万在线车辆需求
...其星睿AI大模型,于2024年率先推出了基于离散token的情感语音合成大模型。该模型能实现零样本学习、文字到语音的转换以及分层声学建模,在发音准确度、自然度、说话人相似度以
2025-01-14 11:23:00
现金直降至高18000元 第二代长安X5PLUS 7.39万元起“鲸”喜来袭
华龙网讯(齐澈)作为新一代运动智趣SUV,第二代长安X5PLUS充分为年轻用户着想,推出一系列购车福利助力返乡启程。包括限时现金直降至高18000元,龙年开新一口价7.39万元起
2024-02-04 21:31:00
后驱零百4.9秒、续航710km,昊铂GT真的很nice
...牌车型——昊铂GT迎来了正式上市,新车全系均配备了第二代弹匣电池系统安全技术,共推出5款车型,售价21.99万元-33
2023-07-03 23:05:00
小度智能屏x10第二代来了!
重新定义居家智能生活美学,小度智能屏X10第二代重磅亮相!12月28日,国民智能科技品牌小度正式迎来智能屏家族新成员——10.1英寸的小度智能屏X10第二代。小度希望小度智能屏X
2022-12-28 21:53:00
36氪研究院|2023年中国在线音频行业洞察报告
...音频实现全场景覆盖提供了“万物互联”的网络支持和“语音交互”的技术支持。(1)在音频创作上,在线音频行业应用ASR语音识别技术与TTS语音合成技术产出高质量仿真语音,快速完成
2023-06-01 07:53:00
三星第二代The Freestyle微型智能投影上市
三星电子宣布第二代 TheFreestyle微型智能投影机正式上市,延续前一代小巧机身、广域投影及360度立体音场,第二代TheFreestyle微型智能投影机新增中文语音操作
2023-09-04 11:49:00
发牌4年 5G驶入双车道时代:骁龙双卡双通释放满血性能
...,不会再导致接电话就断网的情况。今年3月份发布的第二代骁龙7+平台上也首次支持了这一功能,实现了5G+5G、5G+4G双卡双通
2023-06-07 21:02:00
上市丨龙年福利第一弹 第二代长安X5PLUS、第二代长安X7PLUS抄底价7.39万起
...直播提前闹元宵,正式上市“新一代运动智趣SUV”——第二代长安X5PLUS,以及“10万级家享真7座SUV”——第二代长安X7PLUS
2024-02-20 22:14:00
长安汽车春季焕新发布会,三大经典爆款焕新上市!
...盛大召开。发布会上,长安汽车第三代CS75PLUS冠军版、第二代UNI-V、第三代逸动三款新车正式上市。其中第三代CS75PLUS冠军版发布3款车型
2024-03-21 09:45:00
更多关于科技的资讯: