• 我的订阅
  • 科技

谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕

类别:科技 发布时间:2024-08-10 09:44:00 来源:智东西

谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕

智东西8月9日消息,谷歌于8月6日宣布,将推出基于Gemini AI的Google Home功能。随着Google Home获得强大的AI支持,Nest智能音箱和显示器上的Google Assistant将于2024年晚些时候进行重大升级Nest摄像头也将在不久后具备识别和显示功能。

尽管聊天机器人往往更能引起关注,但生成式AI的确有潜力使智能家居变得更加直观和用户友好。亚马逊今年六月已公布了增强版Alexa的计划,而谷歌也在加紧步伐,承诺推出更智能、更强大的Google Assistant。

一、 Google Home引入Gemini,智能摄像头等新功能即将上线

在下周(8月13日)秋季硬件产品发布会之前,谷歌宣布了三项新的Gemini智能体验,这些功能将于今年晚些时候登陆Google Home平台。其中包括:

一项新的摄像头智能功能,它可以为Nest摄像头的视频片段自动生成描述性字幕;

一项自然语言输入功能,用于在Google Home里创建程序;

一个更智能的Google Assistant,它将适用于Nest智能音箱和显示器,并且配备新的语音选项。

除了新语音选项之外,大多数这些功能都将通过Google的Nest Aware订阅付费提供——Nest摄像头的视频录制订阅起价为每月8美元(每年80美元)。这些功能将首先在Google的公共预览测试版计划中限量向Nest Aware订阅者推出,并将于明年扩展至更多用户。

在发布会前,Google Home产品负责人Anish Kattukaran接受The Verge采访时提到,这只是谷歌智能家居平台迈向智能化新时代的开始,“这为Google Home的下一个时代铺平了道路”。

二、Gemin提升用户体验,但不取代Google Assistant

这一更新对于长期受挫的Google Home用户来说是个好消息,许多用户已经厌倦了性能不足、设备老化的智能显示器,以及常用的功能被取消的困扰。此外,他们还经历了从Nest应用到Google Home应用的艰难过渡。本周推出的Google TV Streamer 4K(Google Home中心)和新的Nest Learning Thermostat,加上更智能的Google Assistant,预示着Google的智能家居生态系统正在改善。

Google Assistant显然将继续存在。Google并未将Gemini直接移植到Nest智能音箱和显示器上来控制智能家居,而是在幕后部署了Gemini智能。Kattukaran解释道:“Gemini是一个模型系列,我们正在针对Google Home的各项功能对其进行优化”。

三、三大新功能实操展示,智能家居多方面发展

智能家居的发展不仅仅是技术功能的提升,同时也要注重在增强功能的同时保护用户的隐私和安全。下文将展示智能摄像头的新功能、家庭自动化的简化操作以及Google Assistant的升级和新声音技术。

1、自动生成字幕的摄像头安全警报Google正在为Nest摄像头引入Gemini智能,使其能够理解摄像头捕捉到的画面和声音,并向用户传递关键信息。这意味着,Google Home之后将不仅仅发送有关某个人或包裹的警报,用户必须观看视频才能了解发生了什么,而直接添加摄像头所见内容的详细描述。这些模型将在云端专为用户的家庭数据进行学习和训练,随着时间推移,它们将变得越来越智能,更准确地了解用户家庭周围的动态。

Kattukaran分享的一个例子是一段人从车上卸下杂货的视频,标题为:

停放在车库里的一辆黑色SUV旁边站着一个穿着休闲服装的年轻人,他提着购物袋,周围环境显得十分平静。

除了提供解释性细节外,视频标题还包含丰富的背景信息。这样不仅有助于用户查找录像,还可以帮助系统链接到其他自动化功能。例如,如果摄像头识别到动物并判断是“狗在花园里挖洞”,系统可能会自动执行“打开洒水器”的操作。

Google Home的活动标签中将新增文本搜索视频的功能。例如,当用户的猫在天黑后偷偷溜出家时,这一功能将非常方便。用户可以直接搜索上次发现猫的时间,而无需逐个浏览所有标有动物的视频来寻找。

2、可解析自然语言的自动化程序

Google Home应用程序新增的“帮我创建”功能允许用户描述希望发生的事情,例如“睡觉时锁门并关灯”,系统会自动创建一个对应的执行程序。

用户需要通过手机上的Home应用程序进行文本或语音输入(目前此功能尚不支持通过Nest智能音箱操作),但Kattukaran指出,它将具备Google Home应用程序的所有现有功能。这包括所有当前的启动器、条件和操作,以及对连接到Google Home的所有设备的访问,包括支持Matter标准的设备。尽管这项功能不像谷歌的脚本编辑器那样精密,但它足够简单,能够让任何用户轻松创建自动化功能。

3、新增声线及自然交互的Google Assistant

Google正在为其Google Assistant推出新的声音选项。除了摄像头智能和更简便的自然语言输入之外,谷歌还提到将改进其Google Assistant的“核心体验”——例如在所有当前的Nest智能音箱和显示器上播放音乐和设置计时器。

此外,Google Assistant将新增不同风格、语调和口音的声音选项。该公司发布了首个新声音选项的演示视频,这其中保留了女性的语调,但听起来更轻盈、更自然。

Google Assistant不仅听起来更自然,也能进行更自然的互动。Kattukaran说,它不需要特定的命令模式即可完成用户的需求,也能够处理停顿、“嗯”和“啊”,并回答后续问题。这与去年秋季亚马逊宣布的Alexa功能(尚未推出)类似。

Kattukaran提到,新的Google Assistant将能够保留用户的对话背景,并逐渐学习和了解用户的家庭情况。他透露,由Gemini驱动的功能将依据谷歌的隐私原则,在云端为用户的家庭提供服务。

“这个功能是根据用户家庭和数据模型量身定制的。我们在家用领域特意放慢了节奏,因为智能家居领域的容错率非常小,我们不希望出差池。”他提到。而Google Assistant的目标是逐步了解用户的家庭情况,比如用户拥有的房间和设备,并在此基础上变得更加智能化。

Gemini助力Google Home升级,谷歌看好智能助手未来

这些变化旨在推动数字语音助手更接近谷歌及其竞争对手多年来一直努力实现的愿景:一个真正有用的数字助手。

“当我们开始推出第一代助手时,我们承诺它会是像《杰森一家》里那样的家具智能助手,我们的愿景是打造一个超级有用的助手,可以主动帮助你解决问题,” Kattukaran说,“我们取得了很多进展,但之后就停滞不前了——不仅是我们,所有‘助手’都如此。我们遇到了技术瓶颈,不过随着大型语言模型和多模态语言模型的出现,这一瓶颈已经得到解决。”

正如Kattukaran指出的那样:“家庭是一个庞然大物”,它复杂而混乱,有多个角色和场景。对于人类来说,管理它已经不易,对计算机而言更是巨大的挑战。但亚马逊、谷歌和苹果似乎都在竞相打造一个未来,让我们的家庭拥有一个智能的、可感知情感的助手,从而回应我们的需求。

未来的进展如何,值得期待。

来源:The Verge

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-10 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软邀请 Microsoft 365 商业用户
...助你创作内容的智能工具”在此附上官方介绍亮点如下:自动生成字幕自动生成140种语言的高度准确的字幕。我们的语音转文本技术可准确转录视频的音频,只需几分钟即可将其转换为可读字幕
2023-08-01 18:53:00
Switch2支持文本转语音 还能识别对话内容实时转字幕
...Pro手柄均可用于语音输入,视频通话则兼容所有USB-C接口摄像头。玩家通过按Joy-Con 2右侧\"C键\"或Pro手柄中键即可唤醒功能界面
2025-05-19 13:49:00
oppowatch4pro荣获2023年度产品创新奖
...—小湃智慧屏摄像机X5。其最大亮点是其将炫彩智慧屏与摄像头进行了创新性的结合,真正实现双向可视通话;2T澎湃算力,让其AI能力得到了跨越式提升。这款年度旗舰新品外观极具未来感
2024-01-04 14:47:00
苹果的“桌面机器人”,不过是智能音箱的AI套壳版?
...们前段时间报道过的AirPods,苹果希望给这款TWS耳机加上摄像头,增强空间音频方面的表现, 并为未来的AI视觉辅助方案做前期测试
2024-07-10 15:15:00
三星发布2025款电视:全面集成AI 再不怕看不懂国外直播了
...备上的AI图像和声音技术:动态调整以优化观看体验。5、摄像头功能:允许用户利用电视的摄像头和扬声器来检测跌倒或闯入等异常行为,并通过屏幕接收实时更新和记录的事件。此外,还可以
2025-01-07 07:47:00
谷歌不服输:大模型PaLM2剑指GPT-4,Bard会写20种代码,推出办公助手“Duet AI”
...出不同的撰写方案。 AI在Slides中的应用示例:根据要求自动生成插图。AI在Sheet中的应用示例:自动生成遛狗分工表
2023-05-11 07:12:00
魅族21PRO开放式AI终端正式发布,售价4999元起
...。AI 辅助输入可自主理解对话场景中的上下文,帮助用户自动生成精准回复。在生成文本时,AI 辅助输入不仅提供单一选择,更能一次性展示多个备选建议,以满足用户的不同需求。 除
2024-02-29 22:32:00
Snap发布新一代 AR眼镜:搭载 4个空间摄像头,续航最长45分钟
...生成AR特效(图源:TechCrunch)一、不到半斤重,4个空间摄像头,续航最长45分钟Snap研发AR眼镜已有10年之久
2024-09-19 11:59:00
数字科技,把亲情攥在手心里
...能还能时光缩影,可以智能识别指定的人脸、人形,每日自动生成2分钟以内的视频集锦,记录父母一天的日常时光,了解他们的点点滴滴。
2024-01-22 13:55:00
更多关于科技的资讯:
拒绝闲置,学而思携手华为打造“亲子共享”学习机
12月25日,学而思与华为深度合作,联合推出基于华为擎云 C5e定制的学而思学习机。这款新品定位为入门款学习机,不仅整合了学而思深耕20余年的优质教育资源与前沿AI技术
2025-12-26 08:49:00
北京远行摘得“金厦奖”,与城市共繁荣
聚焦行业前沿,赋能城市生长。2025年12月23日,第22届中国写字楼产业园发展论坛于北京启幕。这场商业地产领域的权威盛会
2025-12-26 09:20:00
福建首个AI+教育大模型发布它的“大脑”装了6T教育专项数据,既“懂产业”,还“懂学生”“懂教学”东南网12月26日讯 (海峡导报记者 梁静 通讯员 曾妙龄 何贻婷 ) 昨日
2025-12-26 09:35:00
12月12日,由中国通信标准化协会主办、中国信息通信研究院承办的“2025 AI云产业发展大会”在北京成功召开。会上公布了2025年“软件工程智能化领航者”创新应用实践评选结果
2025-12-26 10:49:00
王涵Labubu爆红无疑是2025年最热门的经济现象之一。从外国粉丝排队数小时“抢娃”,到二手市场上部分Labubu溢价超30倍
2025-12-26 10:50:00
天柱山据《中国青年报》报道,清晨六点,北京的胡同里,宠物托管师刘硕已开始一天的忙碌。她轻手轻脚地给客户家的猫咪添粮换水
2025-12-26 10:50:00
破解家政撮合难题,58同城“AI直聘”入选“人工智能+”创新应用
“我想找一位会做饭、做家务的不住家阿姨,最好会做面食和煲汤,可以下午13:00到17:00上户。”在58同城“AI直聘”上
2025-12-26 10:50:00
变频空调哪个牌子技术最强?深度解析空调行业技术标准
变频空调哪个牌子技术最强?这个问题若仅停留在纸面参数的比较,无异于隔靴搔痒。真正的技术巅峰,在于品牌能否将顶尖的实验室数据
2025-12-26 10:54:00
欧姆龙发布《2025统合报告》:以可持续战略驱动未来增长
近日,欧姆龙集团(以下简称"欧姆龙")正式发布了《2025统合报告》,呈现了在"Shaping the Future 2030(以下简称"SF2030")"长期战略指引下
2025-12-26 13:51:00
推开邮储银行唐山玉田县支行的玻璃门,浓郁咖啡香与温暖灯光扑面而来。理财经理正为咨询客户手冲咖啡,这并非咖啡馆日常,而是该支行周三下午的寻常场景
2025-12-26 10:54:00
中新经纬12月26日电 据韩联社25日消息,韩国电商巨头酷澎25日发布新闻资料称,公司凭借通过数字鉴定获取的证据锁定泄露用户信息的前员工
2025-12-26 11:03:00
厦门网讯(厦门日报佘峥)福建省首个AI+教育大模型——“文夔”昨天正式发布,它不仅能帮助教师批改作业、试卷,还能从招聘信息中做出分析
2025-12-26 07:59:00
上传一张聊天截图,便能智能分析用户画像;孕期有疑问,即可一键对话获取专业信息……人工智能高速发展的时代,垂直母婴领域也迎来新的应用落地
2025-12-26 06:39:00
惠及11个停车场 可免费领取 元旦来武林商圈停车有福利
元旦武林商圈有多热闹?购物、打卡、看表演、逛面包节……活动多到停不下来!但你是不是也在担心:车往哪儿停?停车费是不是很贵
2025-12-26 06:39:00
最近,杭州市市场监督管理局出台《网络直播知识产权协同保护风控法务指引(试行)》。《指引》既是落实国家知识产权保护示范区建设的要求
2025-12-26 06:39:00