• 我的订阅
  • 科技

谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕

类别:科技 发布时间:2024-08-10 09:44:00 来源:智东西

谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕

智东西8月9日消息,谷歌于8月6日宣布,将推出基于Gemini AI的Google Home功能。随着Google Home获得强大的AI支持,Nest智能音箱和显示器上的Google Assistant将于2024年晚些时候进行重大升级Nest摄像头也将在不久后具备识别和显示功能。

尽管聊天机器人往往更能引起关注,但生成式AI的确有潜力使智能家居变得更加直观和用户友好。亚马逊今年六月已公布了增强版Alexa的计划,而谷歌也在加紧步伐,承诺推出更智能、更强大的Google Assistant。

一、 Google Home引入Gemini,智能摄像头等新功能即将上线

在下周(8月13日)秋季硬件产品发布会之前,谷歌宣布了三项新的Gemini智能体验,这些功能将于今年晚些时候登陆Google Home平台。其中包括:

一项新的摄像头智能功能,它可以为Nest摄像头的视频片段自动生成描述性字幕;

一项自然语言输入功能,用于在Google Home里创建程序;

一个更智能的Google Assistant,它将适用于Nest智能音箱和显示器,并且配备新的语音选项。

除了新语音选项之外,大多数这些功能都将通过Google的Nest Aware订阅付费提供——Nest摄像头的视频录制订阅起价为每月8美元(每年80美元)。这些功能将首先在Google的公共预览测试版计划中限量向Nest Aware订阅者推出,并将于明年扩展至更多用户。

在发布会前,Google Home产品负责人Anish Kattukaran接受The Verge采访时提到,这只是谷歌智能家居平台迈向智能化新时代的开始,“这为Google Home的下一个时代铺平了道路”。

二、Gemin提升用户体验,但不取代Google Assistant

这一更新对于长期受挫的Google Home用户来说是个好消息,许多用户已经厌倦了性能不足、设备老化的智能显示器,以及常用的功能被取消的困扰。此外,他们还经历了从Nest应用到Google Home应用的艰难过渡。本周推出的Google TV Streamer 4K(Google Home中心)和新的Nest Learning Thermostat,加上更智能的Google Assistant,预示着Google的智能家居生态系统正在改善。

Google Assistant显然将继续存在。Google并未将Gemini直接移植到Nest智能音箱和显示器上来控制智能家居,而是在幕后部署了Gemini智能。Kattukaran解释道:“Gemini是一个模型系列,我们正在针对Google Home的各项功能对其进行优化”。

三、三大新功能实操展示,智能家居多方面发展

智能家居的发展不仅仅是技术功能的提升,同时也要注重在增强功能的同时保护用户的隐私和安全。下文将展示智能摄像头的新功能、家庭自动化的简化操作以及Google Assistant的升级和新声音技术。

1、自动生成字幕的摄像头安全警报Google正在为Nest摄像头引入Gemini智能,使其能够理解摄像头捕捉到的画面和声音,并向用户传递关键信息。这意味着,Google Home之后将不仅仅发送有关某个人或包裹的警报,用户必须观看视频才能了解发生了什么,而直接添加摄像头所见内容的详细描述。这些模型将在云端专为用户的家庭数据进行学习和训练,随着时间推移,它们将变得越来越智能,更准确地了解用户家庭周围的动态。

Kattukaran分享的一个例子是一段人从车上卸下杂货的视频,标题为:

停放在车库里的一辆黑色SUV旁边站着一个穿着休闲服装的年轻人,他提着购物袋,周围环境显得十分平静。

除了提供解释性细节外,视频标题还包含丰富的背景信息。这样不仅有助于用户查找录像,还可以帮助系统链接到其他自动化功能。例如,如果摄像头识别到动物并判断是“狗在花园里挖洞”,系统可能会自动执行“打开洒水器”的操作。

Google Home的活动标签中将新增文本搜索视频的功能。例如,当用户的猫在天黑后偷偷溜出家时,这一功能将非常方便。用户可以直接搜索上次发现猫的时间,而无需逐个浏览所有标有动物的视频来寻找。

2、可解析自然语言的自动化程序

Google Home应用程序新增的“帮我创建”功能允许用户描述希望发生的事情,例如“睡觉时锁门并关灯”,系统会自动创建一个对应的执行程序。

用户需要通过手机上的Home应用程序进行文本或语音输入(目前此功能尚不支持通过Nest智能音箱操作),但Kattukaran指出,它将具备Google Home应用程序的所有现有功能。这包括所有当前的启动器、条件和操作,以及对连接到Google Home的所有设备的访问,包括支持Matter标准的设备。尽管这项功能不像谷歌的脚本编辑器那样精密,但它足够简单,能够让任何用户轻松创建自动化功能。

3、新增声线及自然交互的Google Assistant

Google正在为其Google Assistant推出新的声音选项。除了摄像头智能和更简便的自然语言输入之外,谷歌还提到将改进其Google Assistant的“核心体验”——例如在所有当前的Nest智能音箱和显示器上播放音乐和设置计时器。

此外,Google Assistant将新增不同风格、语调和口音的声音选项。该公司发布了首个新声音选项的演示视频,这其中保留了女性的语调,但听起来更轻盈、更自然。

Google Assistant不仅听起来更自然,也能进行更自然的互动。Kattukaran说,它不需要特定的命令模式即可完成用户的需求,也能够处理停顿、“嗯”和“啊”,并回答后续问题。这与去年秋季亚马逊宣布的Alexa功能(尚未推出)类似。

Kattukaran提到,新的Google Assistant将能够保留用户的对话背景,并逐渐学习和了解用户的家庭情况。他透露,由Gemini驱动的功能将依据谷歌的隐私原则,在云端为用户的家庭提供服务。

“这个功能是根据用户家庭和数据模型量身定制的。我们在家用领域特意放慢了节奏,因为智能家居领域的容错率非常小,我们不希望出差池。”他提到。而Google Assistant的目标是逐步了解用户的家庭情况,比如用户拥有的房间和设备,并在此基础上变得更加智能化。

Gemini助力Google Home升级,谷歌看好智能助手未来

这些变化旨在推动数字语音助手更接近谷歌及其竞争对手多年来一直努力实现的愿景:一个真正有用的数字助手。

“当我们开始推出第一代助手时,我们承诺它会是像《杰森一家》里那样的家具智能助手,我们的愿景是打造一个超级有用的助手,可以主动帮助你解决问题,” Kattukaran说,“我们取得了很多进展,但之后就停滞不前了——不仅是我们,所有‘助手’都如此。我们遇到了技术瓶颈,不过随着大型语言模型和多模态语言模型的出现,这一瓶颈已经得到解决。”

正如Kattukaran指出的那样:“家庭是一个庞然大物”,它复杂而混乱,有多个角色和场景。对于人类来说,管理它已经不易,对计算机而言更是巨大的挑战。但亚马逊、谷歌和苹果似乎都在竞相打造一个未来,让我们的家庭拥有一个智能的、可感知情感的助手,从而回应我们的需求。

未来的进展如何,值得期待。

来源:The Verge

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-10 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软邀请 Microsoft 365 商业用户
...助你创作内容的智能工具”在此附上官方介绍亮点如下:自动生成字幕自动生成140种语言的高度准确的字幕。我们的语音转文本技术可准确转录视频的音频,只需几分钟即可将其转换为可读字幕
2023-08-01 18:53:00
Switch2支持文本转语音 还能识别对话内容实时转字幕
...Pro手柄均可用于语音输入,视频通话则兼容所有USB-C接口摄像头。玩家通过按Joy-Con 2右侧\"C键\"或Pro手柄中键即可唤醒功能界面
2025-05-19 13:49:00
oppowatch4pro荣获2023年度产品创新奖
...—小湃智慧屏摄像机X5。其最大亮点是其将炫彩智慧屏与摄像头进行了创新性的结合,真正实现双向可视通话;2T澎湃算力,让其AI能力得到了跨越式提升。这款年度旗舰新品外观极具未来感
2024-01-04 14:47:00
苹果的“桌面机器人”,不过是智能音箱的AI套壳版?
...们前段时间报道过的AirPods,苹果希望给这款TWS耳机加上摄像头,增强空间音频方面的表现, 并为未来的AI视觉辅助方案做前期测试
2024-07-10 15:15:00
三星发布2025款电视:全面集成AI 再不怕看不懂国外直播了
...备上的AI图像和声音技术:动态调整以优化观看体验。5、摄像头功能:允许用户利用电视的摄像头和扬声器来检测跌倒或闯入等异常行为,并通过屏幕接收实时更新和记录的事件。此外,还可以
2025-01-07 07:47:00
谷歌不服输:大模型PaLM2剑指GPT-4,Bard会写20种代码,推出办公助手“Duet AI”
...出不同的撰写方案。 AI在Slides中的应用示例:根据要求自动生成插图。AI在Sheet中的应用示例:自动生成遛狗分工表
2023-05-11 07:12:00
魅族21PRO开放式AI终端正式发布,售价4999元起
...。AI 辅助输入可自主理解对话场景中的上下文,帮助用户自动生成精准回复。在生成文本时,AI 辅助输入不仅提供单一选择,更能一次性展示多个备选建议,以满足用户的不同需求。 除
2024-02-29 22:32:00
Snap发布新一代 AR眼镜:搭载 4个空间摄像头,续航最长45分钟
...生成AR特效(图源:TechCrunch)一、不到半斤重,4个空间摄像头,续航最长45分钟Snap研发AR眼镜已有10年之久
2024-09-19 11:59:00
数字科技,把亲情攥在手心里
...能还能时光缩影,可以智能识别指定的人脸、人形,每日自动生成2分钟以内的视频集锦,记录父母一天的日常时光,了解他们的点点滴滴。
2024-01-22 13:55:00
更多关于科技的资讯:
京东物流首个海外智狼仓“圣诞季”在英国投用,Joybuy本地最快当日达
12月是“圣诞季”,节日氛围浓厚。为更好服务海外消费者,京东物流首个海外智狼仓在英国正式投用,一件件承载着圣诞祝福的特色礼品已陆续从该仓库发出
2025-12-25 15:02:00
浙江日报讯 (记者 赵静 共享联盟·温岭 梁伟伟 赵碧莹) “我们最新推出的裸足童鞋,就像是孩子脚上的‘第二层皮肤’。”日前
2025-12-25 08:41:00
浙江日报讯 (记者 拜喆喆) 日前,记者从杭州海关了解到,1至11月,浙江省跨境电商进口清单量达2.7亿单,货值达775
2025-12-25 09:12:00
浪潮计算机C86服务器登顶TPCx-IoT榜首,揭秘中国算力领先背后的创新密码
从技术追赶到能力并跑,再到关键领域的创新引领——中国算力产业正稳步实现发展阶段的新跨越。近日,浪潮计算机C86服务器在TPCx-IoT全球测评中登顶榜首
2025-12-25 10:11:00
广域铭岛五周年价值长卷|G+,为工业未来做加法
五年,是时间的刻度,更是价值的纵深。G+,是广域铭岛的符号,也是我们与产业同行的语言——为战略做加法,为技术做加法,为生态做加法
2025-12-25 10:57:00
人机连续对打羽毛球1452次杭州日报讯 “最终成绩为1452次,打破纪录,挑战成功!”12月22日下午,绍兴上虞杭州湾联合创新中心内
2025-12-25 06:39:00
邢翀 贺劭清 中国新闻社在全媒体技术深度重塑传播生态的背景下,短视频、直播等形式凭借其直观、快速、沉浸式的特性,成为体育新闻传播吸引流量的关键抓手
2025-12-25 06:44:00
数览“十四五” 解码杭州59家“新小龙”涌现的动力之源
制图 应茵每日商报讯 12月15日,由浙江省科技厅、省经信厅等部门指导的“浙江省科技新小龙探访和护航行动”正式揭晓结果
2025-12-25 07:10:00
周末日均客流三万人次,线下销量华北门店第一盒马石家庄首店何以领跑华北12月21日,石家庄勒泰中心负一层的盒马鲜生门店内
2025-12-25 07:49:00
当紧固件遇上AI,产业集群变身超级工厂——AI赋能千行百业一线故事(十八)11月19日9时许,位于邯郸市永年区的国智科技(河北)股份有限公司
2025-12-25 07:51:00
杭州日报讯 “快手一姐”蛋蛋(杨润心)在杭州注册新公司、曹颖一个月内组建团队完成首播、林依轮将团队整体南迁至杭州……这些直播电商行业的“重磅事件”
2025-12-25 07:09:00
农行固堤支行积极拥抱金融科技,全力推动网点智能化转型与服务升级。大力推广手机银行、网上银行等线上渠道,引导客户体验转账汇款
2025-12-24 08:41:00
“您站好,用手机拍正面、侧面、背面三张照片。3分钟后,您不仅能知道最适合自己的衣服尺寸,还能在电脑上实时看到自己穿上这件衣服的虚拟效果
2025-12-24 08:42:00
日前,中国进出口银行深圳分行向纵腾集团子公司香港亿格有限公司发放境外投资贷款,精准助力企业提升跨境电商海外仓运营效能,为跨境电商行业高质量发展注入金融活水
2025-12-24 08:44:00
苏州市镇江商会副会长单位【旭智文化】荣膺2025年度省级专精特新中小企业称号
近日,江苏省工业和信息化厅正式公布2025年度省级专精特新中小企业名单。苏州市镇江商会副会长单位苏州旭智新文化科技有限公司凭借在数字展馆领域的创新研发
2025-12-24 09:03:00