• 我的订阅
  • 科技

谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕

类别:科技 发布时间:2024-08-10 09:44:00 来源:智东西

谷歌将Gemini引入Google Home!智能音箱“换脑”,摄像头自动生成字幕

智东西8月9日消息,谷歌于8月6日宣布,将推出基于Gemini AI的Google Home功能。随着Google Home获得强大的AI支持,Nest智能音箱和显示器上的Google Assistant将于2024年晚些时候进行重大升级Nest摄像头也将在不久后具备识别和显示功能。

尽管聊天机器人往往更能引起关注,但生成式AI的确有潜力使智能家居变得更加直观和用户友好。亚马逊今年六月已公布了增强版Alexa的计划,而谷歌也在加紧步伐,承诺推出更智能、更强大的Google Assistant。

一、 Google Home引入Gemini,智能摄像头等新功能即将上线

在下周(8月13日)秋季硬件产品发布会之前,谷歌宣布了三项新的Gemini智能体验,这些功能将于今年晚些时候登陆Google Home平台。其中包括:

一项新的摄像头智能功能,它可以为Nest摄像头的视频片段自动生成描述性字幕;

一项自然语言输入功能,用于在Google Home里创建程序;

一个更智能的Google Assistant,它将适用于Nest智能音箱和显示器,并且配备新的语音选项。

除了新语音选项之外,大多数这些功能都将通过Google的Nest Aware订阅付费提供——Nest摄像头的视频录制订阅起价为每月8美元(每年80美元)。这些功能将首先在Google的公共预览测试版计划中限量向Nest Aware订阅者推出,并将于明年扩展至更多用户。

在发布会前,Google Home产品负责人Anish Kattukaran接受The Verge采访时提到,这只是谷歌智能家居平台迈向智能化新时代的开始,“这为Google Home的下一个时代铺平了道路”。

二、Gemin提升用户体验,但不取代Google Assistant

这一更新对于长期受挫的Google Home用户来说是个好消息,许多用户已经厌倦了性能不足、设备老化的智能显示器,以及常用的功能被取消的困扰。此外,他们还经历了从Nest应用到Google Home应用的艰难过渡。本周推出的Google TV Streamer 4K(Google Home中心)和新的Nest Learning Thermostat,加上更智能的Google Assistant,预示着Google的智能家居生态系统正在改善。

Google Assistant显然将继续存在。Google并未将Gemini直接移植到Nest智能音箱和显示器上来控制智能家居,而是在幕后部署了Gemini智能。Kattukaran解释道:“Gemini是一个模型系列,我们正在针对Google Home的各项功能对其进行优化”。

三、三大新功能实操展示,智能家居多方面发展

智能家居的发展不仅仅是技术功能的提升,同时也要注重在增强功能的同时保护用户的隐私和安全。下文将展示智能摄像头的新功能、家庭自动化的简化操作以及Google Assistant的升级和新声音技术。

1、自动生成字幕的摄像头安全警报Google正在为Nest摄像头引入Gemini智能,使其能够理解摄像头捕捉到的画面和声音,并向用户传递关键信息。这意味着,Google Home之后将不仅仅发送有关某个人或包裹的警报,用户必须观看视频才能了解发生了什么,而直接添加摄像头所见内容的详细描述。这些模型将在云端专为用户的家庭数据进行学习和训练,随着时间推移,它们将变得越来越智能,更准确地了解用户家庭周围的动态。

Kattukaran分享的一个例子是一段人从车上卸下杂货的视频,标题为:

停放在车库里的一辆黑色SUV旁边站着一个穿着休闲服装的年轻人,他提着购物袋,周围环境显得十分平静。

除了提供解释性细节外,视频标题还包含丰富的背景信息。这样不仅有助于用户查找录像,还可以帮助系统链接到其他自动化功能。例如,如果摄像头识别到动物并判断是“狗在花园里挖洞”,系统可能会自动执行“打开洒水器”的操作。

Google Home的活动标签中将新增文本搜索视频的功能。例如,当用户的猫在天黑后偷偷溜出家时,这一功能将非常方便。用户可以直接搜索上次发现猫的时间,而无需逐个浏览所有标有动物的视频来寻找。

2、可解析自然语言的自动化程序

Google Home应用程序新增的“帮我创建”功能允许用户描述希望发生的事情,例如“睡觉时锁门并关灯”,系统会自动创建一个对应的执行程序。

用户需要通过手机上的Home应用程序进行文本或语音输入(目前此功能尚不支持通过Nest智能音箱操作),但Kattukaran指出,它将具备Google Home应用程序的所有现有功能。这包括所有当前的启动器、条件和操作,以及对连接到Google Home的所有设备的访问,包括支持Matter标准的设备。尽管这项功能不像谷歌的脚本编辑器那样精密,但它足够简单,能够让任何用户轻松创建自动化功能。

3、新增声线及自然交互的Google Assistant

Google正在为其Google Assistant推出新的声音选项。除了摄像头智能和更简便的自然语言输入之外,谷歌还提到将改进其Google Assistant的“核心体验”——例如在所有当前的Nest智能音箱和显示器上播放音乐和设置计时器。

此外,Google Assistant将新增不同风格、语调和口音的声音选项。该公司发布了首个新声音选项的演示视频,这其中保留了女性的语调,但听起来更轻盈、更自然。

Google Assistant不仅听起来更自然,也能进行更自然的互动。Kattukaran说,它不需要特定的命令模式即可完成用户的需求,也能够处理停顿、“嗯”和“啊”,并回答后续问题。这与去年秋季亚马逊宣布的Alexa功能(尚未推出)类似。

Kattukaran提到,新的Google Assistant将能够保留用户的对话背景,并逐渐学习和了解用户的家庭情况。他透露,由Gemini驱动的功能将依据谷歌的隐私原则,在云端为用户的家庭提供服务。

“这个功能是根据用户家庭和数据模型量身定制的。我们在家用领域特意放慢了节奏,因为智能家居领域的容错率非常小,我们不希望出差池。”他提到。而Google Assistant的目标是逐步了解用户的家庭情况,比如用户拥有的房间和设备,并在此基础上变得更加智能化。

Gemini助力Google Home升级,谷歌看好智能助手未来

这些变化旨在推动数字语音助手更接近谷歌及其竞争对手多年来一直努力实现的愿景:一个真正有用的数字助手。

“当我们开始推出第一代助手时,我们承诺它会是像《杰森一家》里那样的家具智能助手,我们的愿景是打造一个超级有用的助手,可以主动帮助你解决问题,” Kattukaran说,“我们取得了很多进展,但之后就停滞不前了——不仅是我们,所有‘助手’都如此。我们遇到了技术瓶颈,不过随着大型语言模型和多模态语言模型的出现,这一瓶颈已经得到解决。”

正如Kattukaran指出的那样:“家庭是一个庞然大物”,它复杂而混乱,有多个角色和场景。对于人类来说,管理它已经不易,对计算机而言更是巨大的挑战。但亚马逊、谷歌和苹果似乎都在竞相打造一个未来,让我们的家庭拥有一个智能的、可感知情感的助手,从而回应我们的需求。

未来的进展如何,值得期待。

来源:The Verge

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-10 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

微软邀请 Microsoft 365 商业用户
...助你创作内容的智能工具”在此附上官方介绍亮点如下:自动生成字幕自动生成140种语言的高度准确的字幕。我们的语音转文本技术可准确转录视频的音频,只需几分钟即可将其转换为可读字幕
2023-08-01 18:53:00
Switch2支持文本转语音 还能识别对话内容实时转字幕
...Pro手柄均可用于语音输入,视频通话则兼容所有USB-C接口摄像头。玩家通过按Joy-Con 2右侧\"C键\"或Pro手柄中键即可唤醒功能界面
2025-05-19 13:49:00
oppowatch4pro荣获2023年度产品创新奖
...—小湃智慧屏摄像机X5。其最大亮点是其将炫彩智慧屏与摄像头进行了创新性的结合,真正实现双向可视通话;2T澎湃算力,让其AI能力得到了跨越式提升。这款年度旗舰新品外观极具未来感
2024-01-04 14:47:00
苹果的“桌面机器人”,不过是智能音箱的AI套壳版?
...们前段时间报道过的AirPods,苹果希望给这款TWS耳机加上摄像头,增强空间音频方面的表现, 并为未来的AI视觉辅助方案做前期测试
2024-07-10 15:15:00
三星发布2025款电视:全面集成AI 再不怕看不懂国外直播了
...备上的AI图像和声音技术:动态调整以优化观看体验。5、摄像头功能:允许用户利用电视的摄像头和扬声器来检测跌倒或闯入等异常行为,并通过屏幕接收实时更新和记录的事件。此外,还可以
2025-01-07 07:47:00
谷歌不服输:大模型PaLM2剑指GPT-4,Bard会写20种代码,推出办公助手“Duet AI”
...出不同的撰写方案。 AI在Slides中的应用示例:根据要求自动生成插图。AI在Sheet中的应用示例:自动生成遛狗分工表
2023-05-11 07:12:00
魅族21PRO开放式AI终端正式发布,售价4999元起
...。AI 辅助输入可自主理解对话场景中的上下文,帮助用户自动生成精准回复。在生成文本时,AI 辅助输入不仅提供单一选择,更能一次性展示多个备选建议,以满足用户的不同需求。 除
2024-02-29 22:32:00
Snap发布新一代 AR眼镜:搭载 4个空间摄像头,续航最长45分钟
...生成AR特效(图源:TechCrunch)一、不到半斤重,4个空间摄像头,续航最长45分钟Snap研发AR眼镜已有10年之久
2024-09-19 11:59:00
数字科技,把亲情攥在手心里
...能还能时光缩影,可以智能识别指定的人脸、人形,每日自动生成2分钟以内的视频集锦,记录父母一天的日常时光,了解他们的点点滴滴。
2024-01-22 13:55:00
更多关于科技的资讯:
最近在微信、抖音等各种网络媒体特别热门的软件OpenClaw,因其官方Logo是一只龙虾而被大家戏称为“龙虾”。不少朋友在手机上刷到相关分享
2026-03-25 08:05:00
从“展厅花瓶”到“可触摸的历史”杭州日报讯 近日,位于西湖区留下老街的林徽因展览馆靠着一块裸眼3D屏在杭城年轻人群体中“出圈”了
2026-03-25 07:58:00
杭州日报讯 3月的绍兴融杭数贸港(以下简称“数贸港”),春潮涌动,“出海”热潮持续升温。近日,两场面向外贸企业的专项活动接连在此举行——一场聚焦跨境电商业绩冲刺中期复盘
2026-03-25 06:57:00
王一凡 河南工业大学一、引言在数字经济快速发展的当下,金融服务正加速向数字化、网络化转型,农村金融生态也随之发生深刻变化
2026-03-25 07:11:00
国家数据局局长刘烈宏3月24日在国新办举行的新闻发布会上表示,到今年3月,我国日均词元(Token)调用量已超过140万亿
2026-03-25 07:30:00
能源结构的清洁低碳转型,让光伏产业成为推动绿色发展的重要力量,随着光伏电站装机规模的持续扩大,电站运维的重要性日益凸显
2026-03-25 07:42:00
近日,由湖南省动漫游戏协会、芒果TV主办的第二届“马栏山杯”小游戏创新创业大赛正式启动,作为本次大赛独家战略合作伙伴,世纪华通旗下盛趣游戏将深度参与赛事全流程
2026-03-25 07:49:00
杭州日报讯 近日,浙江海港物流集团下属浙江海港(中东)供应链管理有限公司(以下简称“海港中东”)首笔仓储业务顺利落地,正式投入运营
2026-03-25 06:57:00
AI+3D打印,洛阳这家企业让\
大河网讯 输入指令、生成模型、远程传送打印......不一会儿,一头小象就这样从想法变成了掌心的萌物。3月24日,“开局之年看中国·原来你是这样的河南”网络主题宣传活动采风团走进洛阳点维电子科技有限公司(以下简称“洛阳点维”)
2026-03-24 23:56:00
游戏+非遗如何破圈?《超自然行动组》探索传统文化年轻化路径
在数字内容产业加速迈向精品化的当下,游戏正日益成为中华传统文化创新传播的重要载体。近日,爆款游戏《超自然行动组》接连公布两项与国家非物质文化遗产的联动
2026-03-24 20:09:00
3月23日上午,位于启东经济开发区的托伦斯精密零部件制造及研发基地项目四期工程开工。项目总投资约9.56亿元,总占地面积78
2026-03-24 21:15:00
金湖农商银行成功落地首笔意外险团单业务
江南时报讯 近日,金湖农商银行在走访周边企业的时候得知一企业重视员工权益保障,希望为员工配置完善的意外伤害保障,该行迅速响应客户需求
2026-03-24 22:27:00
福州新闻网3月24日讯(记者 颜澜萍)3月24日,国务院新闻办公室举行新闻发布会,介绍了第九届数字中国建设峰会相关情况
2026-03-24 17:11:00
鲁网3月24日讯近日,农业银行泰安分行成功为山东海天智能科技有限公司发放知识产权质押贷款500万元,助力企业将“知产”变“资产”
2026-03-24 17:28:00
解码“新汤沟”现象:一场关于“热爱”的酒业变革正在发生
3月23日,成都,一场名为“汤沟瑰野露酒·中国新酒饮高峰论坛”的行业盛事,将全行业的视线聚焦于一个正在发生的深刻变革。当中国酒业步入深度调整期
2026-03-24 18:23:00