• 我的订阅
  • 科技

openai语音翻译又出新功能了!

类别:科技 发布时间:2023-09-26 14:59:00 来源:浅语科技

听说了吗?OpenAI又出新了!

openai语音翻译又出新功能了!

他们正在推出ChatGPT的全新语音和图像功能,提供了一种全新、更直观的交互方式,通过语音对话或以图片形式向ChatGPT展示讨论的内容。

这些新增功能让ChatGPT更加融入日常生活。在旅行中拍摄一个地标,与GPT即时讨论这座地标的特点;回家后,拍摄冰箱和食品储藏室的内容,询问今晚的晚餐菜单(还可以进一步询问食谱的每一步);通过拍照并圈选题目,帮助孩子解决作业问题,同时提供解题提示。

在接下来的两周内,团队将为Plus和Enterprise用户推出ChatGPT的语音和图像功能。语音功能即将在iOS和Android上线(在设置中选择加入),而图像功能将在所有平台上提供。

与ChatGPT进行语音交互

您现在可以用语音与助手进行双向对话。在路上与其交谈,为家人请求一个睡前故事,或解决餐桌上的争论。

openai语音翻译又出新功能了!

要启用语音功能,只需在移动应用中前往设置→新功能,选择开启语音交流,点击主屏幕右上角的耳机按钮,并从五种声音中选择喜欢的声音。

这项新的语音功能由一个新的文本到语音模型支持,能够在短时间内从纯文本生成与人类相似的音频。团队与专业配音演员合作,为每种声音创设独特的音调。同时,他们使用了自己的开源语音识别系统Whisper,将语音转化为文本。

与ChatGPT分享图片

向ChatGPT展示一个或多个图片。无论是为了解决烧烤架不启动的问题,还是为了规划一顿饭的食材,或是为工作相关数据分析一张复杂的图表,都可以轻松处理。如果需要聚焦到图片的某个具体部分,还可联动到OpenAI移动应用中的绘图工具。

开始时,点击拍照按钮来捕捉或选择一张图片。如果是iOS或Android系统,首先点击加号按钮。还可以分享多张图片或使用绘图工具来指引GPT。

openai语音翻译又出新功能了!

这项图片识别功能得益于多模态的GPT-3.5和GPT-4技术,它们的语言理解能力应用到各种图片上,如照片、屏幕截图和包含文本与图片的文件。

我们正在分步骤部署图像和语音功能

OpenAI的目标是构建既安全又有益的AGI。逐步提供这些工具对OpenAI来说无疑是良方,给开发团队充足时间加以改进,不断完善风险控制措施,同时准备更加强大的未来系统。对于涉及语音和视觉的先进模型,这种策略显得更加重要。

语音

新的语音技术可以从简短的真实语音样本中制作逼真的合成语音,为许多创意和辅助功能应用开辟了新途径。但同时,这些功能也带来了新的风险,例如有人可能会以此冒充公众人物或诈骗。

因此,开发团队仅为特定的使用场景提供这项技术支持,即语音聊天。语音聊天由团队与配音演员直接合作创建。同时,他们也与其他合作伙伴进行了类似的合作。例如,Spotify正在借此进行他们的语音翻译功能的试点,帮助播音员通过用自己的声音翻译播音内容,将他们的内容传达到其他语言的听众。

图像输入

基于视觉的模型也带来了新的挑战,这些模型可能会错误地“看到”不存在的人或物,或者在某些非常重要的领域中对图片的解释不准确。

为了确保模型在广泛使用之前是安全的,开发团队进行了大量测试。邀请专家来检测模型是否有可能被用于非法目的,比如传播极端思想或做有失偏颇的科学研究。他们还邀请了情况各异的测试者来测试这个模型。

使视觉既有用又安全

与其他ChatGPT功能一样,视觉功能旨在协助日常生活,而最佳的协助方式是能够看到人们所看到的。

这种方法直接受到OpenAI与BeMyEyes合作的启发,这是一个为盲人和视力受损的人提供的免费app。用户表示,他们发现与背景中偶尔出现的人进行关于图片的一般对话是有价值的,比如在尝试弄清楚遥控器设置时,有人出现在电视上。

而出于尊重个人隐私和ChatGPT有时不准确的特性,团队限制了ChatGPT分析和直接评论人的能力。

关于模型局限性的透明度

用户可能会依赖ChatGPT处理专业话题,例如在研究领域。针对这种情况,开发者对模型的局限性保持透明,并不鼓励在没有适当验证的情况下进行高风险的使用。此外,该模型擅长转录英文文本,但在处理其他语言,特别是使用非罗马文字的语言时,效果寥寥。因此OpenAI建议:非英语用户不要使用ChatGPT进行类似科研等专业要求较高的任务。

即将扩大使用权限

在接下来的两周内,Plus和Enterprise用户将体验到语音和图像功能。不久后这些功能将推出给其他用户群体,包括开发者。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-26 18:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

chatrtx正式上线:ai加速、语音交互、ai语音识别
...入了对智谱AI的ChatGLM3-6B这个中文LLM的支持,同时还支持语音交互和图像搜索功能。语音识别功能的加入,意味着用户可以通过语音对话的形式与ChatRTX进行交互
2024-05-15 17:03:00
三星下一代顶级旗舰曝光!最大亮点是AI大模型,谷歌表示不服
...旗舰手机系列GalaxyS24开发AI技术,并称这项技术与目前的语音交互助手Bixby没有关联。(图片来自Twitter)三星研发AI技术具体会应用到智能手机的哪个部分
2023-07-30 00:26:00
OPPO FindX7安第斯大模型上手:智能语音助手脱胎换骨
...样,基于安第斯大模型的小布也不再只是功能较为单一的语音助手,而是拥有超级问答、用机助手、生成创作等强大能力的个人专属智能助理,那现在让我们一起看看,OPPO自研的AI大模型能
2024-01-11 05:26:00
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。从入围算法的角色来看,主要分为两类:“服务提供者”和“服务技术支持者”。其中“服务提供者”主要针对C端APP
2023-06-20 17:00:00
OpenAI官方宣布ChatGPT将推出新的语音和图像功能
...型的消息出来,比如昨晚OpenAI官方宣布ChatGPT将推出新的语音和图像功能。公告称,公司正在开始推出ChatGPT的新语音和图像功能
2023-09-26 17:35:00
iOS 18 AI新功能抢先看:10大实用功能将让iPhone更智慧
...上下文情境给予适合的建议,以提升撰写邮件效率。 3. 语音备忘录自动转录与摘要iOS 18 内建备忘录将加入「语音备忘录」新功能,能够让语音转文字,当使用者按下录音后,系统
2024-05-29 15:12:00
ChatGPT迎来“炸裂”升级!能看、能听、会说,超级AI助理即将诞生?
...别物体。当地时间周一,OpenAI宣布,将在ChatGPT推出新的语音和图像功能,新功能将于未来两周内面向Plus和企业用户推出
2023-09-26 11:46:00
三星S24系列正式发布,AI功能很强?国产旗舰丝毫不惧!
...生通话应用程序内置了通话实时翻译,可以提供实时双向语音和文字翻译,而且于设备端的AI可以确保用户的对话隐私。三星键盘模块也内置了AI翻译功能,支持实时处理13种语言,能够为用
2024-01-19 11:12:00
“小手表,大智脑”——360基于智脑大模型打造“小学生的第一台AI智脑手表”
...守护需求的基础上,基于360智脑大模型的加持,增加了AI语音助手、翻译小达人、拍照学英文、AI绘画、AI卡通头像等AI功能,覆盖儿童20+生活学习场景,全方位打造了“小学生的
2024-04-30 12:00:00
更多关于科技的资讯:
南报网讯(通讯员胡晓靓记者夏思宇)走进南京绿叶制药有限公司制冷站,冷水机组、冷冻水泵、冷却水泵、冷却塔等设备稳定运转,维持药品生产GMP车间的恒温恒湿环境
2025-10-17 08:13:00
聚焦2025中国国际数字经济博览会•现场|打卡数字展馆 体验未来生活
10月16日,2025中国国际数字经济博览会展区工作人员在调试机器人。 河北日报记者 史晟全摄借助VR设备沉浸在古城往事中
2025-10-17 08:23:00
我从事科技研发工作,出生在一个三代从商的家庭。我的祖父是一名民营企业家,在枣强县这片土地上开启了玻璃钢产业创业之路;我的父亲骑着一辆摩托车闯荡天津
2025-10-17 09:11:00
博物馆“抢票”成第一关,中轴线打卡、汉服妆造让历史游玩出沉浸新花样……音乐节、演唱会与国际顶级体育赛事一票难求,“为一场演出赴一座城”成为常态
2025-10-17 09:15:00
新闻纵深·县域特色产业新力量|借力京津,机器人产业双链融合
阅读提示唐山市高新技术产业开发区在机器人新赛道上频频发力,已形成以工业机器人为引领、特种机器人为亮点、服务机器人为特色
2025-10-17 09:19:00
旭客民宿出租车广告上线,金华房东的“生意牌面”正在刷新
旭客民宿出租车广告上线,金华房东的“生意牌面”正在刷新最近在金华街头,不少人注意到一组频繁穿梭的出租车广告:“住旭客民宿
2025-10-17 09:25:00
AI EMPOWERS ALL丨神州泰岳亮相中国移动全球合作伙伴大会
碳硅共生,合创AI+时代——第13届中国移动全球合作伙伴大会于今日在广州保利世贸博览馆盛大启幕。神州泰岳作为中国移动长期重要合作伙伴
2025-10-17 09:25:00
内容觉醒·生态共创 | 2025瑞派短视频大赛职人组培训圆满落幕
金秋时节,硕果盈枝。由瑞派股份市场营销中心倾力打造的“2025年度瑞派短视频大赛职人专属赛道培训”在热烈氛围中圆满收官
2025-10-17 09:55:00
市场销售疲软,高档卷烟销售增速放缓,中低档卷烟却因消费需求旺盛出现供应紧张的问题,这是当前卷烟销售工作面临的瓶颈。受计划经济体制影响
2025-10-17 10:02:00
浪潮科技三款平台产品或升级认可
近日,山东省工业和信息化厅公布了拟入选第九批山东省首版次高端软件产品公示名单。浪潮科技研发的“焱宇行业大模型服务平台 V1
2025-10-17 10:03:00
旅服会媒体开放日:全产业链盛会引关注
16日,由中国旅行社协会、中国旅游集团主办的2025首届国际旅行服务大会暨交易展(以下简称“旅服会”)迎来媒体开放日。来自30余家主流媒体
2025-10-17 10:04:00
把听劝搬到线下!海尔智家双11邀500+达人发起智慧科技众测
今年双11,海尔智家把“听劝”从线上搬到了线下,在黄岛东方影都打造了一场规模空前的“智慧科技众测”现场,让“用户声音”与“产品研发”真正零距离对话
2025-10-17 10:07:00
微光照公信:32 名贵州师生北京研学,解码体彩阳光密码
多彩贵州网讯 10月13日,为期三天的“2025微光行动·希望工程”体彩旭日研学实践活动正式拉开帷幕。来自贵州民族大学
2025-10-17 10:15:00
“绽放杯”区域赛获佳绩,5G融合应用助力产业智变升级
10月15日,第八届“绽放杯”5G应用征集大赛山东区域赛决赛及颁奖典礼在济宁落下帷幕。本次大赛以“5G扬帆再启航,智绘齐鲁新篇章”为主题
2025-10-17 10:34:00
小米SU7事故后雷军首度发声!呼吁共同抵制网络水军、黑公关
据澎湃新闻消息,雷军在小米汽车成都事故后首次公开露面演讲。10月16日,世界智能网联汽车大会,小米CEO雷军在演讲中表示
2025-10-17 10:34:00