• 我的订阅
  • 科技

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

类别:科技 发布时间:2023-09-26 17:35:00 来源:浅语科技

今天ChatGPT与AIGC方向大涨,海天瑞声,万兴科技涨停、昆仑万维、科大讯飞、神州泰岳等纷纷冲高,板块机会再现。

这两天陆陆续续有一些关于大模型的消息出来,比如昨晚OpenAI官方宣布ChatGPT将推出新的语音和图像功能。公告称,公司正在开始推出ChatGPT的新语音和图像功能。它提供了一种新的、更直观的接口类型,允许用户进行语音对话或向ChatGPT展示用户在谈论的内容。

据官方介绍,语音和图像为用户提供了在生活中使用ChatGPT的更多方式。这种多模态理解力以及语音与图像处理能力让AI在各个行业的应用范围扩得更大了,当然背后的是多模态输出模式会进一步推高算力需求。带动底层算力等基础设施需求,更有望带动智能终端人机交互模式等方面的变革。这一点大家也能想象的到其实。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

还有昨天阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。据介绍,Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。

前天百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。据介绍,Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。

算力一直是大模型发展的支持,这两天很多大模型的消息让市场更关注算力方向,还有光模块,之前孟晚舟提到的全面智能化战略,还有台积电、博通等开发新的产品,也有望增加光模块的用量,也是增加了市场对光模块的关注度。

AIGC为什么是主要的连接与输出方向

去年元宇宙,今年大模型ChatGPT,这些都是这两年科技领域比较火的热点,元宇宙曾经被炒得不可一世,现在好像又没有那么火了,之前参与的希壤,瑶台,元璟,百度阿里腾讯这些好像也没有什么实质性产品落地,什么原因?我们觉得还是门槛太高,很难马上赚钱。

但是AIGC技术不一样,好像这个技术有些实质性的研究进展,谁也没有想到,在元宇宙、web3等概念大火的去年,AI凭借“创作”强势崛起了,并且带来了人们看得见的东西。

除了强化一些基建能力,AIGC还可以塑造出灵活有血有肉的虚拟形象,从而渗入元宇宙社交环节,强化用户的参与、互动感。算是我们体会比较深的一种接近元宇宙的技术了,现在很多网站进行了迭代,大多数都选择了AIGC新的交互模式,有数字人的入口,有gpt的交互和互动。AIGC已然成为了元宇宙领域的连接和输出技术。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

国内阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿,不过绕不开的一家公司就是百度。

百度CEO李彦宏之前强调过AIGC的重要性,他认为,AIGC不仅能够提升内容生产小笼包,还能创造出有独特价值的独立视角的内容。百度AI可以在十分钟内复原了《富春山居图》的残卷,其背后依赖的深度学习模型,即是百度的当家模型——文心大模型。文心大模型可以为多种AIGC应用提供支持。百度的AI助理,根本上其实算是多种AIGC应用的集合,包括文本生成、图片生成,图片转换视频等多种功能,最值得关注的一点是,其直接面向用户与内容创作者,也就是说,AIGC技术的C端应用化正在实现。

这几年,昆仑万维更是发力元宇宙社交等领域,进军AIGC,昆仑天工选择开源,与百度一样,昆仑万维坚信开源能够给AIGC带来更长效的发展力,并致力于降低AIGC技术的使用门槛,让AI能够帮助更多内容创作者。产品上2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是,在很多人忽略的音乐领域,昆仑万维也取得了不错的进展,于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

今年六月,美图一口气发布了7款AIGC工具,包括AI视觉创作工具WHEE、口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、美图设计室2.0、数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision(奇想智能)。

发展到现在,很多设计工具都可以重新被AI定义。AIGC能做到的是让很多想法落地,同时开可以改变企业的商业模式,把TOC变成TOB,还是美图,在用这个技术之前,美图是一个做ToC的企业,但后来,美图可以往ToB市场上转变,因为美图发布的7个产品绝大部分是针对B端的场景,当时美图已经在C端的做的很大了,没什么下潜的空间了,但存量市场已经挖掘差不多,用户增长基本处于较为稳定的状态,但ToB一直没有机会开发,利用AIGC技术,可以将之前在C端的积累应用到B端,有望找到增量的机会。比较由C端转向B端,影像方面的技术底层是共通的,以前C端用户会用抠图功能去抠出人物,换上好看的背景,而这些功能应用到B端的场景有很多。

游戏行业也是用这个技术比较多的,三七互娱在财报中说过,近年通过决策式AI、生成式AI进行技术迭代优化,打造一整套嵌入AI与大数据技术的数智化产品矩阵。另外,游戏工业化AI+应用也是个尝试,将AIGC技术融入自研的美术设计中台“图灵”之中,赋能辅助文本、图像、音频、视频等设计资产的生成、储备与管理。

AIGC技术为什么受欢迎?

另一个问题,AIGC技术为什么受欢迎?因为能落地能赚钱,之前大家关心投资对象的产品,现在大家更关心产品什么时候能赚钱?元宇宙的很多技术还处于早期阶段的技术收益高风险也高,距离落地也比较远,相比之下大家更愿意去找那些已经可以落地赚钱的技术了,不论是对资本,还是对厂商,大家都虽然也关注元宇宙,但他们发现现阶段似乎并不能为其赚钱。但有些技术可以做到了。

现在已经有一些做的比较成熟的AI应用类厂商,特别是AIGC类应用,比如Stablediffusion,还是midjourney,这些算是比较成熟的生成图片式AI厂商。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-26 20:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为笔记本将接入盘古大模型!打造智慧办公新标杆
...人动模式、美颜模式,能够帮助用户虚构背景画面。智慧语音中的AI纪要功能,则能够让用户不错过每一个会议重点,及时记录下更多可贵的想法。AI字幕功能则可以帮助用户更好地学习外语,
2024-04-10 11:08:00
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...圆表示,随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术
2024-10-14 01:53:00
openai语音翻译又出新功能了!
听说了吗?OpenAI又出新了!他们正在推出ChatGPT的全新语音和图像功能,提供了一种全新、更直观的交互方式,通过语音对话或以图片形式向ChatGPT展示讨论的内容
2023-09-26 14:59:00
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。从入围算法的角色来看,主要分为两类:“服务提供者”和“服务技术支持者”。其中“服务提供者”主要针对C端APP
2023-06-20 17:00:00
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,
2023-12-08 22:02:00
荣耀magicos9.0发布,提供小窗运行功能
...的各类需求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问
2024-10-24 01:40:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...型,现在已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。大华股份(002236)于2023年10月发布“星汉大模型”,该模型融合点云、语音、
2024-02-19 08:10:00
“寡姐”斯嘉丽·约翰逊怒怼OpenAI山寨其声音:连我的朋友都分辨不出来
...nAI回应称,将暂停使用“Sky”模式的声音,并详细介绍了语音选择的创作流程,强调所有配音均来自专业演员。此前,OpenAI推出新旗舰模型GPT-4o,该模型在保留了之前的五
2024-05-21 18:11:00
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...些模式的模型,OpenAI仍在探索模型的功能及其局限性。新语音模式是一种语音聊天助手。据Business Insider(商业内幕)报道
2024-05-14 16:45:00
更多关于科技的资讯:
近年来,音效设计行业在技术介入程度上的讨论不断增加。机器学习、区块链等技术的应用,使行业内部出现了关于“声音设计是否需要标准化
2026-01-09 14:49:00
“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛作品火爆征集中,入围即享孵化赋能!
鲁网1月9日讯在黄海之滨、崂山脚下,千年文脉与现代潮流在此交融共生。为推动中华优秀传统文化创造性转化、创新性发展,助力崂山文旅高质量发展提质增效
2026-01-09 16:45:00
安徽人文讲坛丨人工智能:向新、向深、向未来
大皖新闻讯 人工智能正以前所未有的速度重塑人类社会,成为驱动全球科技革命、产业变革与国家竞争的核心力量。从历史纵深审视
2026-01-11 17:59:00
“返本还原第四回——小尺幅版画作品展”在省美术馆展出
江南时报讯(记者 钱海盈)由江苏省美术馆主办、江苏版画院(水印版画材料与技术研究文化和旅游部重点实验室)承办的“返本还原第四回——小尺幅版画作品展”正在江苏省美术馆展出
2026-01-11 15:13:00
邦德激光SK高速款激光切管机,引领高效切割技术新高度
在金属管材加工中,如何让设备在真正“高速”运行时,仍能保持“高精度”与“高稳定性”?单纯提升单项参数往往顾此失彼。邦德激光认为
2026-01-11 15:47:00
OPC“最强大脑”集结 高德空间智能开发者大赛全国总决赛在苏州落幕
江南时报讯 “‘智能遛狗小助手’帮你制定更合理的遛狗计划。”“出门旅游,帮你一站式行程管理。”“无障碍出行,AI轻松识别障碍物
2026-01-11 16:26:00
合肥创新院举办“汽车+”产业科创企业路演
大皖新闻讯 为搭建产业与资本的高效对接桥梁,推动汽车科技创新成果转化,助力创新创业企业成长,近日,2026“汽车+”产业科创企业新年路演在合肥创新院举办
2026-01-11 16:52:00
在吉林,机器人也开始“卷”滑雪了!
当双足机器人蹒跚滑下雪道,当机械臂在-20℃寒风中精准投出雪球……这些充满未来感的画面,如今正在吉林的冰天雪地里真实上演
2026-01-11 15:05:00
中新经纬1月11日电 国家医保局网站11日发布《国家医疗保障局办公室关于开展个人医保云建设试点申报工作的通知》(以下简称《通知》
2026-01-11 12:46:00
都市快报讯 昨天上午,上城区同协路旁的西子智慧产业园迎来了一名特殊的“保安”——身高1.8米,通体银色金属光泽,走起路来
2026-01-11 08:22:00
人形机器人“入职”前的试炼场来了杭州日报讯 核心提示2025年被称为人形机器人量产元年,今年人形机器人步入量产关键期,如何让机器人理解并适应人类真实的世界
2026-01-11 08:22:00
河北新闻网讯(崔梦露)1月8日下午,平安产险唐山中心支公司通过抖音、微信视频号、平安好车主、平安好生活等四大线上平台,举办“开年迎好运家家有平安”直播活动
2026-01-09 21:11:00
在全球制造业向高质量升级的浪潮下,超高压技术正成为破解多行业性能瓶颈的关键支撑。作为全球超高压领域标杆企业,Quintus专注于超高压技术的研发与应用
2026-01-10 20:59:00
为规范互联网应用程序个人信息收集使用活动,保护个人信息权益,促进个人信息合理利用,根据《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》《网络数据安全管理条例》等法律法规
2026-01-10 21:56:00
浙江造,红遍中国年!万事利春晚红围巾成“新年硬通货”
随着2026马年临近,一条承载马年春晚吉祥寓意的红围巾,正成为年末备受瞩目的新春佳礼。作为总台文创官方合作品牌,万事利丝绸匠心推出的“骐骥驰骋”系列围巾与丝巾
2026-01-10 21:02:00