• 我的订阅
  • 科技

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

类别:科技 发布时间:2023-09-26 17:35:00 来源:浅语科技

今天ChatGPT与AIGC方向大涨,海天瑞声,万兴科技涨停、昆仑万维、科大讯飞、神州泰岳等纷纷冲高,板块机会再现。

这两天陆陆续续有一些关于大模型的消息出来,比如昨晚OpenAI官方宣布ChatGPT将推出新的语音和图像功能。公告称,公司正在开始推出ChatGPT的新语音和图像功能。它提供了一种新的、更直观的接口类型,允许用户进行语音对话或向ChatGPT展示用户在谈论的内容。

据官方介绍,语音和图像为用户提供了在生活中使用ChatGPT的更多方式。这种多模态理解力以及语音与图像处理能力让AI在各个行业的应用范围扩得更大了,当然背后的是多模态输出模式会进一步推高算力需求。带动底层算力等基础设施需求,更有望带动智能终端人机交互模式等方面的变革。这一点大家也能想象的到其实。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

还有昨天阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。据介绍,Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。

前天百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。据介绍,Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。

算力一直是大模型发展的支持,这两天很多大模型的消息让市场更关注算力方向,还有光模块,之前孟晚舟提到的全面智能化战略,还有台积电、博通等开发新的产品,也有望增加光模块的用量,也是增加了市场对光模块的关注度。

AIGC为什么是主要的连接与输出方向

去年元宇宙,今年大模型ChatGPT,这些都是这两年科技领域比较火的热点,元宇宙曾经被炒得不可一世,现在好像又没有那么火了,之前参与的希壤,瑶台,元璟,百度阿里腾讯这些好像也没有什么实质性产品落地,什么原因?我们觉得还是门槛太高,很难马上赚钱。

但是AIGC技术不一样,好像这个技术有些实质性的研究进展,谁也没有想到,在元宇宙、web3等概念大火的去年,AI凭借“创作”强势崛起了,并且带来了人们看得见的东西。

除了强化一些基建能力,AIGC还可以塑造出灵活有血有肉的虚拟形象,从而渗入元宇宙社交环节,强化用户的参与、互动感。算是我们体会比较深的一种接近元宇宙的技术了,现在很多网站进行了迭代,大多数都选择了AIGC新的交互模式,有数字人的入口,有gpt的交互和互动。AIGC已然成为了元宇宙领域的连接和输出技术。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

国内阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿,不过绕不开的一家公司就是百度。

百度CEO李彦宏之前强调过AIGC的重要性,他认为,AIGC不仅能够提升内容生产小笼包,还能创造出有独特价值的独立视角的内容。百度AI可以在十分钟内复原了《富春山居图》的残卷,其背后依赖的深度学习模型,即是百度的当家模型——文心大模型。文心大模型可以为多种AIGC应用提供支持。百度的AI助理,根本上其实算是多种AIGC应用的集合,包括文本生成、图片生成,图片转换视频等多种功能,最值得关注的一点是,其直接面向用户与内容创作者,也就是说,AIGC技术的C端应用化正在实现。

这几年,昆仑万维更是发力元宇宙社交等领域,进军AIGC,昆仑天工选择开源,与百度一样,昆仑万维坚信开源能够给AIGC带来更长效的发展力,并致力于降低AIGC技术的使用门槛,让AI能够帮助更多内容创作者。产品上2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是,在很多人忽略的音乐领域,昆仑万维也取得了不错的进展,于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

今年六月,美图一口气发布了7款AIGC工具,包括AI视觉创作工具WHEE、口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、美图设计室2.0、数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision(奇想智能)。

发展到现在,很多设计工具都可以重新被AI定义。AIGC能做到的是让很多想法落地,同时开可以改变企业的商业模式,把TOC变成TOB,还是美图,在用这个技术之前,美图是一个做ToC的企业,但后来,美图可以往ToB市场上转变,因为美图发布的7个产品绝大部分是针对B端的场景,当时美图已经在C端的做的很大了,没什么下潜的空间了,但存量市场已经挖掘差不多,用户增长基本处于较为稳定的状态,但ToB一直没有机会开发,利用AIGC技术,可以将之前在C端的积累应用到B端,有望找到增量的机会。比较由C端转向B端,影像方面的技术底层是共通的,以前C端用户会用抠图功能去抠出人物,换上好看的背景,而这些功能应用到B端的场景有很多。

游戏行业也是用这个技术比较多的,三七互娱在财报中说过,近年通过决策式AI、生成式AI进行技术迭代优化,打造一整套嵌入AI与大数据技术的数智化产品矩阵。另外,游戏工业化AI+应用也是个尝试,将AIGC技术融入自研的美术设计中台“图灵”之中,赋能辅助文本、图像、音频、视频等设计资产的生成、储备与管理。

AIGC技术为什么受欢迎?

另一个问题,AIGC技术为什么受欢迎?因为能落地能赚钱,之前大家关心投资对象的产品,现在大家更关心产品什么时候能赚钱?元宇宙的很多技术还处于早期阶段的技术收益高风险也高,距离落地也比较远,相比之下大家更愿意去找那些已经可以落地赚钱的技术了,不论是对资本,还是对厂商,大家都虽然也关注元宇宙,但他们发现现阶段似乎并不能为其赚钱。但有些技术可以做到了。

现在已经有一些做的比较成熟的AI应用类厂商,特别是AIGC类应用,比如Stablediffusion,还是midjourney,这些算是比较成熟的生成图片式AI厂商。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-26 20:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为笔记本将接入盘古大模型!打造智慧办公新标杆
...人动模式、美颜模式,能够帮助用户虚构背景画面。智慧语音中的AI纪要功能,则能够让用户不错过每一个会议重点,及时记录下更多可贵的想法。AI字幕功能则可以帮助用户更好地学习外语,
2024-04-10 11:08:00
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...圆表示,随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术
2024-10-14 01:53:00
openai语音翻译又出新功能了!
听说了吗?OpenAI又出新了!他们正在推出ChatGPT的全新语音和图像功能,提供了一种全新、更直观的交互方式,通过语音对话或以图片形式向ChatGPT展示讨论的内容
2023-09-26 14:59:00
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。从入围算法的角色来看,主要分为两类:“服务提供者”和“服务技术支持者”。其中“服务提供者”主要针对C端APP
2023-06-20 17:00:00
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,
2023-12-08 22:02:00
荣耀magicos9.0发布,提供小窗运行功能
...的各类需求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问
2024-10-24 01:40:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...型,现在已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。大华股份(002236)于2023年10月发布“星汉大模型”,该模型融合点云、语音、
2024-02-19 08:10:00
“寡姐”斯嘉丽·约翰逊怒怼OpenAI山寨其声音:连我的朋友都分辨不出来
...nAI回应称,将暂停使用“Sky”模式的声音,并详细介绍了语音选择的创作流程,强调所有配音均来自专业演员。此前,OpenAI推出新旗舰模型GPT-4o,该模型在保留了之前的五
2024-05-21 18:11:00
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...些模式的模型,OpenAI仍在探索模型的功能及其局限性。新语音模式是一种语音聊天助手。据Business Insider(商业内幕)报道
2024-05-14 16:45:00
更多关于科技的资讯:
十堰广电讯(全媒体记者 耿吉国)据2025新能源汽车零部件交易会组委会最新消息,9月21日10:30,本届交易会将在十堰国际会展中心的交易会活动现场
2025-09-21 08:54:00
9月20日,2025太原人形机器人欢乐跑比赛在晋阳湖公园举行。这是我市第一次举办人形机器人“跑步”比赛。本次比赛,共有来自省城高校
2025-09-21 06:42:00
混成全网公敌的“流水线式造假”,终于被整顿
一家三口站在某所知名小学校门前,松弛地拍了一张合照。照片发到小红书上,下方评论区都在问询:“这么优秀的娃,究竟该怎么培养
2025-09-20 22:18:00
家庭观影进入IMAX时代!海信发布全球最大150英寸激光电视
鲁网9月19日讯9月19日,以“无界”为主题的“2025激光显示技术与产业发展大会”隆重举行。作为全球激光显示领域的领军企业
2025-09-20 08:56:00
我国脑机接口技术取得重大突破 厦门大学研究人员参与
放大镜视野下的“神经蠕虫”电极。(受访者 供图)厦门网讯(厦门日报 佘峥 通讯员 戴佩琪)我国脑机接口技术有重大突破——近日
2025-09-20 09:18:00
厦门“屏实力”再添新动能 天马发布高端OLED技术品牌“天工屏”
图为天马“天工屏”发布会现场。(厦门日报记者 卢剑豪 摄)厦门网讯(厦门日报记者 林露虹 通讯员 雷飏 李舜)随着人们日常使用手机时长持续攀升
2025-09-20 09:18:00
“赢在南京”海外人才创业大赛总决赛落幕逐鹿未来机“慧” 四海英才“论剑”南报网讯(记者余梦娇)9月19日,2025年“赢在南京”海外人才创业大赛总决赛在紫金山科技城圆满落幕
2025-09-20 09:54:00
过节送福礼,就送波尼亚!老字号中秋礼盒,青岛人都认这口
鲁网9月20日讯中秋将至,岛城的节日氛围日渐浓厚,走亲访友、阖家团聚的时刻,一份饱含心意的礼品总能传递温暖。作为扎根青岛的老字号肉食品牌
2025-09-20 10:08:00
机器人“总动员”!2025世界制造业大会上演智造奇观
大皖新闻讯 机械臂在空中划出优美弧线,人形机器人灵活抓取糖果,机器狗稳步行走在模拟街区内……2025世界制造业大会的智能机器人展区仿佛穿越至未来世界
2025-09-20 13:25:00
茶话弄九周年,这款经典单品即将迎来“家族式”升级
9月的西安,金桂飘香。2016年创立于西安的国风新中式茶饮品牌茶话弄,也将于近期启动以“桂花”为主题元素的品牌九周年庆典系列活动
2025-09-20 15:33:00
了不起的河南制造丨汉威科技:唤醒机器人“感知”世界的能力
大河网讯 2025世界制造业大会9月20日至23日在安徽省合肥市举办,大会以“智造世界·创造美好”为主题,举办开幕式暨主旨演讲
2025-09-20 16:14:00
了不起的河南制造丨2025世界制造业大会举行,河南“工业机器人”现场秀签名
大河网讯 9月20日,2025世界制造业大会开幕式暨主旨演讲在合肥市举行。河南省作为主宾省参会,30家制造业企业“重装上阵”
2025-09-20 16:45:00
2026届校园招聘大战启幕 科技企业派机器狗进高校抢人
近期,2026届校园招聘在全国多所高校陆续启动,一场围绕科技人才的“抢人大战”正式拉开帷幕。与往年相比,今年众多科技企业积极创新招聘形式
2025-09-20 17:55:00
2025山东省“产业大脑”建设工作推进会暨第五届中国(国际)美妆睫毛产业博览会在平度盛大启幕
鲁网9月20日讯(记者 潘亚妮 实习记者 刘悦 通讯员 袁嘉利 位一凡)9月20日,2025山东省“产业大脑”建设工作推进会暨第五届中国(国际)美妆睫毛产业博览会在平度市美妆在线新经济产业园盛大启幕
2025-09-20 17:55:00
从“炕头经济”到“美丽经济” ,平度睫毛产业数字化蝶变升级
齐鲁晚报•齐鲁壹点 刘震 通讯员 袁嘉利 位一凡9月20日,2025山东省“产业大脑”建设工作推进会暨第五届中国(国际)美妆睫毛产业博览会在平度市开幕
2025-09-20 18:05:00