• 我的订阅
  • 科技

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

类别:科技 发布时间:2023-09-26 17:35:00 来源:浅语科技

今天ChatGPT与AIGC方向大涨,海天瑞声,万兴科技涨停、昆仑万维、科大讯飞、神州泰岳等纷纷冲高,板块机会再现。

这两天陆陆续续有一些关于大模型的消息出来,比如昨晚OpenAI官方宣布ChatGPT将推出新的语音和图像功能。公告称,公司正在开始推出ChatGPT的新语音和图像功能。它提供了一种新的、更直观的接口类型,允许用户进行语音对话或向ChatGPT展示用户在谈论的内容。

据官方介绍,语音和图像为用户提供了在生活中使用ChatGPT的更多方式。这种多模态理解力以及语音与图像处理能力让AI在各个行业的应用范围扩得更大了,当然背后的是多模态输出模式会进一步推高算力需求。带动底层算力等基础设施需求,更有望带动智能终端人机交互模式等方面的变革。这一点大家也能想象的到其实。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

还有昨天阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。据介绍,Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。

前天百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。据介绍,Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。

算力一直是大模型发展的支持,这两天很多大模型的消息让市场更关注算力方向,还有光模块,之前孟晚舟提到的全面智能化战略,还有台积电、博通等开发新的产品,也有望增加光模块的用量,也是增加了市场对光模块的关注度。

AIGC为什么是主要的连接与输出方向

去年元宇宙,今年大模型ChatGPT,这些都是这两年科技领域比较火的热点,元宇宙曾经被炒得不可一世,现在好像又没有那么火了,之前参与的希壤,瑶台,元璟,百度阿里腾讯这些好像也没有什么实质性产品落地,什么原因?我们觉得还是门槛太高,很难马上赚钱。

但是AIGC技术不一样,好像这个技术有些实质性的研究进展,谁也没有想到,在元宇宙、web3等概念大火的去年,AI凭借“创作”强势崛起了,并且带来了人们看得见的东西。

除了强化一些基建能力,AIGC还可以塑造出灵活有血有肉的虚拟形象,从而渗入元宇宙社交环节,强化用户的参与、互动感。算是我们体会比较深的一种接近元宇宙的技术了,现在很多网站进行了迭代,大多数都选择了AIGC新的交互模式,有数字人的入口,有gpt的交互和互动。AIGC已然成为了元宇宙领域的连接和输出技术。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

国内阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿,不过绕不开的一家公司就是百度。

百度CEO李彦宏之前强调过AIGC的重要性,他认为,AIGC不仅能够提升内容生产小笼包,还能创造出有独特价值的独立视角的内容。百度AI可以在十分钟内复原了《富春山居图》的残卷,其背后依赖的深度学习模型,即是百度的当家模型——文心大模型。文心大模型可以为多种AIGC应用提供支持。百度的AI助理,根本上其实算是多种AIGC应用的集合,包括文本生成、图片生成,图片转换视频等多种功能,最值得关注的一点是,其直接面向用户与内容创作者,也就是说,AIGC技术的C端应用化正在实现。

这几年,昆仑万维更是发力元宇宙社交等领域,进军AIGC,昆仑天工选择开源,与百度一样,昆仑万维坚信开源能够给AIGC带来更长效的发展力,并致力于降低AIGC技术的使用门槛,让AI能够帮助更多内容创作者。产品上2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是,在很多人忽略的音乐领域,昆仑万维也取得了不错的进展,于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

今年六月,美图一口气发布了7款AIGC工具,包括AI视觉创作工具WHEE、口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、美图设计室2.0、数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision(奇想智能)。

发展到现在,很多设计工具都可以重新被AI定义。AIGC能做到的是让很多想法落地,同时开可以改变企业的商业模式,把TOC变成TOB,还是美图,在用这个技术之前,美图是一个做ToC的企业,但后来,美图可以往ToB市场上转变,因为美图发布的7个产品绝大部分是针对B端的场景,当时美图已经在C端的做的很大了,没什么下潜的空间了,但存量市场已经挖掘差不多,用户增长基本处于较为稳定的状态,但ToB一直没有机会开发,利用AIGC技术,可以将之前在C端的积累应用到B端,有望找到增量的机会。比较由C端转向B端,影像方面的技术底层是共通的,以前C端用户会用抠图功能去抠出人物,换上好看的背景,而这些功能应用到B端的场景有很多。

游戏行业也是用这个技术比较多的,三七互娱在财报中说过,近年通过决策式AI、生成式AI进行技术迭代优化,打造一整套嵌入AI与大数据技术的数智化产品矩阵。另外,游戏工业化AI+应用也是个尝试,将AIGC技术融入自研的美术设计中台“图灵”之中,赋能辅助文本、图像、音频、视频等设计资产的生成、储备与管理。

AIGC技术为什么受欢迎?

另一个问题,AIGC技术为什么受欢迎?因为能落地能赚钱,之前大家关心投资对象的产品,现在大家更关心产品什么时候能赚钱?元宇宙的很多技术还处于早期阶段的技术收益高风险也高,距离落地也比较远,相比之下大家更愿意去找那些已经可以落地赚钱的技术了,不论是对资本,还是对厂商,大家都虽然也关注元宇宙,但他们发现现阶段似乎并不能为其赚钱。但有些技术可以做到了。

现在已经有一些做的比较成熟的AI应用类厂商,特别是AIGC类应用,比如Stablediffusion,还是midjourney,这些算是比较成熟的生成图片式AI厂商。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-26 20:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为笔记本将接入盘古大模型!打造智慧办公新标杆
...人动模式、美颜模式,能够帮助用户虚构背景画面。智慧语音中的AI纪要功能,则能够让用户不错过每一个会议重点,及时记录下更多可贵的想法。AI字幕功能则可以帮助用户更好地学习外语,
2024-04-10 11:08:00
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...圆表示,随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术
2024-10-14 01:53:00
openai语音翻译又出新功能了!
听说了吗?OpenAI又出新了!他们正在推出ChatGPT的全新语音和图像功能,提供了一种全新、更直观的交互方式,通过语音对话或以图片形式向ChatGPT展示讨论的内容
2023-09-26 14:59:00
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。从入围算法的角色来看,主要分为两类:“服务提供者”和“服务技术支持者”。其中“服务提供者”主要针对C端APP
2023-06-20 17:00:00
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,
2023-12-08 22:02:00
荣耀magicos9.0发布,提供小窗运行功能
...的各类需求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问
2024-10-24 01:40:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...型,现在已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。大华股份(002236)于2023年10月发布“星汉大模型”,该模型融合点云、语音、
2024-02-19 08:10:00
“寡姐”斯嘉丽·约翰逊怒怼OpenAI山寨其声音:连我的朋友都分辨不出来
...nAI回应称,将暂停使用“Sky”模式的声音,并详细介绍了语音选择的创作流程,强调所有配音均来自专业演员。此前,OpenAI推出新旗舰模型GPT-4o,该模型在保留了之前的五
2024-05-21 18:11:00
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...些模式的模型,OpenAI仍在探索模型的功能及其局限性。新语音模式是一种语音聊天助手。据Business Insider(商业内幕)报道
2024-05-14 16:45:00
更多关于科技的资讯:
潮起章丘,一城所向:章丘世茂广场盛大开业,开启城市商业新主场
鲁网2月7日讯2026年2月6日,中国济南——由章丘控股集团与世茂集团商业地产商娱公司(以下简称世茂商娱)联袂打造的章丘世茂广场盛大开业
2026-02-07 16:32:00
“人机协同”新模式进楼宇,顺丰同城×顺丰速运机器人配送落地南昌双子塔
近日,顺丰同城与顺丰速运携手推出楼宇机器人末端配送新业务,于2月5日率先在江西南昌标志性建筑之一南昌双子塔投入运营。双方聚焦商务楼宇等高层建筑的末端配送难点
2026-02-07 16:48:00
中国科大建立磁各向异性的普适理论
大皖新闻讯 2月7日,大皖新闻记者从中国科学技术大学获悉,该校牛谦教授与高阳教授团队在磁各向异性理论研究中取得突破。研究团队基于自旋轨道耦合的微扰展开以及自旋群的群表示
2026-02-07 12:48:00
厦门网讯(厦门日报记者 应洁)马年新春将至,集美区年味渐浓。2月6日,由集美区商务局主办的“2026集美欢乐购”新春消费券正式“开抢”
2026-02-07 08:49:00
老人也能轻松操作!海尔智家APP“AI语音”让服务零门槛
智能家电功能日益丰富,售后环节的复杂化却成了很多用户的“数字门槛”。在智慧家庭战略指导下,海尔智家APP推出“AI语音”功能
2026-02-07 10:07:00
海尔智家APP“3D家庭视图”将操作效率提升60%
当智能家电数量不断增加,如何高效、直观地管理成了很多用户的“甜蜜负担”。海尔智家APP在智慧家庭战略指引下,通过数字孪生技术打造“3D家庭视图”功能
2026-02-07 10:09:00
从套购到套系,海尔智家靠近用户实现双第一
1月29日,中国家用电器服务维修协会发布《2026年家电服务业及新兴市场发展趋势预测》。报告指出,全屋智能和AI技术正成为推动市场增长的重要力量
2026-02-07 10:10:00
近日,中国科学技术大学的潘建伟院士团队在量子网络领域取得重要突破,首次构建出可扩展量子中继的基本模块,并在此基础上首次将设备无关量子密钥分发的传输距离突破百公里
2026-02-07 10:52:00
大皖新闻讯 近年来,安徽首创金融支持科创企业“共同成长计划”和“贷投批量联动”模式,科技型企业贷款4年连跨7个千亿台阶
2026-02-07 08:44:00
今天,“浙江第一摩天轮”——“天目之心”将在临安天目未来谷正式开转。“天目之心”摩天轮高131.4米,寓意“一生一世”的浪漫
2026-02-07 07:28:00
纵览原创|河北首家SUPER MINISO来了!石家庄 “首店经济”再添消费新场景
记者宋瑶 见习记者杨思涵2月6日,名创优品旗下SUPER MINISO超级名创河北首店在石家庄核心商圈中山路北国商城负一层正式开业
2026-02-07 07:33:00
河北日报讯(见习记者康晓博)2月4日,“AI+机器人”领域领军企业北京极智嘉科技股份有限公司(以下简称“极智嘉”)在雄安新区举行总部揭牌仪式
2026-02-07 07:39:00
邦德激光正式入驻Dream Park全球总部基地
近日,邦德激光总部员工全部迁入位于济南市历城区春晖路3999号的Dream Park全球总部基地,标志着公司发展进入全新阶段
2026-02-06 20:50:00
2026年WGS世界政府峰会 迪拜王储乘坐百度萝卜快跑无人车参会!
“解放双手、未来已来!”在体验完萝卜快跑全无人驾驶后,迪拜王储谢赫·哈姆丹主动在海外社交媒体上发文,赞叹这次“非常丝滑”的未来出行
2026-02-06 17:08:00
三联家电章丘首店世茂店盛大开业,一站式高端家电消费新升级
鲁网2月6日讯春启新程,盛境绽放!2月6日,扎根齐鲁四十一载的山东家电零售领军品牌三联家电,携章丘区域首店正式入驻章丘世茂广场
2026-02-06 17:12:00