• 我的订阅
  • 科技

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

类别:科技 发布时间:2023-09-26 17:35:00 来源:浅语科技

今天ChatGPT与AIGC方向大涨,海天瑞声,万兴科技涨停、昆仑万维、科大讯飞、神州泰岳等纷纷冲高,板块机会再现。

这两天陆陆续续有一些关于大模型的消息出来,比如昨晚OpenAI官方宣布ChatGPT将推出新的语音和图像功能。公告称,公司正在开始推出ChatGPT的新语音和图像功能。它提供了一种新的、更直观的接口类型,允许用户进行语音对话或向ChatGPT展示用户在谈论的内容。

据官方介绍,语音和图像为用户提供了在生活中使用ChatGPT的更多方式。这种多模态理解力以及语音与图像处理能力让AI在各个行业的应用范围扩得更大了,当然背后的是多模态输出模式会进一步推高算力需求。带动底层算力等基础设施需求,更有望带动智能终端人机交互模式等方面的变革。这一点大家也能想象的到其实。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

还有昨天阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。据介绍,Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。

前天百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。据介绍,Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。

算力一直是大模型发展的支持,这两天很多大模型的消息让市场更关注算力方向,还有光模块,之前孟晚舟提到的全面智能化战略,还有台积电、博通等开发新的产品,也有望增加光模块的用量,也是增加了市场对光模块的关注度。

AIGC为什么是主要的连接与输出方向

去年元宇宙,今年大模型ChatGPT,这些都是这两年科技领域比较火的热点,元宇宙曾经被炒得不可一世,现在好像又没有那么火了,之前参与的希壤,瑶台,元璟,百度阿里腾讯这些好像也没有什么实质性产品落地,什么原因?我们觉得还是门槛太高,很难马上赚钱。

但是AIGC技术不一样,好像这个技术有些实质性的研究进展,谁也没有想到,在元宇宙、web3等概念大火的去年,AI凭借“创作”强势崛起了,并且带来了人们看得见的东西。

除了强化一些基建能力,AIGC还可以塑造出灵活有血有肉的虚拟形象,从而渗入元宇宙社交环节,强化用户的参与、互动感。算是我们体会比较深的一种接近元宇宙的技术了,现在很多网站进行了迭代,大多数都选择了AIGC新的交互模式,有数字人的入口,有gpt的交互和互动。AIGC已然成为了元宇宙领域的连接和输出技术。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

国内阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿,不过绕不开的一家公司就是百度。

百度CEO李彦宏之前强调过AIGC的重要性,他认为,AIGC不仅能够提升内容生产小笼包,还能创造出有独特价值的独立视角的内容。百度AI可以在十分钟内复原了《富春山居图》的残卷,其背后依赖的深度学习模型,即是百度的当家模型——文心大模型。文心大模型可以为多种AIGC应用提供支持。百度的AI助理,根本上其实算是多种AIGC应用的集合,包括文本生成、图片生成,图片转换视频等多种功能,最值得关注的一点是,其直接面向用户与内容创作者,也就是说,AIGC技术的C端应用化正在实现。

这几年,昆仑万维更是发力元宇宙社交等领域,进军AIGC,昆仑天工选择开源,与百度一样,昆仑万维坚信开源能够给AIGC带来更长效的发展力,并致力于降低AIGC技术的使用门槛,让AI能够帮助更多内容创作者。产品上2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是,在很多人忽略的音乐领域,昆仑万维也取得了不错的进展,于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

今年六月,美图一口气发布了7款AIGC工具,包括AI视觉创作工具WHEE、口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、美图设计室2.0、数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision(奇想智能)。

发展到现在,很多设计工具都可以重新被AI定义。AIGC能做到的是让很多想法落地,同时开可以改变企业的商业模式,把TOC变成TOB,还是美图,在用这个技术之前,美图是一个做ToC的企业,但后来,美图可以往ToB市场上转变,因为美图发布的7个产品绝大部分是针对B端的场景,当时美图已经在C端的做的很大了,没什么下潜的空间了,但存量市场已经挖掘差不多,用户增长基本处于较为稳定的状态,但ToB一直没有机会开发,利用AIGC技术,可以将之前在C端的积累应用到B端,有望找到增量的机会。比较由C端转向B端,影像方面的技术底层是共通的,以前C端用户会用抠图功能去抠出人物,换上好看的背景,而这些功能应用到B端的场景有很多。

游戏行业也是用这个技术比较多的,三七互娱在财报中说过,近年通过决策式AI、生成式AI进行技术迭代优化,打造一整套嵌入AI与大数据技术的数智化产品矩阵。另外,游戏工业化AI+应用也是个尝试,将AIGC技术融入自研的美术设计中台“图灵”之中,赋能辅助文本、图像、音频、视频等设计资产的生成、储备与管理。

AIGC技术为什么受欢迎?

另一个问题,AIGC技术为什么受欢迎?因为能落地能赚钱,之前大家关心投资对象的产品,现在大家更关心产品什么时候能赚钱?元宇宙的很多技术还处于早期阶段的技术收益高风险也高,距离落地也比较远,相比之下大家更愿意去找那些已经可以落地赚钱的技术了,不论是对资本,还是对厂商,大家都虽然也关注元宇宙,但他们发现现阶段似乎并不能为其赚钱。但有些技术可以做到了。

现在已经有一些做的比较成熟的AI应用类厂商,特别是AIGC类应用,比如Stablediffusion,还是midjourney,这些算是比较成熟的生成图片式AI厂商。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-26 20:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为笔记本将接入盘古大模型!打造智慧办公新标杆
...人动模式、美颜模式,能够帮助用户虚构背景画面。智慧语音中的AI纪要功能,则能够让用户不错过每一个会议重点,及时记录下更多可贵的想法。AI字幕功能则可以帮助用户更好地学习外语,
2024-04-10 11:08:00
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...圆表示,随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术
2024-10-14 01:53:00
openai语音翻译又出新功能了!
听说了吗?OpenAI又出新了!他们正在推出ChatGPT的全新语音和图像功能,提供了一种全新、更直观的交互方式,通过语音对话或以图片形式向ChatGPT展示讨论的内容
2023-09-26 14:59:00
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。从入围算法的角色来看,主要分为两类:“服务提供者”和“服务技术支持者”。其中“服务提供者”主要针对C端APP
2023-06-20 17:00:00
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,
2023-12-08 22:02:00
荣耀magicos9.0发布,提供小窗运行功能
...的各类需求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问
2024-10-24 01:40:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...型,现在已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。大华股份(002236)于2023年10月发布“星汉大模型”,该模型融合点云、语音、
2024-02-19 08:10:00
“寡姐”斯嘉丽·约翰逊怒怼OpenAI山寨其声音:连我的朋友都分辨不出来
...nAI回应称,将暂停使用“Sky”模式的声音,并详细介绍了语音选择的创作流程,强调所有配音均来自专业演员。此前,OpenAI推出新旗舰模型GPT-4o,该模型在保留了之前的五
2024-05-21 18:11:00
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...些模式的模型,OpenAI仍在探索模型的功能及其局限性。新语音模式是一种语音聊天助手。据Business Insider(商业内幕)报道
2024-05-14 16:45:00
更多关于科技的资讯:
三联家电41周年店庆:多重补贴叠加,引领春节消费热潮
鲁网1月12日讯新春佳节渐近,山东家电零售行业的领军品牌——三联家电迎来41周年庆典。1月16日至25日期间,一场盛大的店庆活动即将热烈展开
2026-01-12 17:01:00
随着全球环保法规日趋严苛,挥发性有机物(VOCs)治理成为工业企业合规运营的关键环节,沸石转轮吸附浓缩技术因高效节能的特性
2026-01-12 16:56:00
创意碰撞青春,立达 Z 世代・名流广告创意赛圆满落幕
当 Z 世代的脑洞与广告艺术激情碰撞,当校企协同的育人理念落地生根,一场聚焦创意与热爱的行业盛事圆满收官。12月29日
2026-01-12 16:58:00
天津市优秀基层理论宣讲员风采展示党的二十届四中全会强调,要前瞻布局未来产业,推动包括具身智能在内的六个领域成为新的经济增长点
2026-01-12 14:15:00
刘伟涛博士出任时代天使首席医学官 进一步强化全球医学体系建设
时代天使首席医学官刘伟涛博士近日,时代天使宣布,原赛德阳光口腔集团首席医疗官刘伟涛博士已正式加入时代天使,担任首席医学官兼高级副总裁
2026-01-12 16:08:00
近日,2026年湖北省科技创新大会以“乘势而上、聚势提升”为基调,再次锚定打造具有全国影响力的科技创新高地的核心目标,明确将科技创新与产业创新深度融合作为发展新质生产力的关键路径
2026-01-12 16:41:00
创新内容与读者的连接方式,磨铁图书亮相2026北京图书订货会
在2026北京图书订货会上,磨铁携大量优质内容产品亮相。围绕“磨铁,总有新的____”这一slogan,磨铁通过沉浸式的展陈设计
2026-01-12 11:27:00
当科学成为产业的语言:从光谱技术的全景比较,看“中国原创”的力量
在现代科学体系中,真正具有影响力的成果,往往不在于“做出一个新产品”,而在于重新定义一个领域的地图。这正是清华大学电子系鲍捷教授团队
2026-01-12 11:27:00
《数字化的力量》第2版获2025年度百大好书推荐
近日,京东图书联合光明网正式公布“2025年度百大好书”榜单。神州数码董事长郭为所著《数字化的力量》第2版,凭借其深刻的行业洞察
2026-01-12 13:58:00
2025年,光大银行信用卡深入把握大学生等青年群体的金融消费特征,聚焦其风险痛点与权益诉求,通过“精准化宣教、场景化服务
2026-01-12 13:58:00
近日,国际顶级学术期刊《自然》发表了我国科学家在储热技术领域的一项重要突破。浙江大学能源工程学院研究员范利武团队与其合作者提出全新的“滑移强化接触熔化”机制
2026-01-12 08:22:00
企业深度访谈对象:北京分形科技有限公司媒体:企业家日报在数字化转型浪潮中,高端网站建设已从单纯的信息展示,升级为集品牌形象
2026-01-12 08:56:00
我用AI造轮胎——“车间里的AI”系列报道之一
在中策橡胶临江制造工厂,轮胎生产制造全程由机器人完成。 本报记者 曹坚 摄当你走进一家传统的轮胎制造工厂,会看到什么?可能是轰鸣的机器
2026-01-12 09:23:00
双十一卖爆,连续五年天猫销冠!这个国货卸妆凭什么?
近年来,随着护肤步骤精细化与彩妆使用日常化,卸妆已成为中国美妆市场中增长最为迅猛的赛道之一。在这一充分竞争的市场中,衡量品牌实力的标尺日益清晰
2026-01-12 09:26:00
烟台毓璜顶医院专家直播1月15日开讲:直面卵巢功能减退,科学助力好孕梦想
胶东在线1月12日讯(记者 栾雪 通讯员 李成修 王婧)备孕路上,你是否也曾被“卵巢功能减退”的诊断打乱节奏?是否一边焦虑卵子质量
2026-01-12 10:37:00