• 我的订阅
  • 科技

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

类别:科技 发布时间:2023-09-26 17:35:00 来源:浅语科技

今天ChatGPT与AIGC方向大涨,海天瑞声,万兴科技涨停、昆仑万维、科大讯飞、神州泰岳等纷纷冲高,板块机会再现。

这两天陆陆续续有一些关于大模型的消息出来,比如昨晚OpenAI官方宣布ChatGPT将推出新的语音和图像功能。公告称,公司正在开始推出ChatGPT的新语音和图像功能。它提供了一种新的、更直观的接口类型,允许用户进行语音对话或向ChatGPT展示用户在谈论的内容。

据官方介绍,语音和图像为用户提供了在生活中使用ChatGPT的更多方式。这种多模态理解力以及语音与图像处理能力让AI在各个行业的应用范围扩得更大了,当然背后的是多模态输出模式会进一步推高算力需求。带动底层算力等基础设施需求,更有望带动智能终端人机交互模式等方面的变革。这一点大家也能想象的到其实。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

还有昨天阿里云举办通义千问开源发布会,正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat,开源、免费。据介绍,Qwen-14B在众多同尺寸20B以内开源模型中突出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩,超越所有测评中的SOTA大模型。

前天百川智能发布Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。据介绍,Baichuan2-53B的数学和逻辑推理能力显著提升,并通过高质量数据体系和搜索增强大幅降低了模型幻觉,是目前国内幻觉问题最低的大模型。

算力一直是大模型发展的支持,这两天很多大模型的消息让市场更关注算力方向,还有光模块,之前孟晚舟提到的全面智能化战略,还有台积电、博通等开发新的产品,也有望增加光模块的用量,也是增加了市场对光模块的关注度。

AIGC为什么是主要的连接与输出方向

去年元宇宙,今年大模型ChatGPT,这些都是这两年科技领域比较火的热点,元宇宙曾经被炒得不可一世,现在好像又没有那么火了,之前参与的希壤,瑶台,元璟,百度阿里腾讯这些好像也没有什么实质性产品落地,什么原因?我们觉得还是门槛太高,很难马上赚钱。

但是AIGC技术不一样,好像这个技术有些实质性的研究进展,谁也没有想到,在元宇宙、web3等概念大火的去年,AI凭借“创作”强势崛起了,并且带来了人们看得见的东西。

除了强化一些基建能力,AIGC还可以塑造出灵活有血有肉的虚拟形象,从而渗入元宇宙社交环节,强化用户的参与、互动感。算是我们体会比较深的一种接近元宇宙的技术了,现在很多网站进行了迭代,大多数都选择了AIGC新的交互模式,有数字人的入口,有gpt的交互和互动。AIGC已然成为了元宇宙领域的连接和输出技术。

OpenAI官方宣布ChatGPT将推出新的语音和图像功能

国内阿里巴巴、百度、腾讯等互联网巨头都注意到了AIGC这一未来的产业富矿,不过绕不开的一家公司就是百度。

百度CEO李彦宏之前强调过AIGC的重要性,他认为,AIGC不仅能够提升内容生产小笼包,还能创造出有独特价值的独立视角的内容。百度AI可以在十分钟内复原了《富春山居图》的残卷,其背后依赖的深度学习模型,即是百度的当家模型——文心大模型。文心大模型可以为多种AIGC应用提供支持。百度的AI助理,根本上其实算是多种AIGC应用的集合,包括文本生成、图片生成,图片转换视频等多种功能,最值得关注的一点是,其直接面向用户与内容创作者,也就是说,AIGC技术的C端应用化正在实现。

这几年,昆仑万维更是发力元宇宙社交等领域,进军AIGC,昆仑天工选择开源,与百度一样,昆仑万维坚信开源能够给AIGC带来更长效的发展力,并致力于降低AIGC技术的使用门槛,让AI能够帮助更多内容创作者。产品上2021年4月研发出了百亿参数的中文GPT-3模型。值得关注的是,在很多人忽略的音乐领域,昆仑万维也取得了不错的进展,于2022年1月启动的SkyMusic已经可以实现生成商用级别的音乐。

今年六月,美图一口气发布了7款AIGC工具,包括AI视觉创作工具WHEE、口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、美图设计室2.0、数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision(奇想智能)。

发展到现在,很多设计工具都可以重新被AI定义。AIGC能做到的是让很多想法落地,同时开可以改变企业的商业模式,把TOC变成TOB,还是美图,在用这个技术之前,美图是一个做ToC的企业,但后来,美图可以往ToB市场上转变,因为美图发布的7个产品绝大部分是针对B端的场景,当时美图已经在C端的做的很大了,没什么下潜的空间了,但存量市场已经挖掘差不多,用户增长基本处于较为稳定的状态,但ToB一直没有机会开发,利用AIGC技术,可以将之前在C端的积累应用到B端,有望找到增量的机会。比较由C端转向B端,影像方面的技术底层是共通的,以前C端用户会用抠图功能去抠出人物,换上好看的背景,而这些功能应用到B端的场景有很多。

游戏行业也是用这个技术比较多的,三七互娱在财报中说过,近年通过决策式AI、生成式AI进行技术迭代优化,打造一整套嵌入AI与大数据技术的数智化产品矩阵。另外,游戏工业化AI+应用也是个尝试,将AIGC技术融入自研的美术设计中台“图灵”之中,赋能辅助文本、图像、音频、视频等设计资产的生成、储备与管理。

AIGC技术为什么受欢迎?

另一个问题,AIGC技术为什么受欢迎?因为能落地能赚钱,之前大家关心投资对象的产品,现在大家更关心产品什么时候能赚钱?元宇宙的很多技术还处于早期阶段的技术收益高风险也高,距离落地也比较远,相比之下大家更愿意去找那些已经可以落地赚钱的技术了,不论是对资本,还是对厂商,大家都虽然也关注元宇宙,但他们发现现阶段似乎并不能为其赚钱。但有些技术可以做到了。

现在已经有一些做的比较成熟的AI应用类厂商,特别是AIGC类应用,比如Stablediffusion,还是midjourney,这些算是比较成熟的生成图片式AI厂商。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-26 20:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为笔记本将接入盘古大模型!打造智慧办公新标杆
...人动模式、美颜模式,能够帮助用户虚构背景画面。智慧语音中的AI纪要功能,则能够让用户不错过每一个会议重点,及时记录下更多可贵的想法。AI字幕功能则可以帮助用户更好地学习外语,
2024-04-10 11:08:00
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...圆表示,随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术
2024-10-14 01:53:00
openai语音翻译又出新功能了!
听说了吗?OpenAI又出新了!他们正在推出ChatGPT的全新语音和图像功能,提供了一种全新、更直观的交互方式,通过语音对话或以图片形式向ChatGPT展示讨论的内容
2023-09-26 14:59:00
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。从入围算法的角色来看,主要分为两类:“服务提供者”和“服务技术支持者”。其中“服务提供者”主要针对C端APP
2023-06-20 17:00:00
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...到底”形式展现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,
2023-12-08 22:02:00
荣耀magicos9.0发布,提供小窗运行功能
...的各类需求。系统自研魔法大模型现已覆盖语言、图像、语音、多模态四大领域,且AI算力按需分配,效率提升。YOYO还可以帮助用户查找微信、支付宝中的自动续费服务,汇总后列出,询问
2024-10-24 01:40:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...型,现在已经到了多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。大华股份(002236)于2023年10月发布“星汉大模型”,该模型融合点云、语音、
2024-02-19 08:10:00
“寡姐”斯嘉丽·约翰逊怒怼OpenAI山寨其声音:连我的朋友都分辨不出来
...nAI回应称,将暂停使用“Sky”模式的声音,并详细介绍了语音选择的创作流程,强调所有配音均来自专业演员。此前,OpenAI推出新旗舰模型GPT-4o,该模型在保留了之前的五
2024-05-21 18:11:00
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...些模式的模型,OpenAI仍在探索模型的功能及其局限性。新语音模式是一种语音聊天助手。据Business Insider(商业内幕)报道
2024-05-14 16:45:00
更多关于科技的资讯:
AI竞技场,河南加速度!
大河网讯 在2025世界人形机器人运动会上,“行者二号”在1500米项目中勇夺小组第一;内乡县牧原肉食产业综合体通过24小时巡检机器人与AI算法
2025-09-05 19:46:00
河北新闻网讯(王杨、曹莹莹)河钢集团张宣科技聚焦“近零碳排”冶炼全流程,通过持续优化生产工艺,充分释放设备效能。近日,该公司成功开发的高品质汽车用材料
2025-09-05 18:00:00
Baseus倍思强强联合Bose发布三大年度旗舰新品,高端专业音频迈入全民化时代
2025 年 9 月 5 日 14:00,全球新生活移动数码品牌 Baseus倍思举办线上新品发布会, 正式发布其年度旗舰音频新品——倍思 Inspire系列
2025-09-05 18:31:00
引领健康储鲜,澳柯玛风冷变频冷柜斩获“云鼎奖”
鲁网9月5日讯近日,奥维云网2025数字生态大会在杭州闭幕。作为家电行业极具影响力的年度盛会,现场汇聚了众多家电领军品牌
2025-09-05 13:38:00
周黑鸭携四大产品线矩阵破局全场景消费,构建卤味行业新范式
齐鲁晚报·齐鲁壹点 记者 张召旭在近期举办的行业展会上,周黑鸭凭借前瞻性战略布局引发行业广泛关注——品牌首次系统推出针对多元消费需求与渠道特性开发的四大产品线
2025-09-05 11:00:00
当“保温杯里泡枸杞”从段子变成日常,当“中药房下午茶”取代美式咖啡成为年轻人新宠,老字号品牌们逐渐发现:年轻人不是在买一杯饮料
2025-09-05 11:02:00
本报记者 魏 静 □ 忽 艳在国内鼓励创新、倡导在世界舞台展示中国实力产品与个人实力的大环境下,越来越多中国品牌凭借创新精神与卓越品质
2025-09-05 11:02:00
近日,阳光人寿秦皇岛中支在益寿园开展“银发课堂”特色活动,为老年群体送上内容丰富的金融知识。活动现场,工作人员通过生动的案例
2025-09-05 09:36:00
36氪首发|掘金“微醺”社交经济,精酿品牌「TAGSIU」获近千万 Pre-A 轮融资
作者 | 李小霞36 氪获悉,精酿品牌「TAGSIU 醍宿酿造」(下称“TAGSIU”)已完成近千万 Pre-A轮融资
2025-09-04 22:09:00
从形态突破到生态跃迁:华为三折叠的「鸿蒙时刻」
三折叠这个赛道,或许只有华为能够超越华为。华为Mate XT 非凡大师发布一年之后,三折叠这片“无人区”,仍然只有华为的身影
2025-09-05 00:13:00
大众网记者 张田夏荫 实习记者 张智尧 报道海信集团总裁、海信视像科技股份有限公司董事长于芝涛正式以大赛形象大使与推介大使的身份
2025-09-04 10:04:00
第26届GOPS全球运维大会落幕,AI Infra赋能运维转型
2025年6月28日,为期两天的第26届GOPS全球运维大会暨研运数智化技术峰会在北京市圆满落幕。作为国内首个运维行业盛会
2025-09-04 11:33:00
三联家电“伙拼9.12”权益全解析!三重补贴省心省钱嗨购金秋
鲁网9月4日讯金秋家装季撞上三联家电第十一季“伙拼9.12”大型内购福利会!这场被万千家庭期待的消费盛宴即将引爆全城!多重补贴
2025-09-04 11:33:00
灵动集团旗下欢米粒心理:新学期,为青少年心理护航——以专业体系构建成长防护网
在青少年心理健康服务需求进入 “刚性增长期” 的当下,资质与专业双轮驱动成为行业发展的核心支撑。灵动生活集团作为《互联网心理服务・心理测评服务通用规范》国家标准制定委员单位
2025-09-04 11:55:00
金秀之光,宏瑶传承千年瑶浴的现代创新之路
金秀大瑶山的采药人每日清晨踏遍青山,采集当地草药。这些草药通过广西宏瑶生物科技股份有限公司(以下简称“宏瑶股份”)的现代研发与技术加工
2025-09-04 11:55:00