• 我的订阅
  • 科技

openai推出large-turbo语音转录模型

类别:科技 发布时间:2024-10-04 01:07:00 来源:浅语科技

10月3日消息,OpenAI在10月1日举办的DevDay活动日中,宣布推出了Whisperlarge-v3-turbo语音转录模型,共有8.09亿参数,在质量几乎没有下降的情况下,速度比large-v3快8倍。

Whisperlarge-v3-turbo语音转录模型是large-v3的优化版本,并且只有4层解码器层(DecoderLayers),作为对比large-v3共有32层。

Whisperlarge-v3-turbo语音转录模型共有8.09亿参数,比7.69亿参数的medium模型稍大,不过比15.5亿参数的large模型小很多。

OpenAI表示Whisperlarge-v3-turbo的速度比large模型快8倍,并且所需的VRAM为6GB,而large模型需要10GB。

openai推出large-turbo语音转录模型

openai推出large-turbo语音转录模型

openai推出large-turbo语音转录模型

Whisperlarge-v3-turbo语音转录模型大小为1.6GB,OpenAI继续根据MIT许可证提供Whisper(包括代码和模型权重)。

IT之家援引AwniHannun测试结果,在M2Ultra上,将12分钟的内容转录为14秒。

GitHub:https://github.com/openai/whisper/discussions/2363

模型下载:https://huggingface.co/openai/whisper-large-v3-turbo

在线体验:https://huggingface.co/spaces/hf-audio/whisper-large-v3-turbo

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-04 08:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

亚马逊开发史上最大文本转语音模型
...工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模
2024-02-18 12:49:00
手机厂商集体奔向大模型,但应用场景仍局限于语音助手?
...的大模型在手机上跑通了。与此同时,升级大模型的小米语音助手小爱同学也开启内测,提供超级问答、个性化创作、上下文理解与复杂任务处理等一系列的能力。在前不久的华为开发者大会上,华
2023-08-18 22:01:00
...能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、
2024-05-27 14:51:00
讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战
...27日发布,将会进一步强化国内的领先地位。日前,随着语音和音视频能力都有所提升的GPT-4o的发布,底座大模型再次迎来智慧升级,对此刘庆峰也表示,站在当前语音和大模型全新的战
2024-06-12 20:17:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种
2024-01-31 07:32:00
高斯混合模型在概率建模中的应用
...斯混合模型的应用高斯混合模型在图像处理、对象追踪、语音识别、信号处理等领域具有广泛的应用。以下是一些常见的GMM应用:图像分割图像分割是指将同一图像中不同的物体或场景划分成不
2023-10-23 03:37:00
...。华为宣布手机系统接入盘古大模型,开启内置大模型的语音助手“小艺”的众测。荣耀表示即将推出自研70亿参数端侧AI大模型和全新云服务。北京博瑞恒咨询有限公司咨询总监张扬表示,现
2023-11-24 17:06:00
Scaling Law百度最早提出!OpenAI/Claude受它启发,致谢中有Ilya
...多个机器学习领域(如机器翻译、语言建模、图像分类和语音识别)进行了测试,发现了一些规律:泛化误差(模型在新数据上的表现误差)与训练集大小呈现幂律关系,即随着训练集的增大,泛化
2024-11-28 09:57:00
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...ChatGLM能够支持三种终端侧交互方式:使用相机进行实时语音对话、上传照片进行对话、上传视频进行对话。丰富的多模态输入输出方式赋能智能助手ChatGLM实现了跨家庭、出行、
2024-10-23 02:55:00
更多关于科技的资讯:
京东折扣超市全国第六店落户固安
河北新闻网讯(李寒梦、陈放)9月25日,京东折扣超市全国第六家门店在固安尚品爱购城市广场正式开业,进一步点燃居民消费热情
2025-09-29 09:53:00
从榨菜月饼到榨菜咖啡,乌江榨菜以创新打破品类边界
近年来,伴随区域化、特色化产品的迅速增长,各大品牌在深耕主业的同时也开始积极探索新赛道、新领域。乌江榨菜作为涪陵榨菜集团旗下的核心品牌
2025-09-29 08:03:00
华北首家!多美卡品牌专卖店登陆北京玩具反斗城
[北京] – 继中国首家多美卡品牌专卖店入驻玩具反斗城上海南丰城店并成功引爆小车收藏热潮后,玩具反斗城(Toys“R”Us)与多美(TAKARA TOMY)的战略合作再结硕果
2025-09-29 07:33:00
南报网讯(记者张甜甜)10月2日至3日,由南京报业传媒集团旗下南报优选供应链公司主办的首届紫金山国潮漫文化嘉年华,将在南京国际展览中心举办
2025-09-29 07:42:00
9月26日,购在中国(山西站)暨中石化易捷第八届易享节在我市启动,诸多三晋名特优产品将陆续入驻中石化易捷,走向全国。今后
2025-09-28 08:20:00
刚刚闭幕的长春航空展上,“净月号”成瞩目焦点
9月23日,长春航空展圆满闭幕,“净月号”凭借其震撼的实体造型与深厚的文化内涵,成为展会瞩目的焦点。这艘承载中式太空梦想的“星舰”
2025-09-28 10:07:00
为更好的服务广大客户,富德生命人寿安平支公司积极组织员工开展《产品健康增值服务》培训。培训中,讲师细致讲解公司产品健康增值服务
2025-09-28 10:12:00
河北新闻网讯(王丽英)9月24日至25日,宁晋县晶龙集团举行人力资源专业培训,内训师靳桂峰、王素峰和张晓宁分别围绕工伤保险及识人辨人
2025-09-28 10:18:00
美团Keeta上线阿联酋!40天连开3国,国际化全速推进
当地时间9月27日上午11点,美团旗下国际外卖品牌Keeta正式在阿联酋迪拜启动运营,这是Keeta继8月上线卡塔尔、9月上线科威特后
2025-09-28 10:22:00
小米17系列9月27日开售,卢伟冰称ProMax需求远超预期,已安排快速提拉生产
9月27日上午10点,小米17系列开售,价格4499元起!并全系首发第五代骁龙 8 至尊版。据悉,小米17尺寸6.3,7000mAh 电池
2025-09-28 10:22:00
齐鲁晚报·齐鲁壹点 王会广 通讯员 李杰在数字经济蓬勃发展的当下,大数据、云计算、物联网、移动互联网、人工智能以及区块链等新兴技术的广泛应用
2025-09-28 10:56:00
实时互动x高效制播:佳能携手《密室大逃脱大神版 互动直播》真人秀实现制作新范式
在直播与正片并行制作逐渐成为综艺内容生产新常态的当下,真人秀现场对影像系统的要求不断提升:既要满足直播的即时输出,又要兼顾正片制作的高质量成片
2025-09-28 11:51:00
齐鲁晚报·齐鲁壹点菏泽光影在线摄影摄像实战培训班11月初开启
从“拍摄小白”到“拍摄大神”,你只差这一套实战课!齐鲁晚报(光影在线实战培训)告别“自动挡”,用镜头讲故事。这是一个视觉统治注意力的时代
2025-09-28 12:03:00
烟台银行威海荣成支行“金融+”开辟服务新路径
近日,烟台银行荣成支行通过创新推出的“智慧物业”合作解决方案,成功为当地多家物业公司纾困解难,有效破解了长期困扰行业发展的收费难
2025-09-28 12:05:00
莫林酒店洛阳首店落子!完善文旅服务补中高端住宿
作为中国第一古刹,洛阳白马寺的文旅热度在 2025 年暑期再攀新高 —— 日均接待游客超 8000 人次,35 元亲民票价搭配免费斋饭政策
2025-09-28 12:22:00