• 我的订阅
  • 科技

openai推出large-turbo语音转录模型

类别:科技 发布时间:2024-10-04 01:07:00 来源:浅语科技

10月3日消息,OpenAI在10月1日举办的DevDay活动日中,宣布推出了Whisperlarge-v3-turbo语音转录模型,共有8.09亿参数,在质量几乎没有下降的情况下,速度比large-v3快8倍。

Whisperlarge-v3-turbo语音转录模型是large-v3的优化版本,并且只有4层解码器层(DecoderLayers),作为对比large-v3共有32层。

Whisperlarge-v3-turbo语音转录模型共有8.09亿参数,比7.69亿参数的medium模型稍大,不过比15.5亿参数的large模型小很多。

OpenAI表示Whisperlarge-v3-turbo的速度比large模型快8倍,并且所需的VRAM为6GB,而large模型需要10GB。

openai推出large-turbo语音转录模型

openai推出large-turbo语音转录模型

openai推出large-turbo语音转录模型

Whisperlarge-v3-turbo语音转录模型大小为1.6GB,OpenAI继续根据MIT许可证提供Whisper(包括代码和模型权重)。

IT之家援引AwniHannun测试结果,在M2Ultra上,将12分钟的内容转录为14秒。

GitHub:https://github.com/openai/whisper/discussions/2363

模型下载:https://huggingface.co/openai/whisper-large-v3-turbo

在线体验:https://huggingface.co/spaces/hf-audio/whisper-large-v3-turbo

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-04 08:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

亚马逊开发史上最大文本转语音模型
...工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模
2024-02-18 12:49:00
手机厂商集体奔向大模型,但应用场景仍局限于语音助手?
...的大模型在手机上跑通了。与此同时,升级大模型的小米语音助手小爱同学也开启内测,提供超级问答、个性化创作、上下文理解与复杂任务处理等一系列的能力。在前不久的华为开发者大会上,华
2023-08-18 22:01:00
...能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、
2024-05-27 14:51:00
讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战
...27日发布,将会进一步强化国内的领先地位。日前,随着语音和音视频能力都有所提升的GPT-4o的发布,底座大模型再次迎来智慧升级,对此刘庆峰也表示,站在当前语音和大模型全新的战
2024-06-12 20:17:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种
2024-01-31 07:32:00
高斯混合模型在概率建模中的应用
...斯混合模型的应用高斯混合模型在图像处理、对象追踪、语音识别、信号处理等领域具有广泛的应用。以下是一些常见的GMM应用:图像分割图像分割是指将同一图像中不同的物体或场景划分成不
2023-10-23 03:37:00
...。华为宣布手机系统接入盘古大模型,开启内置大模型的语音助手“小艺”的众测。荣耀表示即将推出自研70亿参数端侧AI大模型和全新云服务。北京博瑞恒咨询有限公司咨询总监张扬表示,现
2023-11-24 17:06:00
Scaling Law百度最早提出!OpenAI/Claude受它启发,致谢中有Ilya
...多个机器学习领域(如机器翻译、语言建模、图像分类和语音识别)进行了测试,发现了一些规律:泛化误差(模型在新数据上的表现误差)与训练集大小呈现幂律关系,即随着训练集的增大,泛化
2024-11-28 09:57:00
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...ChatGLM能够支持三种终端侧交互方式:使用相机进行实时语音对话、上传照片进行对话、上传视频进行对话。丰富的多模态输入输出方式赋能智能助手ChatGLM实现了跨家庭、出行、
2024-10-23 02:55:00
更多关于科技的资讯: