• 我的订阅
  • 头条热搜
星火语音大模型由多语种语音合成
...,星火语音大模型首次发布。据了解,星火语音大模型由多语种语音合成,在首批37个主流语种上已整体超越OpenAI公司推出的Whisper-large-v3,保持科大讯飞智能语音技术的国际领先水平。不仅如此,星火语音大模型在首批40个语种...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...智文,这款产品主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、提供演讲备注功能等。刘聪现场演示了使用讯飞智文制作的“合肥市2024年春节旅游推广策略”PPT,短时间内超20页内容丰富...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...将与多领域进行深度融合,持续赋能更多产品落地,实现多语种和个性化的全面提升。 ……更多
讯飞双屏翻译机即将首发语音大模型,多语言自动识别重磅亮相
...大模型,讯飞双屏翻译机将首发搭载语音大模型,并上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成软件推送升级,供全部新老用户使用。在旅行等场景下的跨语言沟通中,我们常常不清楚对方...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...内容等多维度语音属性解耦表征预训练而成。它可以实现多语种并达到超拟人的语音合成效果。其首批40个语种平均MOS分(评估音频或视频质量的一种标准,5分为最高)提升了0.25,拟人测试中MOS达到4.5分,拟人度达到83%,拟人...……更多
科大讯飞刘庆峰怼周鸿祎:通用大模型绝不是像茶叶蛋一样不值钱
...语音技术发展带来全新的技术,在语音合身、语音识别、多语种等方面能突破原有限制。测试显示,星火语音大模型在首批37个主流语种上已整体超越OpenAI公司推出的 Whisper-large-v3。 星火开源-13B是科大讯飞根据去年5月的星火1.0...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...飞量身定制了下一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而...……更多
仰望星空解锁AI力量
...在人工智能领域的诸多成果,包含语音合成、语音识别、多语种识别、机器翻译以及机器推理等核心技术。1024开发者节期间,星火认知大模型V3.0全新发布,已整体超越ChatGPT,发出中国AI的最强音。合肥通客户端-合报全媒体记者...……更多
科大讯飞星火语音大模型正式发布
...升,数学、语言理解、语音交互能力超GPT-4Turbo;星火语音大模型正式发布,首批37个主流语种效果超过OpenAIWhisperV3。利用大模型赋能千行百业,把大模型技术的创造力转化为促进产业高质量发展的新质生产力,正在成为行业的共...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
...格生成。语音大模型可实现高精度多方言的语音识别以及多语种、多风格、多音色的语音合成。与此同时,中国电信星辰系列大模型在覆盖视觉、语义、语音等多模态领域的20项国内外权威竞赛中斩获多项大奖,充分展现了国资...……更多
科大讯飞:打造自主创新的大模型底座,为全球产业链提供更多选择
...供自动翻译软件和硬件产品及服务的同时,牵头构建全球多语种技术生态,发布了布达佩斯人工智能联合开放平台,邀请来自全球的语音语言技术公司一起参与平台的建设,共同拓展欧洲市场。目前,全球产业链供应链正在加速...……更多
亚马逊云科技六大能力助力泛娱乐企业全球化
...,在保证回答正确性的同时,体现自然的聊天特质,天然支持多语种,适合出海应用。对于虚拟人格场景,亚马逊云科技采用语音语气、场景化描述等方式模拟人格特征,并通过大模型数据集扩写改写、私有模型训练等手段,实现个性化...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...问倾力打造,旨在拓展数字人的多样性:从融合多音色、多语种的声音,到整合不同年龄和性别的人物形象,再到多角度、多动作的灵活展示,这一全新升级的数字人系统实现了质的飞跃,极大降低了数据集成的复杂度,为创建...……更多
进击2024洞察生成式AI时代下的智能营销新机遇
...日2024,CradoAI,生成式Ai时代,智能营销新机遇,内容素材生产,多语种本地化,数据洞察运营]本文字数:1700,阅读完需:8分钟导读张奥迪先生在2024年亚马逊云科技出海日上发表了题为”进击2024洞察生成式AI时代下的智能营销新机遇”的演...……更多
红豆数字员工1号、2号上班了!
...动、场景氛围更加还原现实,能够实现多时段、多场景、多语种的智能化呈现与交互。红豆数字员工凭借着数字人模型算法升级、样本数据扩容、集合算力强大等新智优势,可以根据脚本内容输出“0感舒适衬衫”专业推荐话术...……更多
“大模型+汽车”乘势而起,科大讯飞星火座舱荣获这项特别奖
...数学答题、多模态等核心能力均将迎来显著提升,星火语音大模型与星火开源大模型也将面世,加速赋能千行百业。不断进化的大模型,将为汽车座舱带来更深度的理解能力和更多元的输出内容,引导人车交互向类人化交互体验...……更多
中国科技创新“乘”数直上
...以下四个趋势。”刘聪告诉本报记者,“第一是多模态和多语言。站在未来通用人工智能发展的角度,认知智能大模型是核心基础,基于此,语音、图像、视频等其他数据可以对齐到统一语义空间中,结合插件工具实现多模态系...……更多
阿里通义听悟发布“高校公益计划”,向所有国内高校师生赠送500小时教育福利
...答助手“小悟”上线,在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长6小时、一次性上百条音视频的内容理解问答,用户可对超长音视频随心提问,让AI总结任意知识点。此外,针对学习科研场景对AI工具的强...……更多
新款华为matebookxpro:全场景ai深度赋能
...的输入;AI字幕可对音频进行实时翻译,让用户在外语、多语种会议中游刃有余,并支持全程字幕记录的导出,会议纪要、会议复盘更加方便。除了上述的会议办公场景外,新款华为MateBookXPro的搜索功能也引入了AI,通过输入关...……更多
2024年通信行业的科技盛宴——mwc2024开启
...庆峰表示,讯飞星火V3.5多项核心能力超GPT-4Turbo,并上线多语种自动识别功能。 得益于讯飞星火认知大模型,讯飞智能录音笔全新升级了,“会议纪要”、“语篇规整”两个重量级功能。“会议纪要”能够对内容进一步加工,...……更多
深化战略合作 三星携手百度共同打造Galaxy S24 系列生成式AI体验
...将语音实时转录为文本,同时区分不同的发言人,还支持多语种翻译和生成会议纪要。让用户在跨语言交流和办公中更加轻松自如。此外,三星Galaxy S24的写作助手还能够根据不同语境建议合适的“文风”,比如措辞正式的商务...……更多
Meta推出Llama 3,号称“最强开源大模型”
...未来几个月陆续推出更多功能丰富的Llama3模型,包括支持多语种的版本,Llama3将会被深度整合到Meta主要平台的搜索功能中,包括Facebook、Instagram、WhatsApp和Messenger等,升级后的MetaAI还将能够直接对链接内容进行简单总结。此外,M...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功能,“...……更多
传音控股:新兴市场开拓+产品升级成果卓越,带动业绩大幅增长
...,公司积极拥抱AIGC,在人工智能语音识别和视觉感知、多语种AI语音助手、AI场景识别技术等方向有布局。目前公司在语音识别、语义理解、语音合成、自然语言处理、知识图谱等方面形成了的自身的AI语音底层技术能力,构建...……更多
AI视频生成技术爆发 标贝科技虚拟数字人构建未来互动新体验
...基于不同的语言库,标贝科技AI数智人具备数十种音色及多语种、方言能力。还能提供声音复刻功能,实现千人千面的个性化音色定制,适配业务场景及人设属性,轻松定制百变多样的AI数字人。(3) 接入简单 快速上线标贝科技数...……更多
英文版《来龙去脉》播出
...为影视译制AI全流程高效应用探索了业界领先的新样板。多语种影视译制将纳入总台“央视听媒体大模型”训练计划,助力总台国家多语种影视译制基地建设,有效提升中华影视文化的国际传播效能。英文版《来龙去脉》还将陆...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...对GPT语音助手的多维度测评结果,标贝科技依托核心的语音大模型迁移学习和深度神经网络技术,推出自然对话语音合成数据库以及自然对话合成音色解决方案,最大程度还原真人说话时的语气词、吸气声、停顿、拖音等副语言...……更多
人工智能赋能财富管理,九方智投亮相1024开发者生态论坛
...于星火的诸多创新应用产品以及AI开发者大赛、城市站、多语种出海等;而科大讯飞的生态合作伙伴也会共享新技术,进一步认识和发现大模型的潜力,启发更多创新性产品的诞生。“在这个论坛,我们不仅可以与最新科技产品...……更多
喜马拉雅珠峰语音生成技术实现5秒极速克隆,亮相云栖大会
...马拉雅基于阿里云数据湖3.0构建的云原生大数据平台为语音大模型训练提供了海量高质量数据,是喜马拉雅语音大模型不可或缺的“数据引擎”。据喜马拉雅首席科学家、珠峰实验室负责人卢恒介绍,“喜马拉雅语音生成式大模...……更多
本文转自:解放日报上海12366上线多语种税费咨询吴丹璐本报讯(记者 吴丹璐)记者从国家税务总局12366上海(国际)纳税服务中心获悉,上海12366多语种多渠道税费咨询服务体系已正式上线。12366中国国际税收服务热线于2016年...……更多
更多关于科技的资讯:
顶配2.9万!AMD锐龙9 9955HX3D游戏本可能要等4月初
快科技2月4日消息,AMD年初发布了面向高端游戏本的锐龙9000HX系列处理器,其中旗舰型号为锐龙9 9955X3D,第二次在移动端集成3D缓存
2025-02-04 21:41:00
ASML CEO:DeepSeek成功不代表芯片管制没效果
快科技2月4日消息,据媒体报道,ASML的CEO Christophe Fouquet近日表示,中国AI公司DeepSeek的成功显示了企业在面对AI市场时
2025-02-04 21:41:00
RTX 5090/5080还没买到 RTX 5070 Ti这就来了!大杀器
快科技2月4日消息,RTX 5090/D、RTX 5080虽然上市了,但能买到的人寥寥无几,而后续新卡正在接连不断地赶来
2025-02-04 22:41:00
年龄越大越健忘 其实这是大脑在不断进步
很多人认为,遗忘本身不是一件好事,我们应当尽可能将所有事情铭记于心。但实际上,“遗忘”是大脑具备的重要功能之一。可以说
2025-02-04 23:11:00
RTX 5090被黄牛炒至天价!网友想妙招对付抢购机器人
快科技2月4日消息,NVIDIA最新推出的RTX 5090和RTX 5080显卡在全球范围内都是一卡难求,由于供应有限
2025-02-04 23:11:00
微软推出新款Surface USB4扩展坞:轻至206克
快科技2月4日消息,据报道,微软近期发布了新款Surface USB4扩展坞,定价为199.99美元(大约相当于1450
2025-02-04 23:41:00
限时观测!就在明晚 月面X要现身了
2月5日,正月初八,天宇将迎来一轮上弦月。如果你抬头望向月亮,会发现月球表面浮现出类似字母“X”的光影,这也是今年第一场“月面X”
2025-02-04 23:41:00
任天堂谈Switch 2供应:我们正在为发售做充分准备
据外媒nintendoeverything报道,任天堂社长古川俊太郎在日前公布的财务报告里简要评论了Switch 2在今年晚些时候发售时的供应情况
2025-02-04 23:41:00
三星电子:Q1开始供应供应改良版HBM3E
快科技2月4日消息,据报道,预计从第二季度开始,三星电子改良版HBM3E的供应量将迎来全面增长,这一趋势与美国政府实施的尖端半导体出口管制政策紧密相关
2025-02-05 00:11:00
日本核电站中央控制室发生火灾:未对发射线管理区域外造成影响
快科技2月4日消息,据报道,当地时间2月4日,日本原子力发电公司发布紧急通报,指出当天下午,位于茨城县东海村的东海第二核电站中央控制室突发火灾
2025-02-05 00:11:00
能打过RTX 5070 Ti吗!AMD RX 9070系列2月底纸面发布
快科技2月5日消息,AMD原本计划在1月份就发布新一代RX 9070系列显卡,但因为性能、价格多方面的因素而被迫推迟,官方确认要到3月份才会上市(传闻到3月底)
2025-02-05 00:41:00
太疯狂了!高中生成功实现在PDF中运行Linux
快科技2月4日消息,在不久前,一位国外的高中生成功将1993年发布的射击名作《毁灭战士》移植到了PDF文件中,直接用浏览器打开文件就能玩
2025-02-05 00:41:00
一周打赏20万!各个品牌为做“榜一大哥”正在疯狂撒钱
顶流直播间刷礼物可以有多猛?5 分钟左右,接近 30 个嘉年华。按照一个嘉年华 3000 元一个计算,9 万,这满屏都是金钱燃烧的味儿 ↓ ↓如此高频的礼物刷屏
2025-02-05 00:41:00
为什么人类的耳朵不会动:2500万年前就消失了
很多动物都会竖起耳朵来倾听,这个时候它们通常看起来十分警惕,例如猫、狗和鹿都是如此。其实,如果您仔细观察的话,那么您会发现这些动物的耳朵不仅仅会竖起来
2025-02-05 00:41:00
我敢打赌 今年一定会有人买错电脑!万分谢谢Intel、AMD
虽说NVIDIA确实抢了不少风头,但隔壁 AMD 和 Intel 的新品,当然也都有关注。这篇文章就是来和大家聊聊,今年这两家的新处理器的
2025-02-05 01:11:00