• 我的订阅
  • 头条热搜
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
...的文本到语音模型。据外媒 Techcrunch 报道,NotebookLlama 的效果听起来不如谷歌 NotebookLM 好,带有明显的机器人口音,并且往往会在奇怪的时刻「互相交谈」。不过,项目背后的 Meta 研究人员表示,使用更强大的模型还可以提高质...……更多
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
...试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,多项指标国内第一。“大模型发展,应用才是硬道理”是科大讯飞一直秉持的观点。 目前,讯飞星火X1率先在教育等真实场景中实现了应用落地。去年1024,科大讯...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...为语音生成的音频解码器。评估为了验证模型的语音合成效果是否能达到人类同等水平,评估采用了SMOS和CMOS两个主观指标,并使用真实的人类语音作为ground truth。SMOS(Similarity Mean Opinion Score)用于评估语音与原始提示的相似度...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者写了篇论文,对2022年新出现的主流生成模型进行了年...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...下,在实时语音问答及语音识别等方面表现出令人惊喜的效果。总结来说,本文主要贡献为:提出了首个开源的端到端、实时语音交互的多模态模型解决方案,支持语音流式输出,不需要额外的 ASR 或 TTS 系统。 推理过程中,可...……更多
VEGAS Pro 19中文版下载_VEGAS Pro(视频编辑)直装版-vegas pro 19中文破解版
...过颜色分级面板使用。11、AutoLook插件的其他预设:AutoLook效果的额外20个预设。12、基于AI的Upscale和Zoom插件:最先进的Upscaling插件,可拍摄SD和HD素材并将其上转换为4k。13、自动场景检测:检测渲染文件中的场景中断和过渡,并...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...,并且在早期到中间层中,在用单词级转录训练的模型中效果较差,表明模态混合可以对齐语音和文本,使模型能够将语音序列与相应的文本序列映射起来。表达性建模当不给智能体任何先前的样本,直接根据语音或文本提示生...……更多
全面透视豆包:功能、版本、价格、优势、应用
...些常见版本及其特点:豆包通用模型 pro:是主力模型,效果较好,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有不错的效果。它支持较大的上下文窗口(包括 4k、32k、128k)进行推理和精调...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
教人工智能读懂专业文件(新职业新故事)
...,输入字段信息,比对AI模型生成的结果,以此检验学习效果。当发现生成结果与原文本有出入时,杨洪旭会记录并整理成问题列表。“比如文章中有一处图像,它没有读取出来。有一个图像应该是正向的,它读取成了侧向的。...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...能对话机器人的实现不仅费时费力,且还没有一个很好的效果,导致“在智能对话机器人的部分,在晚上10:50我还测试了部分淘宝店家,发现一般比较小的店使用的还是人工,而像回力这种相对来说比较大的店铺也是机器人+人...……更多
2024下半年开始 到底有谁能和英伟达继续卷下去?
...后,可以为画面与帧数带来多大的提升。首先是画面光影效果:在开启DLSS3.5后,光的反射更加清晰与真实了,整个画面也会明亮许多,尤其是物体反射的边缘位置,模糊和锯齿都被优化了许多。 左:关闭DLSS3.5右:开启DLSS3.5同...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
... 尚恩一周纵览本周硅谷大厂最值得关注的,是各家的大模型均有不少上新。OpenAI宣布了多项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...事件延迟。消融实验也表明,多任务的预训练对模型最终效果有重要提升。 实验定性分析与VR使用流程除了定量试验外,研究人员还做了用户实验,通过让用户在VR头显中跟各种角色互动,并且根据体验进行打分。可以发现SOLAMI...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...生柔和的、带有轻微气息的声音。在语音合成中加入换气效果,就是模仿了人类说话时的呼吸模式。本次测评中的GPT语音助手都使用了换气效果,在声音中增加了一种自然、拟人化的感觉,听起来也更加真实自然。(2)重音和...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...解决方案,这个解决方案必须满足三大指标要求,即算法效果准确、模型预测的性能要最优、算法推理延时小于我们要求的阈值,保障用户能有良好的体验。经过长时间的迭代与验证,我们自研了一套端云协同三维一体智音体系...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外,星火长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。外部权威测试集也体现出讯飞星火V4.0的领先性。在国内外12...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
chatrtx正式上线:ai加速、语音交互、ai语音识别
...它用到了TensorRT-LLM和NVIDIARTX加速技术,是显卡应用大语言模型的一个技术演示demo。最近,NVIDIA宣布——ChatwithRTX正式更名为ChatRTX。这次的更新增加了许多新功能,例如在新版本中加入了对智谱AI的ChatGLM3-6B这个中文LLM的支持,同...……更多
阿里通义上新:AI终于能做真正的PPT了!还免费
...供任何背景资料的情况下,通义生成的PPT能达到什么样的效果?点击“生成PPT”,等待不到1分钟,答案即刻揭晓。应该是基于通义大模型的联网搜索能力,生成的游戏介绍里,《黑神话》的制作方、游戏引擎等重点信息都没出...……更多
豆包语音大模型优化小说演播,大咖音色媲美真人
...,也能实现高表现力、高自然度、高语义理解的小说演播效果,声音合成质量媲美真人。据了解,市面上的语音模型想要媲美一流主播细腻的演播效果,要做好旁白和角色的区分演绎、角色情感的精确表达、不同角色的区分度等...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...ora就曾爆出,拿艺术家编辑过的视频当原视频宣传,演示效果并非完全由AI生成。展示效果是真是假,有待时间验证,不过OpenAI和谷歌在端到端方面的工作,证明了人机语音交互的超低时延是可以实现的,达到媲美人类交流的水...……更多
汇付天下AI应用丨LLM在投诉风险管控中的应用实践
...过LLM的能力,同时强化“传统范式”的智能化水平和模型效果。此框架为“标准框架”,实际应用中需根据不同风险投诉的特征和管控需要,对实施框架做对应的增减或调整,从而以最佳的模式去灵活应对各类风险投诉。 以下...……更多
《崩坏:星穹铁道》1.4版本内容介绍
...1回合。拥有【记忆印记】的目标造成的伤害提高40%,该效果不可以叠加。在行动者改变后,移除场上所有【记忆印记】。【离神】:被视为冻结状态,期间无法行动,当该状态解除时,目标受到等同于生命上限15%的冰属性附加...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...、长文本建模能力上进一步提升语音识别、合成和翻译的效果,同时基于其强大的语义理解、知识问答、多轮对话、多模态建模能力,也能进一步大幅提升智能语音技术的使用场景和应用价值,支撑实现语音同传、自动客服、辅...……更多
蓝心小V,可能是每个智能手机必备的软件
...心小V,真的非常有意思。1超能语义搜索超能语义搜索的效果,简单来说就是进阶版的模糊搜索,不需要输入指定的关键字,只需要说出一些你对这个资料的简单描述,比如去年夏天拍的照片,或者刚刚保存的文档等,之后蓝心...……更多
科大讯飞星火大模型将上新
...,公司将于5月在京东、天猫等电商平台上新搭载星火大模型的语音台历,具备更广泛的知识覆盖、更强的理解能力及更自然的人机交互。这款语音台历产品的更多配置、规格信息,目前官方没有过多透露。4月26日,科大讯飞宣...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...文本来进行情绪的判断,而是针对复杂场景下的语音识别效果做了提升,因而能够感知数十种情绪。表达方式随心控,情感、风格、方言都不在话下在交流中,小星可以跟随你的指令,控制数十种情感、风格、方言,还可以变换...……更多
更多关于科技的资讯:
鲁网10月24日讯2025年国庆、中秋双节期间,八天的“超长黄金周”不仅点燃了积攒已久的消费热情,更成为银行业激活内需
2025-10-24 10:11:00
随着 2025 年中国 GEO(生成式引擎优化)服务市场规模突破 217.3 亿元,企业对 AI 流量获取的需求愈发多元
2025-10-24 10:43:00
“缦”享生活:东箭科技旗下MANTA品牌发布会圆满开启
10月22日,汽车后市场领军企业广东东箭科技股份有限公司(以下简称“东箭科技”)旗下子公司四川缦塔汽车科技有限公司(简称“MANTA”)品牌发布会在中国·成都·花舞人间启幕
2025-10-24 10:46:00
在数字化转型加速推进的当下,企业知识管理已成为提升核心竞争力的关键环节。据Gartner《2025年企业AI应用趋势报告》显示
2025-10-24 10:48:00
夸克AI眼镜开售,88VIP叠加9折消费券,最低3329元
10月24日零点,阿里巴巴首款自研的夸克AI眼镜在其天猫官方店铺——夸克智能设备旗舰店上正式首发。天猫平台的实时成交竞速榜单显示
2025-10-24 10:49:00
中国网10月24日讯 据“国家安全部”微信公众号24日消息,当前,数字化浪潮席卷全球,电子零售新业态蓬勃发展,只需使用手机线上选物下单
2025-10-24 09:48:00
鲁网10月23日讯近日,工商银行泰安分行依托成熟的线上金融生态与智能风控体系,连续为山东勋光有限公司、岫岩满族自治县炽阳新能源有限公司(辽宁鞍山)及鞍山市创泽新能源有限公司(辽宁鞍山)成功上线光伏电费线上代扣服务
2025-10-24 09:30:00
溧水制造业再添一员“大将”年产两万台,易咖智车智能工厂投产南报网讯(记者胡英华通讯员陶燕燕谢一凡)自动导引车(AGV)“唱着歌”送材料
2025-10-24 07:47:00
中新经纬10月23日电 题:“山姆们”为何加速布局下沉市场?作者 江瀚 盘古智库高级研究员近日,以盒马、山姆为代表的新零售企业加速向全国下沉市场布局
2025-10-23 14:10:00
让残片活成文明的密码:专访90后文物活化创业者苗毅斐
2025 年上半年,文物拍卖市场迎来全面复苏,头部拍卖行交出亮眼成绩单,佳士得亚洲春季拍卖斩获 22 亿港元,苏富比亚洲中国艺术品专场亦录得 7
2025-10-23 14:18:00
西瓜学员科创赛事创佳绩,勇夺全球发明大会公益主题奖
2025 年 7 月 26 日至 28 日,全球发明大会中国区(ICC)全国总决赛在河南郑州国际会展中心落下帷幕。作为教育部严格筛选出的 “白名单” 竞赛
2025-10-23 14:18:00
深夜的福州南站,本应是灯火渐暗、人潮散去的时刻。然而在10月20日凌晨,这里却灯火通明、人声鼎沸——中国铁路南昌局集团有限公司首次推出的“歌迷专列”正整装待发
2025-10-23 15:29:00
万达电影亮相版博会,授权+原创双管齐下诠释“版权正当潮”
2025年10月16日,第十届中国国际版权博览会在青岛国际会展中心(崂山馆)正式开幕,万达电影作为参展商亮相北京展区。万达电影以“版权正当潮”为题
2025-10-23 16:08:00
拼多多给员工发黄金,10年老员工直接领100克金子? 网友:还得是真金白银实在!
2025年是拼多多成立10周年,日前,有拼多多员工在社交平台上晒出了拼多多给员工赠送的“周年礼”。据拼多多员工晒出的“周年礼”
2025-10-23 17:15:00
鲁网10月23日讯(记者 于胜涛)如今走进青岛市即墨区第二人民医院,会发现曾经缴费窗口排起的长队变短了,窗口前的焦灼面容也减少了
2025-10-23 17:19:00