• 我的订阅
  • 头条热搜
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
...的文本到语音模型。据外媒 Techcrunch 报道,NotebookLlama 的效果听起来不如谷歌 NotebookLM 好,带有明显的机器人口音,并且往往会在奇怪的时刻「互相交谈」。不过,项目背后的 Meta 研究人员表示,使用更强大的模型还可以提高质...……更多
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
...试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,多项指标国内第一。“大模型发展,应用才是硬道理”是科大讯飞一直秉持的观点。 目前,讯飞星火X1率先在教育等真实场景中实现了应用落地。去年1024,科大讯...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...为语音生成的音频解码器。评估为了验证模型的语音合成效果是否能达到人类同等水平,评估采用了SMOS和CMOS两个主观指标,并使用真实的人类语音作为ground truth。SMOS(Similarity Mean Opinion Score)用于评估语音与原始提示的相似度...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者写了篇论文,对2022年新出现的主流生成模型进行了年...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...下,在实时语音问答及语音识别等方面表现出令人惊喜的效果。总结来说,本文主要贡献为:提出了首个开源的端到端、实时语音交互的多模态模型解决方案,支持语音流式输出,不需要额外的 ASR 或 TTS 系统。 推理过程中,可...……更多
VEGAS Pro 19中文版下载_VEGAS Pro(视频编辑)直装版-vegas pro 19中文破解版
...过颜色分级面板使用。11、AutoLook插件的其他预设:AutoLook效果的额外20个预设。12、基于AI的Upscale和Zoom插件:最先进的Upscaling插件,可拍摄SD和HD素材并将其上转换为4k。13、自动场景检测:检测渲染文件中的场景中断和过渡,并...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...,并且在早期到中间层中,在用单词级转录训练的模型中效果较差,表明模态混合可以对齐语音和文本,使模型能够将语音序列与相应的文本序列映射起来。表达性建模当不给智能体任何先前的样本,直接根据语音或文本提示生...……更多
全面透视豆包:功能、版本、价格、优势、应用
...些常见版本及其特点:豆包通用模型 pro:是主力模型,效果较好,适合处理复杂任务,在参考问答、总结摘要、创作、文本分类、角色扮演等场景都有不错的效果。它支持较大的上下文窗口(包括 4k、32k、128k)进行推理和精调...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
教人工智能读懂专业文件(新职业新故事)
...,输入字段信息,比对AI模型生成的结果,以此检验学习效果。当发现生成结果与原文本有出入时,杨洪旭会记录并整理成问题列表。“比如文章中有一处图像,它没有读取出来。有一个图像应该是正向的,它读取成了侧向的。...……更多
AI大模型时代,如何用RAG技术重塑传统智能客服问答机器人?
...能对话机器人的实现不仅费时费力,且还没有一个很好的效果,导致“在智能对话机器人的部分,在晚上10:50我还测试了部分淘宝店家,发现一般比较小的店使用的还是人工,而像回力这种相对来说比较大的店铺也是机器人+人...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
... 尚恩一周纵览本周硅谷大厂最值得关注的,是各家的大模型均有不少上新。OpenAI宣布了多项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现...……更多
2024下半年开始 到底有谁能和英伟达继续卷下去?
...后,可以为画面与帧数带来多大的提升。首先是画面光影效果:在开启DLSS3.5后,光的反射更加清晰与真实了,整个画面也会明亮许多,尤其是物体反射的边缘位置,模糊和锯齿都被优化了许多。 左:关闭DLSS3.5右:开启DLSS3.5同...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...事件延迟。消融实验也表明,多任务的预训练对模型最终效果有重要提升。 实验定性分析与VR使用流程除了定量试验外,研究人员还做了用户实验,通过让用户在VR头显中跟各种角色互动,并且根据体验进行打分。可以发现SOLAMI...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...生柔和的、带有轻微气息的声音。在语音合成中加入换气效果,就是模仿了人类说话时的呼吸模式。本次测评中的GPT语音助手都使用了换气效果,在声音中增加了一种自然、拟人化的感觉,听起来也更加真实自然。(2)重音和...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...解决方案,这个解决方案必须满足三大指标要求,即算法效果准确、模型预测的性能要最优、算法推理延时小于我们要求的阈值,保障用户能有良好的体验。经过长时间的迭代与验证,我们自研了一套端云协同三维一体智音体系...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外,星火长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。外部权威测试集也体现出讯飞星火V4.0的领先性。在国内外12...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
chatrtx正式上线:ai加速、语音交互、ai语音识别
...它用到了TensorRT-LLM和NVIDIARTX加速技术,是显卡应用大语言模型的一个技术演示demo。最近,NVIDIA宣布——ChatwithRTX正式更名为ChatRTX。这次的更新增加了许多新功能,例如在新版本中加入了对智谱AI的ChatGLM3-6B这个中文LLM的支持,同...……更多
阿里通义上新:AI终于能做真正的PPT了!还免费
...供任何背景资料的情况下,通义生成的PPT能达到什么样的效果?点击“生成PPT”,等待不到1分钟,答案即刻揭晓。应该是基于通义大模型的联网搜索能力,生成的游戏介绍里,《黑神话》的制作方、游戏引擎等重点信息都没出...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...ora就曾爆出,拿艺术家编辑过的视频当原视频宣传,演示效果并非完全由AI生成。展示效果是真是假,有待时间验证,不过OpenAI和谷歌在端到端方面的工作,证明了人机语音交互的超低时延是可以实现的,达到媲美人类交流的水...……更多
国家科学技术进步一等奖,为何给了这家AI国家队
...、长文本建模能力上进一步提升语音识别、合成和翻译的效果,同时基于其强大的语义理解、知识问答、多轮对话、多模态建模能力,也能进一步大幅提升智能语音技术的使用场景和应用价值,支撑实现语音同传、自动客服、辅...……更多
《崩坏:星穹铁道》1.4版本内容介绍
...1回合。拥有【记忆印记】的目标造成的伤害提高40%,该效果不可以叠加。在行动者改变后,移除场上所有【记忆印记】。【离神】:被视为冻结状态,期间无法行动,当该状态解除时,目标受到等同于生命上限15%的冰属性附加...……更多
科大讯飞星火大模型将上新
...,公司将于5月在京东、天猫等电商平台上新搭载星火大模型的语音台历,具备更广泛的知识覆盖、更强的理解能力及更自然的人机交互。这款语音台历产品的更多配置、规格信息,目前官方没有过多透露。4月26日,科大讯飞宣...……更多
蓝心小V,可能是每个智能手机必备的软件
...心小V,真的非常有意思。1超能语义搜索超能语义搜索的效果,简单来说就是进阶版的模糊搜索,不需要输入指定的关键字,只需要说出一些你对这个资料的简单描述,比如去年夏天拍的照片,或者刚刚保存的文档等,之后蓝心...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...文本来进行情绪的判断,而是针对复杂场景下的语音识别效果做了提升,因而能够感知数十种情绪。表达方式随心控,情感、风格、方言都不在话下在交流中,小星可以跟随你的指令,控制数十种情感、风格、方言,还可以变换...……更多
五大数字员工已上岗!讯飞星火让每个岗位都用上大模型
...,为了让企业直观感受到大模型对于这些场景的提质增效效果,科大讯飞在MWC上同步亮相了基于星火V4.0打造的企业智能体,真正让大模型在企业中实现规模化应用。 二、五大产品贯通企业经营流程,合同审核效率提升6倍面向...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...cosyvoice 等。虽然当前语音合成大模型在中文普通话上的效果已与真人几乎无异,但面对中国纷繁复杂的方言,TTS 大模型却鲜有涉猎,训练一个统一的中文各方言语音合成大模型是一项极具挑战的任务。行业痛点与技术瓶颈当前...……更多
更多关于科技的资讯:
齐鲁晚报·齐鲁壹点 闫丽君 邵舒琨1月26日,烟台市人民政府新闻办公室召开“一路山海·烟台购 2025烟台市惠民消费券”活动新闻发布会
2025-01-26 17:02:00
男子眼球内捉出4条蠕动线虫:左眼曾飞进去过一只苍蝇
1月26日消息,据媒体报道,浙江的杨先生到医院就诊,他感觉左眼里有虫子在钻。医生翻开病人上睑发现数条正在蠕动的白色寄生虫
2025-01-26 17:05:00
精心部署确保网络畅通,东营联通助力春晚圆满举行
近日,随着欢声笑语的弥漫,垦利区春节联欢晚会如期拉开帷幕。在这场文化盛宴的背后,东营联通垦利区分公司提前筹划、精心保障
2025-01-26 17:11:00
没用D加密:《忍者龙剑传2:黑之章》PC版发售日就被攻破
之前在Xbox直面会上,忍者龙剑传2复刻版《忍者龙剑传2 黑之章》正式公布。随后该作上架Steam并发售,售价298元
2025-01-26 17:36:00
大众网记者 张姝涵 兰帅 泰安报道岁末年初,让我们一起了解常见的非法金融活动手段,守住“钱袋子”,过好幸福年!(一)承诺高额回报
2025-01-26 18:03:00
2025国补增加手机数码 山东苏宁易购迎来年前换机高峰
鲁网1月26日讯1月23日,济南等地市家电手机数码国家补贴正式上线,国补指定卖场苏宁易购全面承接,12类家电单台国补至高2000元
2025-01-26 18:07:00
平安人寿聊城中支举办社区金融内推会宣讲会
为快速搭建平安人寿聊城中支社区金融管理层队伍,确保社区金融队伍高质量发展,平安人寿聊城中支于1月8日在聊城中支职场召开平安社区金融内推会
2025-01-26 18:14:00
潮声丨义乌“走播”,走出了啥?
“走播”主播 义乌市委宣传部供图“世界的义乌”,正在不知不觉间发生变化。眼下,随着新一轮国际贸易改革启动,义乌正在深化市场采购贸易改革
2025-01-26 18:45:00
运营商“二次号码”一键解绑已上线 覆盖150款互联网应用
中国消费者报北京讯(记者武晓莉)工业和信息化部近日通告2024年第四季度电信服务质量情况。数据显示,2024年线上办理业务量超九成
2025-01-26 19:12:00
周鸿祎宣布抽送100辆国产新能源车 车型网友决定!
周鸿祎送车一事今天迎来最新进展。1月26日中午,周鸿祎在个人微博宣布,将抽送100辆国产新能源汽车。周鸿祎在微博中表示
2025-01-26 19:36:00
美联航一波音787客机空中严重颠簸:6人受重伤
1月26日消息,海外媒体近日报道,本月24日,美联航一架从拉各斯飞往华盛顿的波音787客机在飞行途中发生严重颠簸事件,导致多名旅客及机组成员轻伤
2025-01-26 19:36:00
曝雷军亲自面谈高级别汽车研发人员 有时早上8点面试
小米能有今天的成就,在科技和汽车等领域全面开花,可以说离不开雷军对人才的成功招揽。据了解,在小米汽车业务上,雷军对于招聘工作更是亲力亲为
2025-01-26 19:06:00
京东快递深圳口岸自提点开业:香港用户下单后 口岸自提
快科技1月26日消息,据京东物流介绍,为方便香港市民购物,京东近期在港澳下调了运费门槛,香港消费者满188元即可享受免运费送货上门
2025-01-26 19:06:00
猜猜是谁:美国科技界亿万富豪1.39亿英镑买下伦敦白宫
快科技1月26日消息,近日,位于伦敦摄政公园内的“伦敦白宫”(The Holme)以1.39亿英镑(约合人民币12.6亿元)的价格售出
2025-01-26 19:06:00