效果,模型,文本,语音,文件,项目头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

...足特别是高质量的数据训练，模型就无法保证很好的性能效果。面对数据稀缺带来的种种挑战，业界既要扩增包括 AI 生成数据在内的所有类型数据，也注重提升数据稀疏场景的模型泛化能力。多模态情感识别任务也是如此，它...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

行空板MultinomialNB模型实现古诗词作者快速识别

...他的作品。为了解决这一难题，行空板引入了MultinomialNB模型——一种用于文本分类的机器学习模型，朴素贝叶斯分类器的一种。通过这一模型，行空板实现了古诗词作者的快速识别，不仅提升了古诗词的互动性，还为诗词爱好...……更多

2024-08-30 17:45:00行空,古诗词,古诗,模型,作者,模型

微软发布ai声音生成工具vall-e

...，在许多情况下，Vall-E的性能优于当前的文本到语音转换模型。然而，该研究还写道，人工智能模型目前存在几个问题。例如，文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外，该模型目前难以模...……更多

2023-01-10 12:34:00微软,生成,声音,工具,微软,人工智能

重磅！“国奖”放榜：十年来AI 领域首个国奖一等奖花落科大讯

...号经过编码后输入到大语言模型，显著提升语音大模型的效果。大模型技术可以在复杂语义理解、长文本建模能力上进一步提升语音识别、合成和翻译的效果，同时基于其强大的语义理解、知识问答、多轮对话、多模态建模能力...……更多

2024-06-26 09:15:00讯飞,重磅,一等奖,年来,领域,多语

Sora刷屏标贝科技AI配音为音视频内容创作插上翅膀

...频。从OpenAI 官网展示的众多案例我们可以看到，无论是效果、时长还是视频的真实性、稳定性、一致性、分辨率等方面，sora的能力都实在令人震惊!Sora 生成式AI新里程碑据介绍，Sora采用了扩散模型和Transformer架构的结合(Diffusion ...……更多

2024-02-29 12:00:00音视,配音,翅膀,创作,内容,科技

2秒定制你的AI声音，赛博嘴替真的来了！

...时间内，约2s左右，即可获得媲美真人、流畅自然的合成效果，并且合成音频的质量完美保持了你朗读这句话时的情感、风格和自然度，一键生成专属你自己的赛博声优。你还可以构建自己的个性化音库，再匹配上虚拟形象，就...……更多

2024-04-07 15:20:00博嘴,声音,语音,声音,博嘴,技术

AI智能双录系统服务，提升会议效率的利器

...统服务的使用增加了会议参与者的专注度，改善了会议的效果。“我不再担心错过重要的内容，可以更好地听取和参与讨论。”一位参与者说道。结论AI智能双录系统服务的出现极大地提升了会议的效率和准备工作的质量。通过...……更多

2024-08-16 23:17:00利器,效率,会议,智能,系统,服务

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...预训练而成。它可以实现多语种并达到超拟人的语音合成效果。其首批40个语种平均MOS分（评估音频或视频质量的一种标准，5分为最高）提升了0.25，拟人测试中MOS达到4.5分，拟人度达到83%，拟人语音合成能力超越ChatGPT。星火语...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...算力数据及应用本土化等特色，以更智能、更沉浸的功能效果和产品体验赋能全球内容创作者的创意表达。博汇科技（688004）1月9日在回复投资者提问时表示，公司通过运用人工智能、大数据等技术，对采集到的数据进行分析、...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

PR 2023最新版附安装教程：Adobe Premiere

...更细致、更强大。将字幕转换为图形来增强屏幕上的文本效果，以便更好地进行创意控制。创建程式化的动画图形，当您这样做时，您还可以利用通过Premiere Pro中的语音到文本功能创建的字幕。简化曲目定位:通过按住Ctrl (Windows)...……更多

2023-01-25 10:00:00最新版,教程,视频,字幕,文件夹,文件

一句话搞定UI设计！Figma开卷AI，人人都成「设计大神」

...」视觉画面设计中使用逼真、清晰的图片能有效增强视觉效果。因此，Figma推出了AI内容生成工具，帮助用户在设计中快速填充相关的逼真视觉内容。通过加入与实物一样鲜明生动的画面，形成更具吸引力和说服力的视觉效果，...……更多

2024-07-01 09:20:00设计,大神,一句话,人人,设计,功能

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...EglhJA与此同时，智谱还重磅宣布，该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后，相关能力还将上线视频通话，为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址：https://github.com/THUDM/GLM-4-Voice自...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

国泰君安：维持腾讯控股“增持”评级目标价459港元

...全新升级，叠加优质内容生态加持，元宝的AI搜索等功能效果出色。该行看好AI能力对公司各项业务进行赋能提效，同时优质内容生态也有助提升腾讯元宝等AI产品体验，认为公司优质生态与AI产品能力将形成互相促进，形成正向...……更多

2024-06-08 22:36:00君安,国泰,目标价,腾讯,港元,控股

三星目标今年将Galaxy AI推广到1亿台设备

...来编辑照片，允许用户通过删除对象或添加新生成的视觉效果来更改照片。EditSuggestion/修图建议: 提供推荐，以增强照片，编辑建议为用户提供智能建议，以改善他们的图像。Instantslow-mo/即时慢动作:它将标准视频转换为慢动作...……更多

2024-02-04 15:11:00三星,目标,推广,设备,三星,智能

爱尔眼科数字人“爱科(Eyecho) ”正式发布，支持视频、

...检索增强技术RAG，构建了蕴含眼科领域知识的垂类大语言模型AierGPT；基于自注意力网络架构，实时根据文本合成个性化声音；模仿海量自然人体运动的视频序列，通过文本指引合成自然真实人体运动实现亲近互动。会上发布了...……更多

2024-10-26 22:43:00爱尔,模态,眼科,语音,文本,数字

汉王语音王 App 发布：支持 AI 语音记录、对话翻译、同

...息如下：据介绍，汉王语音王基于汉王自研多模态天地大模型研发，集成 AI 语音记录、智能翻译与同声传译等技术，支持 AI 精准转写、拍录同步（自动裁边）、话稿整理、智能总结及不间断实时翻译等功能。 AI 语音记录AI 语...……更多

2024-08-09 09:23:00汉王,语音,同声传译,对话,支持,汉王

rtxai助手的进化

...或文字输入内容，游戏窗口的上下文信息，并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解，然后生成定制的回复，以文本或语音形式的传递给用户...……更多

2024-06-07 04:47:00进化,助手,助手,模型,性能,开发者

《三星堆：未来启示录》AIGC赋能古文明科幻短剧集

...on AI)这些技术的应用释放了想象力和创造力，提升了画面效果和创作多样性。即梦AI拥有成熟的AI内容生成经验，解放图像制作、视频生成等创作环节生产力，幕后创作人员无需逐帧制作、调整影像，即可实现创意灵感的高效落...……更多

2024-06-17 17:53:00三星堆,剧集,三星,启示录,启示,文明

数字人替代真人直播的时代来临了吗？它需要哪些技术支持？

...刘强东数字人）基本上是我们2023年产品能够呈现出来的效果，这样的直播间我们已经卖掉了上万个，京东、淘宝、抖音、快手和视频号平台都有。”真人直播会面临各种复杂场景，特别是情感交流，数字人可以做到吗？司马华...……更多

2024-04-21 22:43:00真人,直播,技术支持,数字,支持,时代

能“听懂”用户情绪的对话机器人，已成为营销获客新的“技术红利

...有话术采集声音，再拼接起来。这样不仅工作量大，拼接效果也不自然。后来神经网络兴起，能够生成没采集过的声音，并与录音部分保持音色一致。言犀团队使用的声学模型，也从自回归模型转向非自回归，推理更加稳定。到...……更多

2024-01-25 17:06:00红利,机器人,情绪,对话,机器,营销

“AI+”持续赋能千行百业，科大讯飞连续七年参加数字峰会

...开幕。科大讯飞连续七年“满勤”参会，带来讯飞星火大模型V3.5及其在城市、医疗、工业等领域的落地成果，多款C端硬件产品亮相。科大讯飞董事长刘庆峰出席开幕式主论坛，作《加快打造数字中国的通用大模型底座》主题演...……更多

2024-05-25 12:21:00讯飞,峰会,百业,数字,讯飞,星火

OpenAI史诗级更新！最强大模型炸场，128K上下文、价格

...ei）自ChatGPT爆火全球以来，我国企业纷纷推出对标GPT的大模型，而OpenAI近一年来也没闲着，智东西听会后总结发现，本次OpenAI主要有以下三大方面更新重点值得关注和思考。1、GPT-4 Turbo：支持128k上下文，相当于300页文档，输入...……更多

2023-11-07 17:45:00上下文,史诗,模型,上下,更新,价格

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...人物摄影美学及中文文字绘制等多个维度都取得了出色的效果，多次荣登SuperCLUE-Image基准榜单中文领域榜首。vivoAIGC图像大模型技术总监阮晓虎通过在算法架构、数据处理、工程以及算力上的全面优化，使蓝心图像大模型BlueLM-Art...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

iOS 17突击，爆出更新，这四个升级很有效！！

...件。iOS 17 中的其他主要功能包括使用基于转换器的语言模型的全新自动更正功能，以及在线纠正错误和提供完成单词或句子建议的预测性文本建议。新的语音识别引擎也提高了听写的准确性。iOS 17 中的其他变化包括一个能自动...……更多

2023-11-10 15:27:00升级,更新,功能,信息,浏览,贴纸

谷歌发布Translatotron 3 模型

...今天发布新闻稿，正式介绍推出了名为Translatotron3的新AI模型，无需任何并行语音数据下，可以实现语音对语音的同声传译翻译。谷歌于2019年推出了TranslatotronS2ST系统，于2021年7月推出第2个版本，在2023年5月27日发布的一篇论文中...……更多

2023-12-02 17:28:00模型,语音,语言,模型,文本,工具

特斯拉据称已掌握视频生成能力；欧盟将就音乐流媒体对苹果罚款

...台X上称，特斯拉大约一年前就具备了生成具有准确物理效果的真实世界视频的能力，但由于训练数据来自其汽车，生成的视频并不有趣。他同时表示，特斯拉视频生成超越OpenAI的地方在于它可以预测极其准确的物理特性，这对...……更多

2024-02-21 14:34:00特斯,流媒,特斯拉,流媒体,生成,苹果

微软宣布Team Copilot发布，年内将推出初步预览版

...可用本地API的Copilot库WindowsCopilotLibrary，称有40多种端侧AI模型“开箱即用”，展示了将Copilot全面融入个人电脑（PC）的新型PCCopilot+PC如何与AI应用程序（App）密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多

2024-05-22 20:01:00微软,微软,纳德拉,纳德,模型,功能