• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...足特别是高质量的数据训练,模型就无法保证很好的性能效果。面对数据稀缺带来的种种挑战,业界既要扩增包括 AI 生成数据在内的所有类型数据,也注重提升数据稀疏场景的模型泛化能力。多模态情感识别任务也是如此,它...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...他的作品。为了解决这一难题,行空板引入了MultinomialNB模型——一种用于文本分类的机器学习模型,朴素贝叶斯分类器的一种。通过这一模型,行空板实现了古诗词作者的快速识别,不仅提升了古诗词的互动性,还为诗词爱好...……更多
微软发布ai声音生成工具vall-e
...,在许多情况下,Vall-E的性能优于当前的文本到语音转换模型。然而,该研究还写道,人工智能模型目前存在几个问题。例如,文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外,该模型目前难以模...……更多
重磅!“国奖”放榜:十年来AI 领域首个国奖一等奖花落科大讯飞
...号经过编码后输入到大语言模型,显著提升语音大模型的效果。大模型技术可以在复杂语义理解、长文本建模能力上进一步提升语音识别、合成和翻译的效果,同时基于其强大的语义理解、知识问答、多轮对话、多模态建模能力...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...频。从OpenAI 官网展示的众多案例我们可以看到,无论是效果、时长还是视频的真实性、稳定性、一致性、分辨率等方面,sora的能力都实在令人震惊!Sora 生成式AI新里程碑据介绍,Sora采用了扩散模型和Transformer架构的结合(Diffusion ...……更多
2秒定制你的AI声音,赛博嘴替真的来了!
...时间内,约2s左右,即可获得媲美真人、流畅自然的合成效果,并且合成音频的质量完美保持了你朗读这句话时的情感、风格和自然度,一键生成专属你自己的赛博声优。你还可以构建自己的个性化音库,再匹配上虚拟形象,就...……更多
AI智能双录系统服务,提升会议效率的利器
...统服务的使用增加了会议参与者的专注度,改善了会议的效果。“我不再担心错过重要的内容,可以更好地听取和参与讨论。”一位参与者说道。结论AI智能双录系统服务的出现极大地提升了会议的效率和准备工作的质量。通过...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...预训练而成。它可以实现多语种并达到超拟人的语音合成效果。其首批40个语种平均MOS分(评估音频或视频质量的一种标准,5分为最高)提升了0.25,拟人测试中MOS达到4.5分,拟人度达到83%,拟人语音合成能力超越ChatGPT。星火语...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...算力数据及应用本土化等特色,以更智能、更沉浸的功能效果和产品体验赋能全球内容创作者的创意表达。博汇科技(688004)1月9日在回复投资者提问时表示,公司通过运用人工智能、大数据等技术,对采集到的数据进行分析、...……更多
PR 2023最新版附安装教程:Adobe Premiere 2023 v23.1.0完美破解版
...更细致、更强大。将字幕转换为图形来增强屏幕上的文本效果,以便更好地进行创意控制。创建程式化的动画图形,当您这样做时,您还可以利用通过Premiere Pro中的语音到文本功能创建的字幕。简化曲目定位:通过按住Ctrl (Windows)...……更多
一句话搞定UI设计!Figma开卷AI,人人都成「设计大神」
...」视觉画面设计中使用逼真、清晰的图片能有效增强视觉效果。因此,Figma推出了AI内容生成工具,帮助用户在设计中快速填充相关的逼真视觉内容。通过加入与实物一样鲜明生动的画面,形成更具吸引力和说服力的视觉效果,...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...EglhJA与此同时,智谱还重磅宣布,该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后,相关能力还将上线视频通话,为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址:https://github.com/THUDM/GLM-4-Voice自...……更多
国泰君安:维持腾讯控股“增持”评级 目标价459港元
...全新升级,叠加优质内容生态加持,元宝的AI搜索等功能效果出色。该行看好AI能力对公司各项业务进行赋能提效,同时优质内容生态也有助提升腾讯元宝等AI产品体验,认为公司优质生态与AI产品能力将形成互相促进,形成正向...……更多
三星目标今年将Galaxy AI推广到1亿台设备
...来编辑照片,允许用户通过删除对象或添加新生成的视觉效果来更改照片。EditSuggestion/修图建议: 提供推荐,以增强照片,编辑建议为用户提供智能建议,以改善他们的图像。Instantslow-mo/即时慢动作:它将标准视频转换为慢动作...……更多
...检索增强技术RAG,构建了蕴含眼科领域知识的垂类大语言模型AierGPT;基于自注意力网络架构,实时根据文本合成个性化声音;模仿海量自然人体运动的视频序列,通过文本指引合成自然真实人体运动实现亲近互动。会上发布了...……更多
汉王语音王 App 发布:支持 AI 语音记录、对话翻译、同声传译
...息如下:据介绍,汉王语音王基于汉王自研多模态天地大模型研发,集成 AI 语音记录、智能翻译与同声传译等技术,支持 AI 精准转写、拍录同步(自动裁边)、话稿整理、智能总结及不间断实时翻译等功能。 AI 语音记录AI 语...……更多
rtxai助手的进化
...或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文本或语音形式的传递给用户...……更多
《三星堆:未来启示录》AIGC赋能古文明科幻短剧集
...on AI)这些技术的应用释放了想象力和创造力,提升了画面效果和创作多样性。即梦AI拥有成熟的AI内容生成经验,解放图像制作、视频生成等创作环节生产力,幕后创作人员无需逐帧制作、调整影像,即可实现创意灵感的高效落...……更多
...刘强东数字人)基本上是我们2023年产品能够呈现出来的效果,这样的直播间我们已经卖掉了上万个,京东、淘宝、抖音、快手和视频号平台都有。”真人直播会面临各种复杂场景,特别是情感交流,数字人可以做到吗?司马华...……更多
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...有话术采集声音,再拼接起来。这样不仅工作量大,拼接效果也不自然。后来神经网络兴起,能够生成没采集过的声音,并与录音部分保持音色一致。言犀团队使用的声学模型,也从自回归模型转向非自回归,推理更加稳定。到...……更多
“AI+”持续赋能千行百业,科大讯飞连续七年参加数字峰会
...开幕。科大讯飞连续七年“满勤”参会,带来讯飞星火大模型V3.5及其在城市、医疗、工业等领域的落地成果,多款C端硬件产品亮相。科大讯飞董事长刘庆峰出席开幕式主论坛,作《加快打造数字中国的通用大模型底座》主题演...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...ei)自ChatGPT爆火全球以来,我国企业纷纷推出对标GPT的大模型,而OpenAI近一年来也没闲着,智东西听会后总结发现,本次OpenAI主要有以下三大方面更新重点值得关注和思考。1、GPT-4 Turbo:支持128k上下文,相当于300页文档,输入...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...人物摄影美学及中文文字绘制等多个维度都取得了出色的效果,多次荣登SuperCLUE-Image基准榜单中文领域榜首。vivoAIGC图像大模型技术总监阮晓虎通过在算法架构、数据处理、工程以及算力上的全面优化,使蓝心图像大模型BlueLM-Art...……更多
iOS 17突击,爆出更新,这四个升级很有效!!
...件。iOS 17 中的其他主要功能包括使用基于转换器的语言模型的全新自动更正功能,以及在线纠正错误和提供完成单词或句子建议的预测性文本建议。新的语音识别引擎也提高了听写的准确性。iOS 17 中的其他变化包括一个能自动...……更多
谷歌发布Translatotron 3 模型
...今天发布新闻稿,正式介绍推出了名为Translatotron3的新AI模型,无需任何并行语音数据下,可以实现语音对语音的同声传译翻译。谷歌于2019年推出了TranslatotronS2ST系统,于2021年7月推出第2个版本,在2023年5月27日发布的一篇论文中...……更多
...台X上称,特斯拉大约一年前就具备了生成具有准确物理效果的真实世界视频的能力,但由于训练数据来自其汽车,生成的视频并不有趣。他同时表示,特斯拉视频生成超越OpenAI的地方在于它可以预测极其准确的物理特性,这对...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
...」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri,如今巨头亚马逊和新秀Cerebras也加入了这场竞争。继OpenAI在5月发布会上展示「期货」GPT-4o的语音功能后,「AI语音助手」类...……更多
omen暗影精灵10slim14实测体验
...设计,确保AI体验在保持高性能的同时,实现显著的节能效果。无论是进行视频会议时的实时美颜、背景虚化、噪声抑制,还是对图像进行细节增强等复杂AI应用,该设备都能在低功耗状态下流畅运行,确保长时间创作不受电池...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。OpenAI在ChatGPT中引入GPT-4o并免费提供更多功能。GPT-4o的“o”代表“omni”,意为全能,与现有模型相比,它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和...……更多
更多关于科技的资讯:
参半出席中国口腔新健康行动“全国爱牙日”活动 共筑国民口腔健康防护基石
9月19日,“中国口腔新健康行动・2025年全国爱牙日”活动在人民网演播厅举办。活动现场,中国口腔清洁护理用品工业协会
2025-09-22 11:44:00
CICAS组委会联合知乎开启第三届全国人工智能应用场景创新挑战赛AGI专项赛
9月20日,以“AI之下,科技重构”为主题的知乎首届TechClub新知科技大会在杭州拉开帷幕。学界专家、企业高管、AI开发者
2025-09-22 11:52:00
于都“织”出老区振兴新图景
本报讯 (全媒体记者李思成) 9月的赣南大地,秋意正浓。近日,记者随“高质量发展中国行·焕新江西”专题活动采访团一行走进赣州市于都县
2025-09-22 07:15:00
近日从太钢获悉,太钢供应用于国家能源局首台(套)重大技术装备项目——扎拉水电站的900兆帕超高强磁轭钢顺利通过叠检试验
2025-09-22 07:26:00
南京微短剧有流量更有“料”
微短剧《平凡警事》海报。微短剧《金箔奇缘》海报。百川短剧剧组在拍摄现场。 中国(南京)游戏谷。□芮天舒韶静王懿闫葛菲地铁里
2025-09-22 07:40:00
为什么越来越多的女生,恋爱前要交换体检报告?
“亲亲许可证”在即将接上吻的那一刻,女友的脑袋往后一躲,闪开了。紧接着,她抬起头,认真地盯着老王,问他,“你有没有幽门螺旋杆菌
2025-09-22 00:56:00
河北日报讯(见习记者康晓博)AI工业内窥镜、无针注射笔、分布式储能路灯、风滚草仿生播种机器人……9月20日,2025河北国际工业设计周活动开幕
2025-09-21 08:12:00
厦门网讯(厦门日报记者 林钦圣 通讯员 江安娜 徐燕) 最近,不少厦门市民都注意到这样一个现象:上班高峰期,正当大家为等候BRT快速公交车而焦急时
2025-09-21 09:00:00
乐陵杨安镇香辛料数智化交易平台正式启动
9月20日,乐陵市杨安镇以“智链未来・香聚全球”为主题的香辛料数智化交易平台启动仪式暨黄河商品交易市场香辛料品种上线仪式隆重举行
2025-09-21 09:25:00
现场签约金额达115亿元!中国制造业民营企业合作交流对接会聚焦“AI+”
大皖新闻讯 9月20日,2025世界制造业大会中国制造业民营企业合作交流对接会在合肥举行。活动现场签约项目10个,总额115
2025-09-21 10:14:00
留交会上首次设立“新招引企业专区”,200多个岗位虚席以待——这里有一份令人“新”动的邀约□南京日报/紫金山新闻记者张甜甜在9月20日举行的留交会现场
2025-09-21 10:24:00
“+”上去,活下来——2025世界制造业大会采访引发的思考
大河网讯 9月20日,2025世界制造业大会在安徽合肥开幕。河南省作为主宾省参会,30家企业参展。在人们的印象中,河南农业可圈可点
2025-09-21 14:48:00
十堰成功举办2025新能源汽车零部件交易会项目路演 十大前沿技术项目集中亮相
十堰广电讯(全媒体记者 耿吉国 通讯员 刘爱理)9月21日上午,2025新能源汽车零部件交易会项目路演活动在十堰国际会展中心成功举办
2025-09-21 15:32:00
河北新闻网讯(王丽英)近日,宁晋县晶龙餐饮管理总公司凭借市场化转型与外向型发展战略的深入实施,成功签约宁晋县产融区学生食堂
2025-09-21 15:53:00
中新经纬9月20日电 题:L2新国标将给智能驾驶立“铁律”作者 江瀚 盘古智库高级研究员智能网联汽车组合驾驶辅助系统或将迎来国家标准
2025-09-21 19:36:00