模态,教会,文本,升级,数据,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

AI潮起共筑数智之基

...大会上，中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座，并开放三大人工智能基地，加快大模型产业化、规模化发展，为数字中国建设注入更加强劲动能...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造，是（谷歌）通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示：Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...大模型以及丰富第三方模型（如Llama、百川等）。支持多模态模型服务，提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中，通义方面发布了最强开源模...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

“什么值得买”助力提升海螺AI消费决策体验：输出垂类能力，建

...自行研发的万亿参数大模型abab6.5，面向C端用户打造的多模态智能产品，支持文本、音频和图像的自由交流。海螺AI不仅具备强大的长文本处理能力和多格式文件支持，其高效大模型支持和多模态技术方向更能为用户提供多种服...……更多

2024-07-30 17:55:00海螺,输出,决策,生态,能力,体验

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

...，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V，声称只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

不要小看「实而不华」的腾讯 AI

...未来的战略思路。01模型侧：基础模型能力升级，构建多模态能力首先是基础模型方面，5 月 17 日的峰会上，腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中，最大模型已拓展至万亿级参数规模，并在 1B、3B、7B、13B 等不同参数量...……更多

2024-05-21 21:25:00腾讯,腾讯,模型,能力,广告,视频

每日与世界30亿次交互！这家AI独角兽企业发布视频、音乐生成

...字交互只是很小的一部分，更多的是语音和视频交互。多模态的内容，比如声音、图文和视频，已经成为信息传递的主流。为了能够提高渗透率，多模态是必经之路。”闫俊杰透露，目前video-01只提供了文生视频，在未来产品会...……更多

2024-09-04 13:45:00独角兽,生成,模型,世界,企业,视频

全球3809支队伍角逐 IKCEST第五届“一带一路”国际大

...。据了解，本届大赛从7月启动报名，以“社交网络中多模态虚假信息甄别”为题，要求选手通过构建同一事实跨模态数据之间的关系（文本和图像），实现对任一模态信息进行虚假和真实性的检测。中国工程院副院长、联合国...……更多

2023-11-07 18:40:00支队,第五届,一带,竞赛,数据,全球

科大讯飞股价跌停，市值蒸发120亿元

...升9%，其次是逻辑推理（8%），文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时，七大能力大幅度提升，其中语言理解能力提升78%，文本生成、知识问答、数学能力等提升也超70%，逻辑推理能...……更多

2023-10-24 16:15:00跌停,讯飞,市值,股价,蒸发,讯飞

数字人替代真人直播的时代来临了吗？它需要哪些技术支持？

...还需要哪些技术支持？司马华鹏称：“我们的大模型是多模态的，是文本生成、声音生成和数字人生成的结合。其实很多人在反馈，他（刘强东）声音和节奏感与他原来讲话不太一样。这很可能克隆的是平时的语速，但是直播（...……更多

2024-04-21 22:43:00真人,直播,技术支持,数字,支持,时代

“试用完谷歌的新AI模型，再也不爱GPT”

...越 GPT-4 ， Gemini 最特殊的一点是，它是谷歌带来的首个多模态大模型，也就是能不光能打字互动，也能进行语音、视频、图片的互动。按照谷歌的说法，现有的所谓多模态大模型，都是单独训练了文本、视觉和音频等模型，再把...……更多

2023-12-12 00:22:00模型,模态,模型,答案,大杯,能力

AIGC工具测评：生成式AI的产品表现如何

...力上也有了重大突破。更值得一提的是，GPT-4引入了“多模态”功能，支持图像和语音输入，甚至可以输出图片，大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格，其简洁的设计语言和优化的...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...合成。2.精细化 Token 对齐技术：我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构：我们设计了一种层次混合专家体系结构，用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

钉钉AI助理升级上线文档速读等功能

...了图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型，升级后的钉钉AI助理可以完成这些工作：进入AI助理对话框，发送长文件、在线文档、网页链接、视频...……更多

2024-04-03 07:00:00助理,升级,功能,文档,助理,工作流

国产AI可以拍微电影了！4K、60帧高清画质，自带音效

...，其架构如下图所示：CogSound的核心技术依托于GLM-4V的多模态理解能力，能够精确解析视频中的语义和情感，并生成匹配的音效。例如，在展示森林景观的视频中，CogSound能够生成鸟鸣和风吹树叶的声音；而在城市街景中，则会...……更多

2024-11-09 09:54:00画质,音效,高清,国产,电影,生成

CHINC2024丨史文钊：大模型时代神州医疗全面领跑医疗

...作为医疗大数据AI行业领军者，神州医疗依托大数据及多模态等核心技术，倾力打造神州医疗大模型。创新性地自主研发文本、影像、病理、精准4大模型支持的多模态大模型，赋能医疗领域多场景应用。同时，史文钊强调医学研...……更多

2024-04-08 10:02:00医疗,神州,模型,时代,行业,医疗

讯飞星火首发智能体平台，敏捷触达大模型应用企业落地最后一公里

...精准，也让智能化辅学更有针对性更高效；也结合本次多模态能力升级了百科问答功能，星火大模型理解并融合了大量图书知识，对于孩子的奇思妙问等复杂问题，“爱因斯坦”和他的大咖虚拟人朋友都能回答，让孩子们在趣味...……更多

2024-04-26 11:44:00讯飞,星火,敏捷,落地,模型,智能

首个多模态连续学习综述，港中文、清华、UIC联合发布

...址：https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态