模态,教会,文本,升级,数据,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

被神话的 Sora ，被低估的多模态。Sora 终于来了！只要是 ChatGPT Plus/Pro 用户，直接就能用上。至于效果 ......看完官方放出的 demo，网友大呼：不太行！当人们对「超级应用」的热情被 Sora 浇上一盆凉水时，多模态应用已经悄咪...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

钉钉AI助理升级上线文档速读等功能

...了图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型，升级后的钉钉AI助理可以完成这些工作：进入AI助理对话框，发送长文件、在线文档、网页链接、视频...……更多

2024-04-03 07:00:00助理,升级,功能,文档,助理,工作流

国产AI可以拍微电影了！4K、60帧高清画质，自带音效

...，其架构如下图所示：CogSound的核心技术依托于GLM-4V的多模态理解能力，能够精确解析视频中的语义和情感，并生成匹配的音效。例如，在展示森林景观的视频中，CogSound能够生成鸟鸣和风吹树叶的声音；而在城市街景中，则会...……更多

2024-11-09 09:54:00画质,音效,高清,国产,电影,生成

CHINC2024丨史文钊：大模型时代神州医疗全面领跑医疗

...作为医疗大数据AI行业领军者，神州医疗依托大数据及多模态等核心技术，倾力打造神州医疗大模型。创新性地自主研发文本、影像、病理、精准4大模型支持的多模态大模型，赋能医疗领域多场景应用。同时，史文钊强调医学研...……更多

2024-04-08 10:02:00医疗,神州,模型,时代,行业,医疗

讯飞星火首发智能体平台，敏捷触达大模型应用企业落地最后一公里

...精准，也让智能化辅学更有针对性更高效；也结合本次多模态能力升级了百科问答功能，星火大模型理解并融合了大量图书知识，对于孩子的奇思妙问等复杂问题，“爱因斯坦”和他的大咖虚拟人朋友都能回答，让孩子们在趣味...……更多

2024-04-26 11:44:00讯飞,星火,敏捷,落地,模型,智能

首个多模态连续学习综述，港中文、清华、UIC联合发布

...址：https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

WPS AI以“慢”制胜金山办公36年技术积淀助力飞跃发展

...会上，熊龙飞展示了WPS AI专业应用领域的最新成果，如跨模态技术、高度可复用的引擎系统等方面的突破。这些技术成果不仅提升了文档处理的效率和准确性，更为用户带来了全新的智慧办公体验。在多模态技术在文档处理中的...……更多

2024-04-30 12:00:00金山,飞跃,办公,发展,技术,金山

OriginOS 5来了！2024 vivo开发者大会定档1

...以及性能优化上呈现新面貌，并搭载蓝心大模型，提供多模态交互体验，包括语音、视觉及文字等领域的智能解决方案。蓝心大模型于去年11月初举行的2023 vivo开发者大会上首次对外公布，包含十亿、百亿、千亿三个参数量级共5...……更多

2024-09-20 13:38:00开发者,大会,开发,系统,模型,模态

讯飞输入法发布行业首个输入法认知大模型：生成式AI全赋能

...一代输入法认知大模型，涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵，做更靠近业务的解决方案。丁克玉特别提到，当前一代的输入法基于编解码模式预测输出，对用户意图理解能力有限。然而下一代的输入法...……更多

2023-10-25 11:34:00输入法,讯飞,输入,认知,生成,模型

谷歌和微软两位“印度老乡”CEO，正面硬刚

...，不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能，Gemini被设计为原生多模态大模型，从一开始就支持多模态输入输出。Pichai对此讲道：“就像人一样，它不仅从文本中学习，还能通过视频、音频和代码进行学习...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

总说具身智能的数据太贵，鹏城实验室开源百万规模标准化数据集

...力于打造多智能体协同与仿真训练平台、云端协同具身多模态大模型等通用基础平台，赋能工业互联网、社会治理与服务等重大应用需求。今年以来，具身智能正在成为学术界和产业界的热门领域，相关的产品和成果层出不穷。...……更多

2024-08-24 09:32:00太贵,数据,标准化,实验室,规模,实验

CVPR最佳论文被生成式AI占领，清华武大华南农大上科校友获

...并得到最终反馈标签。之后，设计了一种基于ViT和T5X的多模态Transformer模型RAHF，使用三种预测器预测上述丰富的人类反馈信息:使用卷积层和上采样层预测失真和不匹配的热力图使用卷积层和全连接层预测4个方面的评分使用Trans...……更多

2024-06-21 09:21:00华南,清华,农大,获奖,校友,生成

2023内容科技应用典型案例：传播大脑科技（浙江）股份有限公

...媒体相关任务下进行微调训练，以提高模型的可用性。多模态向量检索技术：利用向量库将多模态信息转成向量，通过向量检索技术，建立了一个高效的资源检索框架，用户可通过多种方式快速找到所需的媒体资料和信息。知识...……更多

2024-04-08 17:07:00传播,科技,典型案例,浙江,大脑,模型

不够惊艳？还是更务实？谷歌对上OpenAI，能否打好翻身..

...项目Project Astra、对标Sora的文生视频模型Veo，以及支持多模态输入的AI搜索引擎和第六代Tensor处理器单元（TPU）Trillium芯片等等。其中，Astra是谷歌的AI智能体项目，能够通过手机摄像头或智能眼镜来“看到”用户眼前的内容，响...……更多

2024-05-15 18:31:00不够,还是,生成,模型,文生,图像

新算法实现人工智能多模态信息“去伪存真”

本文转自：科技日报新算法实现人工智能多模态信息“去伪存真”科技日报讯（记者史俊斌）记者5月18日从西安电子科技大学获悉，由该校计算机科学与技术学院教授赵伟领衔的智能媒体计算机团队，通过数据可信重建以及弱...……更多

2024-05-20 03:22:00模态,人工智能,算法,人工,智能,信息

中国科技创新“乘”数直上

...火V3.5在逻辑推理、语言理解、文本生成、数学答题、多模态等方面的能力均显著提升。同时，讯飞还发布了星火语音大模型和开源大模型。“大模型带来了语音技术发展的全新机会。”刘聪说。让机器具备学习、推理和决策的...……更多

2024-02-09 06:29:00科技创新,中国,科技,数据,模型,讯飞

Kimi引爆人工智能新风口，龙头连续20CM涨停！哪些公司可

...经达到一个初级专家的水平了。未来，月之暗面还将在多模态等更多领域继续开拓，预计今年还会有新成果亮相。开启大模型应用新篇章事实上，无损长上下文是通往通用人工智能的基础技术，它也是业界一直以来的研究重点。...……更多

2024-03-21 16:48:00风口,人工智能,龙头,人工,智能,公司

顶流大模型应用！天工AI不炫技，实测真正的生产力工具

...AI搜索，相比New Bing搜索和谷歌AI搜索，它的最大特色是多模态搜索体验毫不逊色，可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性，让我可以直接使用在内容创作中。同时，天工AI还支持AI视频转...……更多

2024-06-29 09:39:00天工,实测,生产力,模型,工具,应用

谷歌史上最强大模型！Gemini 2.0正式发布

...今为止功能最强的AI模型，带来了更强的性能、更多的多模态表现（如原生图像和音频输出）和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升，速度甚至达到了后者的两倍。支持图...……更多

2024-12-12 07:15:00模型,音频,模态,自然语言,文生,多语

蔚来nomigpt端云多模态大模型上线，回答各种奇妙问题

...12日消息，今日，蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线，新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持，用户可以实现一句话设定AI场景，回答各种奇妙问题，与用户进行有情感的趣...……更多

2024-04-14 00:13:00模态,奇妙,模型,问题,模态,升级

大华股份：自研星汉大模型，推动智慧应用商业落地

...（002236）。事件：近日大华股份发布公告，公司发布了多模态融合的行业视觉大模型——大华星汉大模型，通过融合图像、点云、文本、语音等多模态数据，显著提升了视觉解析能力。点评：机器视觉垂类龙头厂商，业绩持续高...……更多

2024-01-11 15:06:00大华,星汉,落地,模型,智慧,股份

未来产业要创新　山西喊你来“揭榜挂帅”！

...征点的三维模型快速匹配系统高逼真数字人快速构建与多模态交互系统虚拟空间创作平台3D沉浸式实时通信系统3D实景地图平台基于文本描述的3D场景生成系统元宇宙数字身份标识技术解决方案人形机器人揭榜挂帅任务榜单：全身...……更多

2023-11-02 13:29:00山西,产业,应用,典型,系统,技术

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...）模型——能输入和输出文本、图像、音频、视频等任何模态的内容。这些模型均在Bedrock中提供，可微调和蒸馏。此外，AWS CEO马特·加曼宣布推出最新生成式AI实例Amazon EC2 Trn2，比当前基于GPU的EC2实例的性价比高出30%~40%。苹果...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...刚刚显现，未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中，多模态其实是一个被寄予厚望的方向。但是，这个领域目前面临一个严峻的挑战，即多模态的理解和生成...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

“弱智吧”成最佳中文AI语料库，究竟什么算优质数据？

...算法至关重要，以便进行准确的预测和分类。此外，在多模态大模型构建过程中，大规模也经常需要具有语义对齐的多模态数据，对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态（如图片和文字）之间的映...……更多

2024-04-15 17:00:00语料库,语料,中文,数据,数据,模型

创新奇智大模型工业落地初显成效，探索工业智能机器人新方向

...达到 750 亿参数，性能获得了大幅升级。AInno-75B 增加了多模态处理能力，支持输入文本、图像、视频以及工业场景中的行为（Action）模态，如 CAD 等。通过引入高参数量大模型 AInno-75B，创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多

2024-09-03 10:00:00工业,机器人,成效,落地,模型,方向

大的要来了：谷歌Bard被曝将更名为Gemini，Ultra

...ini Ultra 1.0 终于要来了去年 12 月，谷歌正式推出了原生多模态大模型 Gemini 系列，标志着谷歌 Bard 问世以来的最大更新。Gemini 有三个版本，分别是适用于端侧的 Gemini Nano，适用于多任务的 Gemini Pro，以及能力最强的 Gemini Ultr……更多

2024-02-04 17:29:00安卓,收费,安卓,用户,应用程序,更新