模态,教会,文本,升级,数据,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...这个金秋，“日日新·商量”又拿了金牌！今日，中文多模态大模型测评基准SuperCLUE-V发布10月榜单：商汤日日新·商量多模态大模型（SenseChat-Vision5.5）凭借多个任务上的出色表现，总得分位列国内大模型第一梯队，智夺金牌。商...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

DeepSeek R1赋能爱尔眼科“爱科（Eyecho）”数

...。术后陪伴数字人：通过手机端提供视频、语音及文本多模态服务，为术后患者定制个性化康复方案，实现长期眼健康管理。自发布以来，爱尔数字人“爱科(Eyecho)”已在集团总部及旗下多家医院投入使用，并亮相多个国际国内...……更多

2025-02-28 19:50:00爱尔,眼科,智慧,突破,驱动,医疗

“AI孙悟空”对话全球！讯飞星火AI大模型展项亮相大阪世博会

...语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力，为全球游客提供幽默问答和智慧导览，成为中国馆唯一大模型展项。大阪世博会中国馆“孙悟空”遇上自主可控AI大模型：让中国文化“活”起来“...……更多

2025-04-13 16:36:00大阪,世博,孙悟空,讯飞,星火,世博会

松鼠Ai智适应教育大模型全新升级

...与科技融合的盛宴。松鼠Ai举行发布会，不仅展示了其多模态智适应教育大模型及系统的全方位升级，还推出了多款前沿的智适应教育硬件产品，为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多

2024-06-19 10:57:00松鼠,模型,全新,升级,教育,松鼠

谷歌大模型Gemini视频被质疑造假、夸大宣传，官方回应：演

...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而，有多个消息称，这段制作的演示视频夸大了Gemini技术能力，被质疑造假、夸大宣传等，实际上手时发现Gemini并不能达到视频中的效果。同时，这类营...……更多

2023-12-08 22:02:00剪辑,演示,模型,宣传,焦点,媒体

Sora为何没能诞生在中国？

...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步，包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多

2024-03-19 05:31:00中国,模型,生成,视频,文生,中国

智谱AI再卷价格战：最低1毛线可买近200万tokens，相

...强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时，其通用能力提升达40%，超越Llama 3。Function Call函数调用能力提升40%，比肩GPT-4。智谱AI CEO张鹏表示，“2024是AGI元年，大模型技术增长没有放缓的趋势，Scal...……更多

2024-06-05 16:34:00文字量,红楼梦,毛线,价格战,红楼,文字

一脉阳光与讯飞医疗达成战略合作：驱动医疗AI深度落地

...5万家基层医疗机构，其医疗大模型已在诊断准确率、多模态数据处理等领域建立技术壁垒。公司于2024年12月在香港上市，成为医疗大模型第一股。此次合作的深层背景，是当前中国医疗体系中基层医疗建设的工作重点。2024年6月...……更多

2025-02-21 00:15:00讯飞,医疗,落地,深度,驱动,战略

腾讯混元文生图大模型升级并对外开源

...显存为11GB，同时运行DialogGen（腾讯推出的文本转图像多模态交互式对话系统）和混元DiT则至少需要32GB的显存，腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道，国内首个官方“大模型标准符合性评...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

谷歌chrome地址栏整合gemini聊天机器人

...Gemini是谷歌Deepmind最新、最强大的AI模型。它原生支持多模态，具备跨模态推理能力，包括文本，图像，视频，音频和代码。Gemini分为三个版本Ultra-三个模型版本中功能最强大，适用于高度复杂的任务Pro-适用于广泛任务的最佳模...……更多

2024-05-02 10:38:00机器人,整合,机器,地址,模型,模态

谷歌最强小屏旗舰！谷歌Pixel 9发布：5700元起

...器，这是谷歌团队定制的一颗旗舰芯片，是谷歌首款以多模态运行Gemini Nano的处理器。官方介绍，对多模态的支持意味着谷歌Pixel 9系列不仅可以理解文本，还能理解图像、音频和语音。其它参数方面，谷歌Pixel 9前置1050像素，...……更多

2024-08-14 09:37:00元起,旗舰,模态,支持,处理器,售价

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全

...成模型还有三个亮点。1、文本编码器部分，已经适配多模态大模型当下行业中多数视觉生成模型的文本编码器，适配的主要是上一代语言模型，如OpenAI的CLIP和谷歌T5及各种变种。腾讯在开源图像生成模型Hunyuan-DiT中适配的是T5和C...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

涂鸦智能×DeepSeek：多模态AI重塑宠物养护新范式

...AIoT平台与DeepSeek等AI大模型融合，通过自然语言处理、多模态场景感知等前沿技术，推动设备向“主动智能”升级，从而为AI应用的落地开辟了新路径。【宠物养护场景】（图片由AI生成）此次，《全球智能商业》便将聚焦“宠...……更多

2025-02-19 19:45:00模态,宠物养护,范式,养护,宠物,智能

澳鹏全新推出一站式文档智能识别解决方案

...方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据，如文本、插图、公式、表格等，并支持对不同版面进行识别和还原。澳鹏一站式文档智能识别解决方案集成了多种算法能力：首先使用版面识别算法，可识别...……更多

2023-12-15 17:30:00解决方案,全新,文档,智能,方案,算法

ocr图片识别技术在智慧城市建设中的应用

...用将不断深入，提高字符识别的准确率和效率。（二）多模态数据融合OCR技术将与其他传感器技术相结合，实现多模态数据的融合，提高城市管理的智能化水平。（三）云计算技术的应用OCR技术将与云计算技术相结合，实现数据...……更多

2024-07-08 11:29:00城市建设,智慧,应用,建设,城市,图片

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...阿里云也首次开源了音频理解大模型Qwen-Audio，这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音频的理解，甚至基于音频进行文...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

大模型“遍地”都是，谁能真正解放生产力？

...，其苦于人工标注久矣，不想再人工打标视频、图片等多模态信息。但市场现实情况是，供不应求：除了大厂以外，少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然，听到了太多客户关于大模型难以落地...……更多

2023-11-30 14:50:00生产力,模型,解放,生产,模型,考拉

星火大模型v3.5发布，带来七大能力提升

...为教师的“AI助手”。据官方介绍，星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”，教师使用粉笔在智慧黑板旁边的传统黑板上书写时，板书内容可以同步...……更多

2024-01-31 04:11:00星火,七大,模型,能力,星火,黑板

智谱AI杀入视频生成：「清影」上线，时长6秒，免费不限量

...。全自研技术All in 大模型的智谱 AI，很早就开始部署多模态生成式 AI 模型。从 2021 年开始，智谱 AI 先后发布了 CogView（NeurIPS’21）、 CogView2（NeurIPS’22）、CogVideo（ICLR’23）、Relay Diffusion（ICLR’……更多

2024-07-27 09:27:00清影,时长,生成,视频,清影,视频

盛视科技：公司基于多模态大模型技术底座的应用已在口岸业务场景

盛视科技：公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证【盛视科技：公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证】财联社12月13日电，盛视科技在互动平台表示，公司基于多...……更多

2023-12-13 21:50:00模态,底座,口岸,模型,场景,验证