模态,教会,文本,升级,数据,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

厦大教授团队自主研发的思源大模型“霸榜”权威榜单，“优等生”

...型榜单客观能力评测中排名第一（2024年1月）；在腾讯多模态大模型榜单中排名第一（2023年11月）。事实上，在过去十年里，许多AI头部企业的主打产品都有思源大模型团队的技术加持。目前，思源大模型团队已与华为、腾讯等...……更多

2024-08-30 08:36:00思源,优等生,优等,自主研发,模型,教授

讯飞星火V4.0整体超越GPT-4 Turbo，8个国际权威

...但具备了多语种多方言的“自由交互”，还具备多情感多模态的超拟人交互，让人车交互更有温度。当前，讯飞语音交互产品国内市占率稳居第一，同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企...……更多

2024-06-28 08:49:00讯飞,星火,整体,权威,测试,国际

2025年十大GEO优化公司推荐：企业AI化转型的核心引擎

...五维内容引擎：构建结构化数据植入、语义关联优化、多模态适配、实时知识更新、竞品动态拦截技术体系，支持文本、视频、语音搜索协同优化。某新能源汽车品牌通过该引擎，在AI平台的“家庭实用场景”关键词曝光率激增8...……更多

2025-11-04 15:05:00核心,引擎,推荐,公司,企业,技术

OpenAI CEO又创办了一家AI健康公司

...关产品，多项测评超GPT-4o商汤发布日日新5.5，包括流式多模态交互的5o版本，多项测评超GPT-4o，还推出了端侧大模型和相关产品。商汤现场演示了日日新5o的实时音视频交互能力，还推出了可控人物视频生成AIGC产品Vimi。商汤推...……更多

2024-07-14 13:19:00一家,健康,公司,模型,视频,应用

百度史上最好！文心大模型4.5/X1正式发布：免费用

...模型4.5和文心大模型X1。文心大模型4.5是百度首个原生多模态大模型，多模态理解、文本和逻辑推理能力提升，在多项测试中表现优于GPT4.5，API调用价格仅为GPT4.5的1%。百度创始人李彦宏此前表示，文心大模型4.5将是百度有史以...……更多

2025-03-16 09:53:00文心,模型,费用,最好,文心,模型

金域医学域见医言大模型正式发布，提速智慧医检4.0时代

...“六边形战士”，能够做到多模型整合、多场景赋能、多模态与多组学数据处理、多元知识充分融合、基于全病程信息多轮互动，不仅仅具备知识问答、智能化检测结果整合的功能，还具备医学领域的专业分析、推理能力。金...……更多

2024-08-23 18:00:00提速,模型,智慧,医学,时代,检验

智能对话、深度交互这个AI工具“太香了”

...四川省两会新闻报道的专业大模型。“Chat两会”通过多模态理解、内容生成、智能交互的AI核心能力，提供“智库型”两会热点问答服务。智能对话、深度交互，不少代表委员感叹，这个工具“太香了”。“Chat两会”也获得AI业...……更多

2024-01-24 05:45:00深度,对话,智能,工具,工作报告,报告

智源研究院发布FlagEval“百模”评测结果

...年下半年大模型发展更聚焦综合能力提升与实际应用。多模态模型发展迅速，涌现了不少新的厂商与新模型，语言模型发展相对放缓。模型开源生态中，除了持续坚定开源的海内外机构，还出现了新的开源贡献者。语言模型，针...……更多

2024-12-20 11:22:00评测结果,研究院,评测,结果,研究,模型

出门问问重磅发布全新2.5D数字人系统 WetaAvatar

...、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现，出门问问的技术团队推出了MeetVoice Pro语音大模型。此外，我们团队也计划利用「序列猴子」的核心能力，打造多模态数字人模型，进一步拓展...……更多

2024-04-09 14:00:00重磅,全新,数字,系统,数字,系统

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...这个金秋，“日日新·商量”又拿了金牌！今日，中文多模态大模型测评基准SuperCLUE-V发布10月榜单：商汤日日新·商量多模态大模型（SenseChat-Vision5.5）凭借多个任务上的出色表现，总得分位列国内大模型第一梯队，智夺金牌。商...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

DeepSeek R1赋能爱尔眼科“爱科（Eyecho）”数

...。术后陪伴数字人：通过手机端提供视频、语音及文本多模态服务，为术后患者定制个性化康复方案，实现长期眼健康管理。自发布以来，爱尔数字人“爱科(Eyecho)”已在集团总部及旗下多家医院投入使用，并亮相多个国际国内...……更多

2025-02-28 19:50:00爱尔,眼科,智慧,突破,驱动,医疗

“AI孙悟空”对话全球！讯飞星火AI大模型展项亮相大阪世博会

...语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力，为全球游客提供幽默问答和智慧导览，成为中国馆唯一大模型展项。大阪世博会中国馆“孙悟空”遇上自主可控AI大模型：让中国文化“活”起来“...……更多

2025-04-13 16:36:00大阪,世博,孙悟空,讯飞,星火,世博会

松鼠Ai智适应教育大模型全新升级

...与科技融合的盛宴。松鼠Ai举行发布会，不仅展示了其多模态智适应教育大模型及系统的全方位升级，还推出了多款前沿的智适应教育硬件产品，为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多

2024-06-19 10:57:00松鼠,模型,全新,升级,教育,松鼠

谷歌大模型Gemini视频被质疑造假、夸大宣传，官方回应：演

...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而，有多个消息称，这段制作的演示视频夸大了Gemini技术能力，被质疑造假、夸大宣传等，实际上手时发现Gemini并不能达到视频中的效果。同时，这类营...……更多

2023-12-08 22:02:00剪辑,演示,模型,宣传,焦点,媒体

智谱AI再卷价格战：最低1毛线可买近200万tokens，相

...强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时，其通用能力提升达40%，超越Llama 3。Function Call函数调用能力提升40%，比肩GPT-4。智谱AI CEO张鹏表示，“2024是AGI元年，大模型技术增长没有放缓的趋势，Scal...……更多

2024-06-05 16:34:00文字量,红楼梦,毛线,价格战,红楼,文字

Sora为何没能诞生在中国？

...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步，包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多

2024-03-19 05:31:00中国,模型,生成,视频,文生,中国

一脉阳光与讯飞医疗达成战略合作：驱动医疗AI深度落地

...5万家基层医疗机构，其医疗大模型已在诊断准确率、多模态数据处理等领域建立技术壁垒。公司于2024年12月在香港上市，成为医疗大模型第一股。此次合作的深层背景，是当前中国医疗体系中基层医疗建设的工作重点。2024年6月...……更多

2025-02-21 00:15:00讯飞,医疗,落地,深度,驱动,战略

腾讯混元文生图大模型升级并对外开源

...显存为11GB，同时运行DialogGen（腾讯推出的文本转图像多模态交互式对话系统）和混元DiT则至少需要32GB的显存，腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道，国内首个官方“大模型标准符合性评...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

谷歌chrome地址栏整合gemini聊天机器人

...Gemini是谷歌Deepmind最新、最强大的AI模型。它原生支持多模态，具备跨模态推理能力，包括文本，图像，视频，音频和代码。Gemini分为三个版本Ultra-三个模型版本中功能最强大，适用于高度复杂的任务Pro-适用于广泛任务的最佳模...……更多

2024-05-02 10:38:00机器人,整合,机器,地址,模型,模态

谷歌最强小屏旗舰！谷歌Pixel 9发布：5700元起

...器，这是谷歌团队定制的一颗旗舰芯片，是谷歌首款以多模态运行Gemini Nano的处理器。官方介绍，对多模态的支持意味着谷歌Pixel 9系列不仅可以理解文本，还能理解图像、音频和语音。其它参数方面，谷歌Pixel 9前置1050像素，...……更多

2024-08-14 09:37:00元起,旗舰,模态,支持,处理器,售价

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全

...成模型还有三个亮点。1、文本编码器部分，已经适配多模态大模型当下行业中多数视觉生成模型的文本编码器，适配的主要是上一代语言模型，如OpenAI的CLIP和谷歌T5及各种变种。腾讯在开源图像生成模型Hunyuan-DiT中适配的是T5和C...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

涂鸦智能×DeepSeek：多模态AI重塑宠物养护新范式

...AIoT平台与DeepSeek等AI大模型融合，通过自然语言处理、多模态场景感知等前沿技术，推动设备向“主动智能”升级，从而为AI应用的落地开辟了新路径。【宠物养护场景】（图片由AI生成）此次，《全球智能商业》便将聚焦“宠...……更多

2025-02-19 19:45:00模态,宠物养护,范式,养护,宠物,智能

澳鹏全新推出一站式文档智能识别解决方案

...方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据，如文本、插图、公式、表格等，并支持对不同版面进行识别和还原。澳鹏一站式文档智能识别解决方案集成了多种算法能力：首先使用版面识别算法，可识别...……更多

2023-12-15 17:30:00解决方案,全新,文档,智能,方案,算法

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...阿里云也首次开源了音频理解大模型Qwen-Audio，这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音频的理解，甚至基于音频进行文...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

ocr图片识别技术在智慧城市建设中的应用

...用将不断深入，提高字符识别的准确率和效率。（二）多模态数据融合OCR技术将与其他传感器技术相结合，实现多模态数据的融合，提高城市管理的智能化水平。（三）云计算技术的应用OCR技术将与云计算技术相结合，实现数据...……更多

2024-07-08 11:29:00城市建设,智慧,应用,建设,城市,图片

大模型“遍地”都是，谁能真正解放生产力？

...，其苦于人工标注久矣，不想再人工打标视频、图片等多模态信息。但市场现实情况是，供不应求：除了大厂以外，少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然，听到了太多客户关于大模型难以落地...……更多

2023-11-30 14:50:00生产力,模型,解放,生产,模型,考拉

星火大模型v3.5发布，带来七大能力提升

...为教师的“AI助手”。据官方介绍，星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”，教师使用粉笔在智慧黑板旁边的传统黑板上书写时，板书内容可以同步...……更多

2024-01-31 04:11:00星火,七大,模型,能力,星火,黑板

智谱AI杀入视频生成：「清影」上线，时长6秒，免费不限量

...。全自研技术All in 大模型的智谱 AI，很早就开始部署多模态生成式 AI 模型。从 2021 年开始，智谱 AI 先后发布了 CogView（NeurIPS’21）、 CogView2（NeurIPS’22）、CogVideo（ICLR’23）、Relay Diffusion（ICLR’……更多

2024-07-27 09:27:00清影,时长,生成,视频,清影,视频

盛视科技：公司基于多模态大模型技术底座的应用已在口岸业务场景

盛视科技：公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证【盛视科技：公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证】财联社12月13日电，盛视科技在互动平台表示，公司基于多...……更多

2023-12-13 21:50:00模态,底座,口岸,模型,场景,验证