指令,模型,国产,全球,模型,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

空间智能产业化加速一线企业集体锚定百度智能云

...实现了图像、语音等多模态数据的毫秒级响应，通过语音指令、视觉反馈等，满足百科问答、地图导航、实时翻译、图像识别、会议纪要等场景需求，实现前所未有的穿戴体验。今年5月，国内AI+AR领域创新企业李未可科技在新品...……更多

2025-07-24 19:59:00智能,一线,集体,产业,空间,企业

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

在当今大模型技术日新月异的背景下，数据已跃升为构建企业大模型知识库、优化训练与微调，乃至驱动模型创新不可或缺的核心要素。对于企业来说，积累的宝贵知识广泛散布于形式多样的电子文档之中，这些文档不仅格式...……更多

2024-09-26 13:36:00文档,效能,模型,核心,处理,技术

阿里万相视频生成大模型重磅开源！消费级显卡也能运行

...ggingFace、魔搭社区下载体验。据介绍，14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出，在权威评测集Vbench中，万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型，稳居榜首位置。1.3B...……更多

2025-02-26 00:34:00阿里,重磅,显卡,生成,模型,运行

vivo蓝心大模型升级为“自研ai多模态大模型”

...销月的销量是上一代的432%。同时黄韬宣布，vivo的蓝心大模型升级为“自研AI多模态大模型”，这项技术通过视觉、声音、空间等多维度感知和理解世界，使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命...……更多

2024-05-15 04:08:00模型,模态,升级,黄韬,模型,多维度

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-

...今日宣布，开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。官方表示，Megrez-3B-Omni 是一个为端而生的全模态理解模型，同时具备图片、音频、文本三种模态数据的处理能力：...……更多

2024-12-17 09:24:00模态,模型,全球,模态,模型,精度

浙大校友自研跨模态模型，打造具身智能的“通用语法”

...全同时提高通行效率。此外，LPLM 还增强了对自然语言指令的理解和执行能力。谈及这项能力重要的原因，陈俊波举例说道：“为什么目前的各类 Robo-taxi 虽然可用，但依然无法取代司机？原因之一在于，当我们提供一些比较模...……更多

2024-03-22 10:31:00模态,语法,校友,模型,智能,智能

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

...Pro等顶级模型相当，代码运行没有问题，但没有严格遵循指令，生成的可视化内容因太小而难以阅读。此外，多位用户还提到，Qwen3存在过度思考的问题，导致思考过程太长，而且默认的思维模式对更复杂的任务来说非常不可用...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

打开大模型的无限可能，云栖通道看AI产业应用

...待。 ” 开源大模型灵活运用，给AI机器人注入灵魂一个指令，人形机器人就能完成唱跳RAP、搬运货物、巡线避障、花式足球等高难度动作。在云栖大会计算馆的通义灵码展位，“素人”都能掌控的小型机器人，吸引了众多观众...……更多

2024-09-21 13:54:00模型,通道,产业,应用,机器人,模型

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...”的Gemini，究竟有什么杀手锏？拿出一张世界地图，发出指令，“根据你现在所见，想一个游戏，还要用emoji表情呈现。”Gemini即刻给出回答，“我们可以玩一个叫做‘猜国家’的游戏”，然后为你提供几个线索“考拉”、“袋...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

国产“Sora”亮相中关村，文生视频相关个股有哪些

就在昨日，我国人工智能大模型领域又迎来重大突破，AGI的真正连锁反应或将从视频开始。4月27日上午，“2024中关村论坛-未来人工智能先锋论坛”在北京正式举办，本次平行论坛由科学技术部、北京市人民政府主办，旨在进一...……更多

2024-04-28 15:37:00文生,中关,中关村,个股,国产,视频

中国科技创新“乘”数直上

...2023第二届全球数字贸易博览会上了解华为研发的盘古大模型的应用。龙巍摄（人民图片）当今时代，数据已成为重要的创新要素。人工智能大模型、新材料创制、生物育种、基础科学研究等都离不开数据的支撑。国家数据局...……更多

2024-02-09 06:29:00科技创新,中国,科技,数据,模型,讯飞

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

...化。此外，与现有模型相比，它更加用户友好，可以通过指令完成复杂的任务，而不需要冗长的处理步骤和额外的模块 (如 ControlNet 或 IP-Adapter)，从而大大简化了工作流程。知识迁移：受益于统一格式的学习，OmniGen 有效地跨不...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

昆仑万维SkyReels团队正式发布并开源SkyReels-

...ch包含1020个文本提示词，系统性地评估了四个关键维度：指令遵循、运动质量、一致性和视觉质量。该基准旨在评估文本到视频(T2V)和图像到视频(I2V)生成模型，提供跨不同生成范式的全面评估。在SkyReels-Bench评估中，SkyReels-V2在...……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...如音乐中包含哪些乐器等。后者指的是不仅可以根据用户指令生成音乐，比如生成一段吉他弹奏的音乐，还能根据用户输入的图像或视频生成音乐。图丨通过 M2Ugen 大模型进行多模态音乐理解和生成（来源：arXiv）近日，相关论...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

顶流大模型应用！天工AI不炫技，实测真正的生产力工具

...API流量，其中就包括中国。这意味着国内大量“套壳”大模型将无法使用，而自研大模型凸显价值。这无疑给国内的自研大模型创造了机会，同时也将迎来更为拥挤的竞争，5月大厂大模型们价格大战后让中国大模型的商业模式...……更多

2024-06-29 09:39:00天工,实测,生产力,模型,工具,应用

千行百业加速拥抱大模型（AI前沿观察）

...术创新快应用渗透强国际竞争激烈千行百业加速拥抱大模型（AI前沿观察）潘旭涛陈斯达《人民日报海外版》（ 2023年12月22日第 08 版）在湖南省长沙市举办的2023世界计算大会专题展上，参观者在了解AI大模型。新华社记者 ...……更多

2023-12-22 03:26:00百业,模型,观察,模型,语料,数据

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...作研究，构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队

36氪晚报｜IMF第一副总裁称市场的快速降息押注为时过早；微

...GLM-4 All Tools实现自主根据用户意图，自动理解、规划复杂指令，自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。 Tims天好咖啡与申通地铁达成合作36氪获悉，连锁咖啡品牌Tim Hortons中国业务...……更多

2024-01-16 17:57:00为时过早,微软,副总,晚报,模型,国产

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

作者：赖文昕编辑：陈彩娴2024 年已经过半，大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来，全球 AI 界接连开展了数十场发布会，从海外的英伟达、OpenAI...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

vivo自研大模型全家桶炸场，亮出PhoneGPT智能体，蓝

...新的AI战略“蓝心智能”，同时发布了升级的自研蓝心大模型矩阵、原系统5（OriginOS 5）、蓝河操作系统2（BlueOS 2）等多项新产品和技术升级。vivo高级副总裁、首席技术官施玉坚首先登台，他提到，在过去三年和今年前三季度，v...……更多

2024-10-11 09:55:00一键,衣食,全家,模型,智能,模型

支付宝发布多模态医疗大模型：支持千亿级视觉识别

...消息，在2024世界人工智能大会上，支付宝多模态医疗大模型正式亮相，成为国内首批多模态医疗大模型之一。据悉，该医疗大模型的基石，源自蚂蚁集团自主研发的蚂蚁百灵大模型，这一先进平台不仅拥有“视听言画”全方位...……更多

2024-07-05 16:17:00模态,模型,支付,视觉,医疗,支持

豆包“王炸”：字节跳动一天发布两款视频生成大模型

...体互动和一致性难题此前视频生成模型大多只能完成简单指令，豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现，其生成的视频不仅能够遵循复杂指令，让不同人...……更多

2024-09-24 18:15:00豆包,字节,生成,模型,视频,豆包

对标Sora 首个国产自研视频大模型Vidu发布

本文转自：中国新闻网只需要一段文字指令就能生成一段60秒精致细腻的视频——今年2月起，文生视频大模型Sora曾在全球人工智能业内外引发震动。近日，在2024中关村论坛年会未来人工智能先锋论坛上，生数科技联合清华大学...……更多

2024-04-28 18:59:00模型,国产,视频,视频,中国,清华大学

荣耀Magic V5发布，一文看懂YOYO到底有多强大

...只需在浏览财经APP时，对YOYO下发“分析黄金投资前景”指令，便可以在左边屏幕继续刷实时行情，YOYO会在右边屏幕同步调取国际金价走势、国际利率变化等海量数据，通过AI算法拆解“影响金价的三大核心因素”，甚至算出不...……更多

2025-07-04 13:11:00一文,荣耀,荣耀,智能,用户,模型

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...番，有以下几点发现：1、简短的提示词效果更好，复杂指令下会丢失细节。2、人手仍是重灾区，容易出现画面闪烁的现象。3、生成很快，但加上排队等待时间仍达到1-2分钟。4、相比图生视频，文生视频的稳定性更高。当然，...……更多

2024-07-27 09:18:00实测,人手,中国,视频,清影,视频

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...训练过程模型的训练主要分为两个阶段：多任务预训练和指令微调训练。多任务预训练阶段主要使用动作-文本、语音-文本相关的数据集进行训练，训练任务包括 text-to-speech, automatic speech recognition，speech-to-speech，motion under……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动