视频,杜甫,生成,模型,模型,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...速度提升；OmChat V2则支持高达512K的上下文长度，能够处视频、图、文复杂的混合输入，具有时序关系判断和多图关系理解能力。Om多模态智能体全新产品系列——空间运营智能体、知识服务智能体。空间运营智能体将对环境的全...……更多

2024-07-18 14:51:00联汇,二代,模态,智能,应用,科技

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...加拿大）等 7 家企业出资，谷歌母公司 Alphabet 则向涉足视频生成领域的 Runway（美国）等 4 家企业出资。中国则在过去一年内新增了 5 家独角兽企业，包含月之暗面、MiniMax、零一万物、百川智能和智谱 AI，这些企业均获得了阿里...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

视频生成大模型sora和可灵的区别在哪里？

...可能仅一线之隔。Sora之后，它的挑战者前赴后继。6月，视频生成大模型迎来又一轮新品爆发，生成式AI赛道像是“过年了”。快手可灵、LumaAI以及Runway迭代更新后的Gen-3Alpha等现象级爆品不断涌现。其中，讨论度最高的是快手自...……更多

2024-06-26 14:27:00生成,模型,视频,文生,视频,生成

出门问问重磅发布全新2.5D数字人系统 WetaAvatar

在 AIGC 技术的推动下，视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务，以其领先的创新能力，提供了高度真实与生动的数字体验，吸引了众多用户的目光。目前，这一先进技术已经成功部署...……更多

2024-04-09 14:00:00重磅,全新,数字,系统,数字,系统

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...谓buff叠满：SOTA级别的性能，低训练花销，多模态的内容生成能力和再一次将开源大模型卷上了新高度。根据LLaVa-1.6官网的标准评测数据集，该模型的表现超越了Qwen-VL-Plus、CogVLM和Yi-VL等一众模型，在大部分数据集上的表现都优...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

Motiff妙多发布国内首个UI大模型，效果跑分超越苹果、G

...析每个模块的功能和布局，这有助于提供设计建议、自动生成UI设计原型等。Motiff妙多在界面分析能力上处于行业领先水平，是最懂UI设计的多模态大模型。 Motiff妙多大模型能回答各种各样有关UI界面的问题Motiff妙多大模型在理...……更多

2024-08-19 09:37:00模型,苹果,效果,模型,界面,设计

“大装置+大模型”战略：助力商汤迅速获取生成式AI商业化果实

从技术到具体的应用场景，生成式AI正在全球卷起一股浪潮。一组预测数据显示，2035年生成式人工智能有望在全球贡献近90万亿元（人民币，下同）的经济价值，其中，我国将突破30万亿元，占比超过四成。不难想象，一轮新的...……更多

2024-04-01 15:16:00商汤,果实,装置,生成,模型,战略

5项重大更新，NVIDIA助力人形机器人研发迈入新阶段

... NVIDIA Isaac Lab 强化学习，从少量人类演示中学习，并根据视频数据生成机器人动作，对多模态指令的接受度非常可观。同时，GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强...……更多

2024-05-16 15:10:00人形,机器人,机器,阶段,更新,机器人

字节跳动豆包大模型发布，火山引擎全栈AI服务助力企业智能化转

...营销增长方案；不仅提供多模态的理解与生成能力，助力视频创作效率提升25倍，更上线抖音话题、POI、小程序等营销工具，使门店页面曝光提升600%。目前已经有3,000+企业在火山引擎开启AIGC视频营销增长。面向销售场景，火山...……更多

2024-05-15 16:16:00豆包,字节,火山,模型,引擎,智能

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...的新版本，用户现在可以在visionOS商店中下载ChatGPT。官方视频显示，Vision Pro版ChatGPT支持聊天问答和图像生成。Google宣布为聊天机器人Bard升级Gemini Pro模式2月1日，Google宣布其聊天机器人Bard将在全球范围内采用Gemini Pro模式，……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

OpenAI「草莓」两周内发布？网传不是多模态，反应慢了10

...试过该模型的人还透漏，初始版本的「草莓」只能接收和生成文本，而不能接收和生成图片，这意味着「草莓」还不像 OpenAI 其他模型那样是多模态的。目前大家见到的大模型都是多模态的，这似乎是「草莓」一个明显缺点。大...……更多

2024-09-12 09:46:00模态,草莓,反应,草莓,模型,问题

CARES Copilot 1.0大模型发布并开放

...领域设计的大型模型系统，实现了对图像、文本、语音、视频等多模态手术数据的深入理解，能够准确识别和解析动作、影像和生命体征等多种医疗信息。在实际应用中，CARES Copilot 1.0不仅可为临床医生提供手术阶段的详细分析...……更多

2024-04-01 02:22:00模型,开放,中国科学院,香港,模型,医疗

Sora震撼来袭，AI动画以假乱真了吗？专家：仍存硬伤

...段短片利用了AI规划分镜并绘制图片，再辅以“图片生产视频”软件让图片“动起来”。视频作者冯先生在接受媒体采访时表示，这段视频如果人工制作至少需要半年，而自己在AI的帮助下用时一周就完成了。值得一提的是，上...……更多

2024-02-20 11:48:00动画,专家,视频,生成,模型,南都

腾讯元宝首发3D生成应用一张图即可生成3D角色

...模态交互能力。据了解，腾讯混元大模型早已布局文/图/视频生3D能力，是业界最早的端到端3D生成大模型之一，通过大模型一步推理，30秒即可生成动漫、建筑、游戏道具等类型的3D资产。如果需要更高精度，还能进一步烘焙生...……更多

2024-07-16 16:16:00生成,腾讯,元宝,角色,应用,腾讯

讯飞星火V3.0发布，打造每个人的AI助手

...，助力全民提升科技素养。科普中国拥有40万+科普中国音视频、6000万+科技文献构建科普大模型，将优秀科普资源惠及广大中小学生，及时回应孩子的每一次提问，课堂学生互动参与率从25%提升到77%，问题解答率从23%提升到95%，...……更多

2023-10-24 15:02:00讯飞,星火,助手,讯飞,星火,模型

vivo自研蓝河操作系统发布：支持大模型、多模态交互

...蓝河操作系统扩展了输入能力，支持声音、图片、文字、视频、手势、手语、脑波等的识别。同时，支持应用开发新范式，能够帮你自动编写代码、生成专属桌面、壁纸、主题等。该系统支持各类配置运行，包括200MHzCPU和32MB内...……更多

2023-11-03 02:14:00模态,模型,支持,系统,系统,支持

《2023人工智能赋能网络视听产业观察报告》在青发布

...工智能赋能网络视听产业观察报告》。《报告》围绕综合视频、短视频、网络直播和网络音频四种视听形态梳理了2023年人工智能赋能网络视听创新应用的典型案例，以及人工智能相关法规政策与行业规范发布情况，并探讨了行...……更多

2023-10-21 19:06:00人工智能,人工,观察,智能,产业,报告

GPT-4劲敌，谷歌进入高能+高产模式

...一较高下”的劲头。只是由于当下大家的视线焦点集中在视频领域，Sora 又是 OpenAI 首次发布文生视频模型，所以无奈被抢了头条。图源：微博评论 Gemini 1.5 Pro建立在谷歌对Transformer和MoE架构的领先研究之上。传统Transformer充当一...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...端侧多模态天花板！凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中，通义方面发布了最强开源模型Qwen2.5系列，同时上架语言、音频、视觉等100多款全模态模型。应用层方面，百炼提供...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...答案。轻量级的1B和3B模型则可以帮助不仅在多语言文本生成和工具调用能力方面表现出色，而且具有强大的隐私保护，数据永远不会离开设备。之所以在本地运行模型备受大家的青睐，主要在于以下两个主要优势：提示词和响...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

创新奇智大模型工业落地初显成效，探索工业智能机器人新方向

...AInno-75B 增加了多模态处理能力，支持输入文本、图像、视频以及工业场景中的行为（Action）模态，如 CAD 等。通过引入高参数量大模型 AInno-75B，创新奇智的主推产品 ChatDoc、ChatBI 获得了显著的能力提升。生成式企业私域知识问...……更多

2024-09-03 10:00:00工业,机器人,成效,落地,模型,方向

2B多模态新SOTA！华科、华南理工发布Mini-Monke

...适应策略（MSAC）的轻量化多模态大模型。Mini-Monkey自适应生成多尺度表示，允许模型从各种尺度中选择未分割的对象，其性能达到了2B多模态大模型的新SOTA。论文地址：https://arxiv.org/pdf/2408.02034项目地址：https://github.com/Yul……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率