模态,山海,实时,生成,模型,图像头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

基于大模型做电商“内容工厂”，「极睿科技」获顺为领投B轮融资

...IP” 对Zero-Shot领域的图片识别、智能分类、智能标签与多模态搜索等环节，均有出色的效果，可被应用于包括文生图、图生图在内的多种图像生成形式。而除了基于公开数据集进行训练外，更重要的是数年间极睿数据积累的商品...……更多

2023-11-14 09:02:00电商,融资,模型,工厂,内容,科技

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要，是实现AGI的必经之路。”对大模型的下一步发展，李璟表示，阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习，提高模型...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

深化战略合作三星携手百度共同打造Galaxy S24 系列

...的场景会更加丰富多样，凭借对文字、图像、音视频等多模态数据的深刻理解，以及挖掘用户个性化需求的精准能力，文心大模型将打造出更多贴近用户个性化需求的AI产品。三星Galaxy S24系列大模型能力被看好，百度智能云成智...……更多

2024-01-29 15:00:00三星,生成,战略,体验,合作,三星

AI角色创作平台「捏Ta」完成超千万元融资

...奇绩创坛等，所得资金将主要用于模型的进一步优化、多模态功能的增强以及社交玩法的开发。成立于2022年12月，捏Ta可被看做为以角色幻想故事智能创作为主的早期“小红书”。看见概念CEO胡修涵将捏Ta用户的创作过程比作“...……更多

2024-04-08 17:50:00融资,角色,创作,平台,角色,创作

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...示，这个生成速度在业内已经算非常快了。张鹏认为，多模态模型的探索还处于非常初级的阶段。从生成视频的效果看，对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等，都有非常大的提升空间。从模型本身角度...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

AI拜年火了，通义千问上线一张照片生成拜年视频

...技公司争相入局大模型的研发，大模型也逐渐从单一文本模态，向语音、图像、视频等多模态方向演进，这些前沿技术不再遥不可及，展现了巨大的应用潜力，改变千行百业的同时也开始走进千家万户。作为国产大模型产品的代...……更多

2024-02-05 13:37:00通义,生成,照片,视频,生成,通义

微软宣布：copilot将持续实现创新

...bing.com/create或要求Copilot创建一个图像来访问此功能。多模态搜索基础此功能结合了GPT-4功能、视觉、Bing图像搜索和网页搜索数据的能力，从而提供更好的图像理解能力。如下图所示。传统的多模态系统只能泛泛地描述图像中的...……更多

2023-12-06 12:02:00微软,微软,图像,模态,功能,解释器

全国首个成都创新团队发布机器人多模态模型

中国首个机器人多模态模型，可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果，根据语音指令，机器人会把苹果送到你手上；如果想收拾干净桌面，机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多

2024-08-13 09:51:00模态,人多,成都,模型,团队,机器

破晓之光：2025 ChinaJoy AIGC大会圆满召开

...025 ChinaJoy AIGC大会朱军教授在ChinaJoy AIGC大会上深入阐述多模态大模型的发展趋势与未来蓝图。他指出，多模态技术正加速演进，其团队开发的Vidu Q1 进一步实现了视频模型的“高可控性”与“高一致性”。依托全球创新的“参考...……更多

2025-08-03 07:45:00之光,大会,智能,技术,用户,模型

“3D视频版Sora”来了！

...-Diag和FV4D）方面都击败了此前的模型。结语：Stability AI多模态再添新布局Stability AI以文生图开源模型起家，在文本、视频、3D等多个模态上都有所布局。此次开源SV4D，是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多

2024-07-26 09:30:00视频,视频,模型,视图,生成,视角

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...混元API服务调用，可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初，腾讯混元就宣布在国内率先采用MoE架构模型，总体性能比上一代密集模型提升50%。此后，腾讯混...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

万字长文：产品经理视角下的AI绘画全解析

...果几乎一致。话归正题，OpenAI的这次开源，提供了一条多模态通道，让“以文生图”的效果得到进一步提升（以前不是没有类似的模型，但没有这个效果好）。现在，当我们说“画一个牛油果椅子”，计算机就会将这句话通过CLI...……更多

2023-02-17 06:00:00长文,视角,绘画,经理,产品,模型

努力开辟数字经济发展新赛道

...精细化标注水平，积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设，不断提升智能算力综合供给水平；稳步推进公共算力服务平台建设，...……更多

2024-03-20 05:57:00赛道,经济发展,数字,发展,经济,数据

曙光网络携两款国产边缘智控一体机亮相WAIC2025

...造的私有化解决方案，专注于支撑大型语言模型(LLM)、多模态大模型(MLM)与工业控制的深度融合。其双路国产CPU(16核32线程)提供了并行处理与高吞吐数据能力，而搭载的国产算力卡则使其能够在边缘端独立运行十亿甚至百亿级大...……更多

2025-07-29 19:41:00曙光,一体机,边缘,国产,一体,网络

世优科技携手人民中科打造AI数字人智能体助力智慧校园

...体，接入人民中科研发的“白泽”大模型，使用先进的跨模态智能理解技术，对文本、图像、视频等多种模态信息进行统一理解、统一表达、统一度量，从而实现跨模态生成、跨模态搜索、跨模态对话等功能。 AI数字人智能体...……更多

2024-11-09 09:55:00智慧,数字,智能,校园,人民,科技

AI视频新战场：字节对决快手、反击Sora

...早。2023年8月，该公司上线首个大语言模型“豆包”及多模态大模型BuboGPT。其抖音云雀大模型通过首批《生成式人工智能服务管理暂行办法》备案，面向公众开放；字节跳动基础模型发力语言和图像两种模态方向。而在AI应用层...……更多

2024-09-30 13:34:00快手,字节,战场,视频,模型,视频

国产AI可以拍微电影了！4K、60帧高清画质，自带音效

...，其架构如下图所示：CogSound的核心技术依托于GLM-4V的多模态理解能力，能够精确解析视频中的语义和情感，并生成匹配的音效。例如，在展示森林景观的视频中，CogSound能够生成鸟鸣和风吹树叶的声音；而在城市街景中，则会...……更多

2024-11-09 09:54:00画质,音效,高清,国产,电影,生成

21.5万张X光，78万个问题！德州大学NIH等联合发布医学

【新智元导读】多模态大语言模型（MLLM）在医学视觉问答（VQA）领域展现出巨大潜力，通过提供针对医学图像的具体临床问题的回答，有助于提高医疗专业人员的工作效率。然而，现有医学VQA数据集规模较小且问题过于简单，...……更多

2024-08-10 09:47:00德州,问答,视觉,医学,联合,数据

谷歌王者归来？最新推出的大模型到底有多强，能否挑战GPT-4

...Demis Hassabis）在发布会上表示，谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4，Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍，在训练后期，Gemini在各类任务上都表现优异。例如，MMLU（大规模多任务语...……更多

2023-12-07 18:27:00王者,模型,模型,视频,微软,测试

平安产险在ICDAR2025国际多模态理解竞赛中强势夺冠，连

...世界顶级赛事中，平安产险（参赛团队名称PA-VCG）在“多模态文档推理理解”这一高复杂度任务中，凭借领先的大模型技术体系与卓越的多模态理解能力，从全球众多顶尖科研机构与知名科技企业中脱颖而出，强势夺冠，连续4...……更多

2025-06-17 17:47:00模态,产险,国际,平安,顶尖,赛事

APUS大模型通过国家备案（新时代新征程新伟业）

...“APUS”）郑州智算中心获悉，由APUS自主研发的千亿级多模态通用人工智能APUS大模型已成功通过国家生成式人工智能服务备案。APUS郑州智算中心负责人告诉记者，大模型通过备案后，意味着可以对外全面开放生成式人工智能服...……更多

2024-05-22 06:20:00伟业,征程,新时代,模型,国家,智能

天玑9300 苏黎世AI跑分超2000，AI性能第一

...还以完整的工具链帮助开发者在端侧快速且高效地部署多模态生成式AI应用，带来丰富的文字、图像、音乐等终端侧生成式AI创新体验，现在已经有20多家生成式AI合作伙伴加入生态。搭载第二代硬件级光追，星速引擎助力游戏顺...……更多

2023-11-07 20:43:00苏黎世,天玑,性能,天玑,联发,性能

科技巨头齐聚MEET2025：共话AI、Agent、具身智能

...自今年年初OpenAI旗下视频生成模型Sora惊艳亮相以来，多模态大模型和生成技术便迅速成为了科技界和产业界竞相追逐的风口赛道。在多模态大模型的推动下，AI技术不再局限于单一的数据形式或应用场景，而是能够跨越文本、图...……更多

2024-12-11 13:56:00浪潮,机器人,巨头,机器,趋势,智能

GPT-4o的识图能力有多牛？四大维度深度体验

...的？后训练功不可没从前述体验看，GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言，新的GPT-4o是OpenAI“有史以来最好的模型”。那么，GPT-4o的多模态能力是如何“炼”成的呢？这背后的秘密或许可以...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

“重创”美科技股后，DeepSeek除夕再发新模型，文生图测

...索（DeepSeek）又抛出新模型。1月28日，DeepSeek发布开源多模态模型Janus-Pro，其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社……更多

2025-01-28 09:10:00文生,科技股,模型,测试,科技,模型