模态,山海,实时,生成,模型,图像头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

厦门理工学院牵头研发的闽台非遗大模型“文鸑”发布

...理技术，整合图像识别、语音处理、GIS地理信息系统等跨模态技术矩阵，形成集非遗知识智能问答、图文内容自动生成、音视频智能解析、文化时空图谱构建于一体的全栈式解决方案。该模型具备文史溯源、文本生成与创作、非...……更多

2025-05-25 08:27:00厦门,理工学院,理工,模型,学院,厦门

多模态竞技场对标90B Llama 3.2！Pixtral

...客之姿杀入江湖的Mistral AI，在9月份甩出了自家的首款多模态大模型Pixtral 12B，如今，报告之期已至，技术细节全公开。作为欧洲的OpenAI，Mistral最近压力不小。端侧小模型端不出来，对比评测的结果又遭到质疑。上个月震撼登场...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

被神话的 Sora ，被低估的多模态。Sora 终于来了！只要是 ChatGPT Plus/Pro 用户，直接就能用上。至于效果 ......看完官方放出的 demo，网友大呼：不太行！当人们对「超级应用」的热情被 Sora 浇上一盆凉水时，多模态应用已经悄咪...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

谷歌史上最强大模型！Gemini 2.0正式发布

...今为止功能最强的AI模型，带来了更强的性能、更多的多模态表现（如原生图像和音频输出）和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升，速度甚至达到了后者的两倍。支持图...……更多

2024-12-12 07:15:00模型,音频,模态,自然语言,文生,多语

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

... AI 发起挑战的高规格赛事落下了帷幕！这就是第二届多模态情感识别挑战赛（MER24），它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

“大模型”时代路凯智行如何Rock AI

...型，随着近几个月SORA的横空出世，融合语言与视觉的多模态模型也已初露峥嵘，但目前市面上的通用大模型并非“万金油”，面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多

2024-04-16 19:33:00模型,时代,模型,矿山,崇宁,驾驶

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

【新智元导读】Meta首个理解图文的多模态Llama 3.2来了！这次，除了11B和90B两个基础版本，Meta还推出了仅有1B和3B轻量级版本，适配了Arm处理器，手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月，全新升级后的Llama 3....……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...刚刚显现，未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中，多模态其实是一个被寄予厚望的方向。但是，这个领域目前面临一个严峻的挑战，即多模态的理解和生成...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

北京人工智能数据运营平台发布

...大量通用数据、行业数据，支持文本、图像、视频等多种模态，并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练，同时，4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

国网山东电科院打造“空天地”立体智能巡检

...融合监控等多点发力，实现输电线路巡检从感知智能到多模态生成式智能的新跨域，为新型电力系统安全稳定运行提供坚强网架支撑。 ……更多

2024-03-07 17:43:00山东,立体,智能,天地,输电,无人机

超越扩散模型！自回归新范式仅需2.9秒就生成高质量图像

...VAR指出是因为自回归模型逐个预测token的行为不符合图像模态的特点，提出“next-scale prediction”范式，将视觉自回归建模为逐个预测更大尺度scale的token map。这一方式避免了原始基于next-token的自回归方案难以建模图像模态的问题...……更多

2024-06-27 09:17:00范式,仅需,高质量,生成,模型,图像

价格便宜75%！亚马逊推出全新大模型系列，3纳米自研芯片明年

...容。该系列包括六种型号，从纯文本模型Micro、低成本多模态模型Lite、高性能多模态模型Pro到预计于2025年第一季度推出的Premier，以及两款尚未确定发布时间的更先进模型Canvas和Reel。据介绍，Nova 系列能够支持200种语言，Micro、L...……更多

2024-12-04 22:47:00亚马,亚马逊,价格便宜,纳米,芯片,模型

高通aihub正式发布：支持75个ai模型

...示了全球首个在搭载第三代骁龙8的安卓手机上运行的多模态大模型（LMM）。在这一演示中，高通展示了一个超过70亿参数的LMM，其支持文本、语音和图像输入，并能够基于输入的内容进行多轮对话。同时高通还在搭载全新骁龙XEl...……更多

2024-02-27 02:14:00高通,模型,支持,高通,模型,开发者

只有谷歌受伤的世界达成了，但“全能模型”到底该不该跟？

...对二，谷歌就跟四个王。那么，这一次较量的核心——多模态大模型，国内AI行业是否要跟进呢？如果要跟进，又该提前考量到哪些问题呢？每一次新产品问世，如果只跟着新闻“震惊”是很难进步的。不妨和我们一起，认真给G...……更多

2024-05-19 16:32:00全能,模型,只有,世界,模态,模型

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...择了两条路线分别开拓：一条是 GPT-4o 所代表的端到端多模态大模型的探索，一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上，OpenAI 跨文本、视觉和音频端到端地训练了一个新模型，所有输入和输出都由同一神经...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

Bengio团队提出多模态新基准，直指Claude 3.5和

...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务