模态,宝宝,模型,图像,训练,文本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出Sana架构，性能秒杀FLUX

...合成高分辨率、高质量，且具有强文本-图像对其能力的模型。而且，它还能高效生成高达4096×4096像素的图像。项目主页：https://nvlabs.github.io/Sana/论文地址：https://arxiv.org/abs/2410.10629Sana的核心设计包含了以下几个要素：深……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

OpenAI又放大招，一文看懂Sora对AI领域的影响

...现”。相比GPT模型，Sora的成功之处在于为图像视频等多模态数据找到了适合Transformer架构的表征方式，从而将ScalingLaw从语言模型复制到了图像视频模型。此外，Sora在训练时还借助了DALL·E3生成的高质量文本描述，在推理时借助...……更多

2024-02-21 19:01:00一文,领域,影响,模型,视频,文生

AI界新晋王者被曝抄袭、作弊、做假，脸都丢光了

...像与人类互动。由此，谷歌追随者高呼：“Gemini让原生多模态（即文本、声音、视频等模态）真正做到丝滑融合，发展原生多模态将成为未来主流路径！”视频发布不到一天，这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多

2023-12-20 00:10:00王者,抄袭,模型,万物,公司,数据

OpenAI史诗级更新！最强大模型炸场，128K上下文、价格

...、知识更新鲜，而且能一次性输入一整本书。2、开放新模态API：包括接受图像输入的GPT-4 Turbo、文生图模型DALL·E 3、文本转语音模型TTS，不久后还将支持自动语音识别模型Whisper v3。 3、GPT定制化服务：支持用户5分钟内、无代码...……更多

2023-11-07 17:45:00上下文,史诗,模型,上下,更新,价格

英伟达超快stylegan回归

扩散模型的图像生成统治地位，终于要被GAN夺回了？就在大伙儿喜迎新年之际，英伟达一群科学家悄悄给StyleGAN系列做了个升级，变出个PLUS版的 StyleGAN-T，一下子在网上火了。无论是在星云爆炸中生成一只柯基：还是基于虚幻引...……更多

2023-02-01 14:22:00英伟,生成,图像,模型,作者,英伟

技术报告揭秘Sora六大核心优势，影视等行业面临颠覆

...势值得注意的是，Sora推出的同一天，谷歌发布了Gemini多模态模型的更新版本，而三天前，StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。而在Sora推出后不久，OpenAI发布...……更多

2024-02-17 21:07:00颠覆,核心,优势,报告,影视,行业

香港发布AI多模态手术大模型

...学院香港创新院AI中心”)，日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍，CARES Copilot系统由中国科学院香港创新院AI中心研发，是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多

2024-03-14 10:23:00模态,香港,模型,香港,中国科学院,人工智能

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...次发布基于CogVideoX的清影，使其大模型矩阵又扩充类一个模态。值得一提的是，这也是国内做语言大模型起家的大模型独角兽，首次推出视频生成产品——之前这个赛道更多的是字节、快手等短视频大厂，以及爱诗科技、生数科...……更多

2024-07-27 09:18:00实测,人手,中国,视频,清影,视频

腾讯混元文生图大模型升级并对外开源

...显存为11GB，同时运行DialogGen（腾讯推出的文本转图像多模态交互式对话系统）和混元DiT则至少需要32GB的显存，腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道，国内首个官方“大模型标准符合性评...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

世卫组织：人工智能在医疗领域应用前景广阔

...内瓦1月18日电（记者曾焱）世界卫生组织18日发布的多模态大模型治理相关新指南说，人工智能在医疗卫生领域应用前景广阔，但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多

2024-01-20 00:19:00人工智能,人工,前景,领域,医疗,智能

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造，是（谷歌）通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示：Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

OpenAI发布免费新品GPT-4o：可对音频、视觉和文本实

...布新产品，不是AI搜索引擎，也不是GPT-5，而是GPT-4o旗舰模型。OpenAI在ChatGPT中引入GPT-4o并免费提供更多功能。GPT-4o的“o”代表“omni”，意为全能，与现有模型相比，它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和...……更多

2024-05-14 16:45:00本实,和文,推理,新品,音频,对话

北大、快手开源视频生成模型Pyramid Flow，1分钟生

...2M、SA-1B以及WebVid-10M和OpenVid-1M等。1、LAION-5B：一个用于多模态AI研究的大型数据集。2、CC-12M：一个由网络爬虫收集的图像文本对的数据集。3、SA-1B：具有高质量、无模糊图像的数据集。4、WebVid-10M和OpenVid-1M：两个被广泛用于文……更多

2024-10-12 09:49:00生成,快手,视频,北大,模型,视频

MSRA：视觉生成六大技术问题

...进行了梳理，他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布，然而，目标数据分布过于复杂，难以直接拟合。因此，往往需要将复杂的信号做拆分，拆分成多个简单的分布拟合问题，再分别求解。信...……更多

2024-07-15 09:34:00生成,视觉,问题,技术,模型,图像

GPT-4V医学执照考试成绩超过大部分医学生，AI加入临床还

...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力，特别是题目包含图像的考题 —— 这对医疗人工...……更多

2023-11-21 13:59:00医学,多远,执照,临床,大部分,成绩

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...进行统一的处理。在本文中，研究者通过提出创新型的多模态模型架构，以及统一的物理可解释动作空间，来解决这些挑战。设计 RDT：双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

“最强开源AI模型”，4050亿参数版Meta Llama

...上图为机翻字幕，存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型，能够理解图像、文本等多种媒体内容。IT之家查询社交媒体等公开信息，发现已经有开发者使用该 AI 模型。 ……更多

2024-07-13 09:52:00日发布,模型,参数,模型,伯格,媒体

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...变小，成为具身智能的「大脑」。解法：垂域大模型、多模态技术与 AI 智能体论坛中，关于可信大模型如何在应用具体落地，呈现出了多种解法，大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

OpenAI发布文生视频模型Sora，奥尔特曼选取网友提示词

...凌晨，OpenAI再次扔出一枚深水炸弹，发布了首个文生视频模型Sora。据介绍，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。目前官网上已经更新了48个视频demo，在这...……更多

2024-02-16 18:44:00文生,奥尔,奥尔特曼,特曼,模型,提示

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后，讯飞星火的文本生成能力和数理运算能力都有提升，可以轻松回答初三的数学物理题。现场演示中，对“前进20米、右转60 、反复...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...GenAI团队研发小模型，减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy，官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时，国内大模型也有不少进展，通义千问团队升级了视觉语言模型Qwen-VL，图片内文字处理能力得到提升。此外...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

NeurIPS | 消除多对多问题，清华大规模细粒度视频片段

...大学计算机系媒体所的二年级博士生，主要研究方向是多模态大模型与视频理解，在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文，曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术，特别是细...……更多

2024-10-29 09:55:00大规,粒度,范式,清华,片段,大规模

大模型手机密集下场：华为、荣耀、OPPO、vivo、小米杀疯

...华为的盘古大模型，包括盘古 NLP 大模型、CV 大模型、多模态大模型和科学计算大模型。不得不说，华为大模型手机声量越来越高，与其密切关注新兴技术并持续投入掌握这些新技术，根据市场需求进行调整相关。从HarmonyOS 4系...……更多

2023-11-06 15:03:00华为,荣耀,小米,模型,手机,模型

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

...注意力表现出与视频中的运动和动态相关的中频变化；跨模态注意力是最稳定的，将文本与视频内容联系起来，类似于反映文本语义的低频信号。基于此，研究团队提出金字塔式注意力广播来减少不必要的注意力计算。在中间部...……更多

2024-06-28 09:32:00实时,生成,速度,技术,视频,注意力

润建股份：公司曲尺平台开发的AI行业模型支持多模态

润建股份：公司曲尺平台开发的AI行业模型支持多模态【润建股份：公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电，润建股份在互动平台表示，公司曲尺平台开发的AI行业模型支持多模态，多模态底座具备文生图...……更多

2023-12-20 22:23:00曲尺,模态,模型,股份,支持,开发

GPT-4劲敌，谷歌进入高能+高产模式

...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

Galaxy S24系列上线大模型！三星：不排除未来Gala

...手让给了苹果。有消息称，苹果此前推出了名为Ferret的多模态大语言模型，而后又发布了一篇题为《闪存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。有...……更多

2024-01-18 11:00:00三星,可能性,模型,收费,三星,模型

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

...模型进行持续迭代式微调。GPT-4系列：能力跃升，增加多模态能力，最新版4o突破性价比GPT系列模型的技术演变（GPT-4~GPT-4o）：继ChatGPT后，OpenAI于2023年3月发布GPT-4，它首次将GPT系列模型的输入由单一文本模态扩展到了图文双模态...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

谷歌VideoPoet大模型上线，生成长达10秒视频，还可自

...频。图源：VideoPoetOne More Thing虽然已经是2023年的年底，多模态赛道的玩家们却都还在抢着发布新模型，为本就热闹的市场又增加了一把热度。勤奋如Google，一个月内连发好几款新模型。也有蓄势待发的Midjourney，时隔9个月后终于...……更多

2023-12-22 14:45:00配音,模型,视频,视频,模型,生成

必然的命运：AI大模型冲向“免费轮盘赌”

...低了82%。最新发布的GPT-4o更是被称为现实版的斯嘉丽，多模态的输入输出能力和类人化的情感表达让网友直呼，“她来了！”。不仅支持文、图、音频三种信息形态的输入，并且可以做超过50种语言的同声传译。甚而有网友给GPT-...……更多

2024-05-24 13:40:00轮盘,模型,必然,命运,模型,价格

page 6/667 首页上一页 1 2 3 4 567 8 9 10 11 下一页末页

更多关于科技的资讯：

英特尔酷睿Ultra 200HX/H系列技术解析：超强能效实

太平洋时间1月6日上午，英特尔举办了CES 2025展前发布会，全新的英特尔酷睿Ultra 200HX/H系列移动级处理器正式发布

2025-01-08 21:19:00

别克GL8最强对手登场！比亚迪全新MPV夏正式上市：24.9

快科技1月8日消息，今日晚间，比亚迪全新中大型MPV夏正式上市，共推出4款车型，售价24.98-30.98万元。新车全系标配“天神之眼”DiPilot 100高阶智驾辅助系统

2025-01-08 21:19:00

中大型智能旗舰MPV又一猛将！一图看懂比亚迪夏

快科技1月8日消息，作为王朝网的首款旗舰MPV车型配置丰富，外观设计基于王朝网设计语言，预热已久，造型获好评。内饰方面

2025-01-08 21:19:00

抖音电商严打违法违规营销！严重违规主播永封带货权限

快科技1月8日消息，今日，抖音电商发布关于保障消费者权益，严打违法违规营销行为的公告。公告提到，为创造公平健康的交易环境

2025-01-08 21:19:00

芝奇达成48GB DDR5-10600！AMD锐龙平台突破1

快科技1月8日消息，芝奇宣布，在AMD锐龙平台上，成功将内存超频到了DDR5-10600的超高速度，突破10GHz大关

2025-01-08 22:49:00

丰田董事长谈日产本田合并：期待他们造出更具竞争力的产品

快科技1月8日消息，丰田汽车董事长丰田章男在CES 2025展览会上谈到了日本两大车企本田、日产面临的合并问题。丰田章男表示

2025-01-08 22:49:00

最美CTO携保定神车亮相中国智能车扎堆拉斯维加斯

保定智能车勇闯拉斯维加斯，首次亮相“科技春晚”。2025元旦刚过，长城CTO吴会肖从保定出发，途经北京、仁川，几经辗转

2025-01-08 22:49:00

用户期待已久！HDMI 2.2规范来了：带宽暴增

2025年1月6日，美国拉斯维加斯—HDMI Forum,Inc.宣布HDMI规范2.2版本,新HDMI规范为规模庞大的HDMI生态系统带来更多选择

2025-01-08 23:19:00

Switch 2大量情报泄露！配件商自曝：黑市能买到真机吗

虽然任天堂并未参展CES 2025拉斯维加斯消费电子展，但展会上却处处透露着Switch 2即将发布的信息。多家配件厂商纷纷展示了他们为这款新主机准备的首批配件

2025-01-08 23:49:00

印尼维持iPhone 16销售禁令前一天刚批准建设AirT

据媒体报道，印度尼西亚维持了对苹果iPhone 16的销售禁令，称苹果承诺的、包括AirTag工厂在内的10亿美元投资计划仍不足以满足当地的投资要求

2025-01-08 23:49:00

腊八节腾讯给员工发巨型甘蔗：员工扛到一楼去削皮

快科技1月8日消息，据媒体报道，1月7日是腊八节，在节日当天，腾讯公司给员工准备了惊喜—巨型甘蔗，祝员工“掂过碌蔗”，寓意今年顺顺利利

2025-01-08 23:49:00

男子4s店花320万订劳斯莱斯库里南结果车款被4S店挪用无

快科技1月8日消息，据报道，湖南长沙，游先生向媒体反馈称，自己花费320万元订购库里南，结果购车款被4S店挪用，现在仍无法提车

2025-01-09 00:19:00

2025年首次更新！微信安卓版8.0.56正式发布：朋友圈视

快科技1月9日消息，日前，微信安卓版迎来8.0.56正式版更新，这是2025年首次版本更新。关于更新内容，依然是那9个字

2025-01-09 00:19:00

千呼万唤！《王者荣耀》今日开启华为HarmonyOS NEX

快科技1月9日消息，今日，腾讯旗下热门手游《王者荣耀》将开启华为HarmonyOS NEXT版本的限量付费删档测试。本次测试限量开放

2025-01-09 00:49:00

Apple Watch芯片首次在美国生产：台积电代工

快科技1月9日消息，据媒体报道，苹果扩大了在美国生产芯片的规模，Apple Watch Series 9使用的S9芯片将在台积电亚利桑那州凤凰城Fab 21工厂生产

2025-01-09 00:49:00

头条订阅服务