模态,宝宝,模型,图像,训练,文本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...、知识更新鲜，而且能一次性输入一整本书。2、开放新模态API：包括接受图像输入的GPT-4 Turbo、文生图模型DALL·E 3、文本转语音模型TTS，不久后还将支持自动语音识别模型Whisper v3。 3、GPT定制化服务：支持用户5分钟内、无代码...……更多

2023-11-07 17:45:00上下文,史诗,模型,上下,更新,价格

英伟达超快stylegan回归

扩散模型的图像生成统治地位，终于要被GAN夺回了？就在大伙儿喜迎新年之际，英伟达一群科学家悄悄给StyleGAN系列做了个升级，变出个PLUS版的 StyleGAN-T，一下子在网上火了。无论是在星云爆炸中生成一只柯基：还是基于虚幻引...……更多

2023-02-01 14:22:00英伟,生成,图像,模型,作者,英伟

香港发布AI多模态手术大模型

...学院香港创新院AI中心”)，日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍，CARES Copilot系统由中国科学院香港创新院AI中心研发，是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多

2024-03-14 10:23:00模态,香港,模型,香港,中国科学院,人工智能

技术报告揭秘Sora六大核心优势，影视等行业面临颠覆

...势值得注意的是，Sora推出的同一天，谷歌发布了Gemini多模态模型的更新版本，而三天前，StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。而在Sora推出后不久，OpenAI发布...……更多

2024-02-17 21:07:00颠覆,核心,优势,报告,影视,行业

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...次发布基于CogVideoX的清影，使其大模型矩阵又扩充类一个模态。值得一提的是，这也是国内做语言大模型起家的大模型独角兽，首次推出视频生成产品——之前这个赛道更多的是字节、快手等短视频大厂，以及爱诗科技、生数科...……更多

2024-07-27 09:18:00实测,人手,中国,视频,清影,视频

世卫组织：人工智能在医疗领域应用前景广阔

...内瓦1月18日电（记者曾焱）世界卫生组织18日发布的多模态大模型治理相关新指南说，人工智能在医疗卫生领域应用前景广阔，但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多

2024-01-20 00:19:00人工智能,人工,前景,领域,医疗,智能

腾讯混元文生图大模型升级并对外开源

...显存为11GB，同时运行DialogGen（腾讯推出的文本转图像多模态交互式对话系统）和混元DiT则至少需要32GB的显存，腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道，国内首个官方“大模型标准符合性评...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造，是（谷歌）通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示：Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

北大、快手开源视频生成模型Pyramid Flow，1分钟生

...2M、SA-1B以及WebVid-10M和OpenVid-1M等。1、LAION-5B：一个用于多模态AI研究的大型数据集。2、CC-12M：一个由网络爬虫收集的图像文本对的数据集。3、SA-1B：具有高质量、无模糊图像的数据集。4、WebVid-10M和OpenVid-1M：两个被广泛用于文……更多

2024-10-12 09:49:00生成,快手,视频,北大,模型,视频

OpenAI发布免费新品GPT-4o：可对音频、视觉和文本实

...布新产品，不是AI搜索引擎，也不是GPT-5，而是GPT-4o旗舰模型。OpenAI在ChatGPT中引入GPT-4o并免费提供更多功能。GPT-4o的“o”代表“omni”，意为全能，与现有模型相比，它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和...……更多

2024-05-14 16:45:00本实,和文,推理,新品,音频,对话

MSRA：视觉生成六大技术问题

...进行了梳理，他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布，然而，目标数据分布过于复杂，难以直接拟合。因此，往往需要将复杂的信号做拆分，拆分成多个简单的分布拟合问题，再分别求解。信...……更多

2024-07-15 09:34:00生成,视觉,问题,技术,模型,图像

GPT-4V医学执照考试成绩超过大部分医学生，AI加入临床还

...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力，特别是题目包含图像的考题 —— 这对医疗人工...……更多

2023-11-21 13:59:00医学,多远,执照,临床,大部分,成绩

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...进行统一的处理。在本文中，研究者通过提出创新型的多模态模型架构，以及统一的物理可解释动作空间，来解决这些挑战。设计 RDT：双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

“最强开源AI模型”，4050亿参数版Meta Llama

...上图为机翻字幕，存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型，能够理解图像、文本等多种媒体内容。IT之家查询社交媒体等公开信息，发现已经有开发者使用该 AI 模型。 ……更多

2024-07-13 09:52:00日发布,模型,参数,模型,伯格,媒体

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...变小，成为具身智能的「大脑」。解法：垂域大模型、多模态技术与 AI 智能体论坛中，关于可信大模型如何在应用具体落地，呈现出了多种解法，大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后，讯飞星火的文本生成能力和数理运算能力都有提升，可以轻松回答初三的数学物理题。现场演示中，对“前进20米、右转60 、反复...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

OpenAI发布文生视频模型Sora，奥尔特曼选取网友提示词

...凌晨，OpenAI再次扔出一枚深水炸弹，发布了首个文生视频模型Sora。据介绍，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。目前官网上已经更新了48个视频demo，在这...……更多

2024-02-16 18:44:00文生,奥尔,奥尔特曼,特曼,模型,提示

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...GenAI团队研发小模型，减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy，官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时，国内大模型也有不少进展，通义千问团队升级了视觉语言模型Qwen-VL，图片内文字处理能力得到提升。此外...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

NeurIPS | 消除多对多问题，清华大规模细粒度视频片段

...大学计算机系媒体所的二年级博士生，主要研究方向是多模态大模型与视频理解，在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文，曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术，特别是细...……更多

2024-10-29 09:55:00大规,粒度,范式,清华,片段,大规模

大模型手机密集下场：华为、荣耀、OPPO、vivo、小米杀疯

...华为的盘古大模型，包括盘古 NLP 大模型、CV 大模型、多模态大模型和科学计算大模型。不得不说，华为大模型手机声量越来越高，与其密切关注新兴技术并持续投入掌握这些新技术，根据市场需求进行调整相关。从HarmonyOS 4系...……更多

2023-11-06 15:03:00华为,荣耀,小米,模型,手机,模型

润建股份：公司曲尺平台开发的AI行业模型支持多模态

润建股份：公司曲尺平台开发的AI行业模型支持多模态【润建股份：公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电，润建股份在互动平台表示，公司曲尺平台开发的AI行业模型支持多模态，多模态底座具备文生图...……更多

2023-12-20 22:23:00曲尺,模态,模型,股份,支持,开发

GPT-4劲敌，谷歌进入高能+高产模式

...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

...注意力表现出与视频中的运动和动态相关的中频变化；跨模态注意力是最稳定的，将文本与视频内容联系起来，类似于反映文本语义的低频信号。基于此，研究团队提出金字塔式注意力广播来减少不必要的注意力计算。在中间部...……更多

2024-06-28 09:32:00实时,生成,速度,技术,视频,注意力

Galaxy S24系列上线大模型！三星：不排除未来Gala

...手让给了苹果。有消息称，苹果此前推出了名为Ferret的多模态大语言模型，而后又发布了一篇题为《闪存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。有...……更多

2024-01-18 11:00:00三星,可能性,模型,收费,三星,模型

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

...模型进行持续迭代式微调。GPT-4系列：能力跃升，增加多模态能力，最新版4o突破性价比GPT系列模型的技术演变（GPT-4~GPT-4o）：继ChatGPT后，OpenAI于2023年3月发布GPT-4，它首次将GPT系列模型的输入由单一文本模态扩展到了图文双模态...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

谷歌VideoPoet大模型上线，生成长达10秒视频，还可自

...频。图源：VideoPoetOne More Thing虽然已经是2023年的年底，多模态赛道的玩家们却都还在抢着发布新模型，为本就热闹的市场又增加了一把热度。勤奋如Google，一个月内连发好几款新模型。也有蓄势待发的Midjourney，时隔9个月后终于...……更多

2023-12-22 14:45:00配音,模型,视频,视频,模型,生成

必然的命运：AI大模型冲向“免费轮盘赌”

...低了82%。最新发布的GPT-4o更是被称为现实版的斯嘉丽，多模态的输入输出能力和类人化的情感表达让网友直呼，“她来了！”。不仅支持文、图、音频三种信息形态的输入，并且可以做超过50种语言的同声传译。甚而有网友给GPT-...……更多

2024-05-24 13:40:00轮盘,模型,必然,命运,模型,价格

【多彩新论】算力时代用数字描绘的现实越来越清晰

...智算训练资源池，对图像、文本及语音等混合数据进行多模态大模型训练，最后针对南宋御街场景进行本地化增量训练打造而成。充分发挥西部数据算力资源优势，贵州依托全国一体化算力网络国家枢纽节点和国家级人工智能训...……更多

2024-08-29 04:40:00新论,越来,越来越,现实,数字,时代

“3D视频版Sora”来了！

...-Diag和FV4D）方面都击败了此前的模型。结语：Stability AI多模态再添新布局Stability AI以文生图开源模型起家，在文本、视频、3D等多个模态上都有所布局。此次开源SV4D，是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多

2024-07-26 09:30:00视频,视频,模型,视图,生成,视角

Sora这就落伍了？Meta“最强视频模型”不用DiT，用L

...量问题而导致难产的节骨眼，Meta毫不客气发了它的视频模型“Movie Gen”，并直接用一个完整的评测体系宣告自己打败了Sora们。而且更狠的是，Meta还“杀人诛心”，虽然这模型目前和Sora一样还没对外开放，但它把新模型的95页技...……更多

2024-10-08 09:51:00模型,不用,奇迹,视频,视频,模型

page 6/1000 首页上一页 1 2 3 4 567 8 9 10 11 下一页末页

更多关于科技的资讯：

微星Claw 8、Claw 7 AI+掌机终于发布！首发酷睿

快科技11月29日消息，微星在海外正式发布了第二代游戏掌机，包括两款Claw 8 AI+、Claw 7 AI+，首发配备代号Lunar Lake的酷睿Ultra 200V系列处理器

2024-11-29 22:04:00

国产自研CPU！龙芯3C6000明年Q2发布对标英特尔至强

快科技11月29日消息，龙芯中科最近发布的投资者关系活动记录表显示，公司下一代服务器芯片3C6000目前正处于样片阶段

2024-11-29 22:34:00

武汉大学131周年校庆：雷军视频送祝福去年曾捐赠13亿

快科技11月29日消息，今日，武汉大学迎来建校131周年校庆日。下午，武汉大学第十届校友论坛在雷军科技楼报告厅举行，武汉大学校友企业家联谊会执行理事长

2024-11-29 22:34:00

半夜口干舌燥可能不是缺水！这6种情况一定要警惕

相信很多人都曾有过这样的体验：临睡时刻，总觉得口干舌燥，害怕会频繁起夜，但又忍不住想大口喝水。每当此时，一些人不免会担心

2024-11-29 22:34:00

为满足国内市场需求特斯拉将针对Cybertruck进行碰撞

快科技11月29日消息，特斯拉正计划对中国市场的Cybertruck进行工程改进，以满足中国行人碰撞保护标准，这可能预示着这款纯电动皮卡即将正式引入中国

2024-11-29 23:34:00

月租2167元起！特斯拉海外全系车型推出“先租后买”政策

快科技11月29日消息，特斯拉在北美市场推出了一项全新的“先租后买”汽车租赁方案，覆盖Model S、3、X、Y以及Cybertruck全系车型

2024-11-30 00:04:00

比国内贵9万！广汽埃安AION V正式登陆泰国市场

快科技11月29日消息，广汽埃安AION V正式登陆泰国市场，售价约合人民币21.8万元。这是AION V首次海外上市

2024-11-30 00:04:00

全球化浪潮下，企业如何破浪前行

东南网11月29日讯随着全球化进程的加速，越来越多的中国企业选择走出国门，探索海外市场。面对复杂多变的国际环境，如何突破文化壁垒

2024-11-30 04:17:00

科技金融赋能传统银行业务转型研究

张婷婷对外经济贸易大学国际经济贸易学院摘要：伴随着金融科技的快速发展，传统银行业务转型面临前所未有的机遇与挑战。本文在分析传统银行业务转型困境的基础上

2024-11-30 04:40:00

大数据技术在采购供应需求预测中的应用

徐燕霞对外经贸大学国际经济贸易学院摘要：在当前瞬息万变的市场环境下，企业面临着日益激烈的市场竞争压力，如何准确预测采购供应需求

2024-11-30 04:40:00

数字金融对小微企业服务效能的提升研究

吴楠对外经济贸易大学中国金融学院摘要：小微企业是国民经济和社会发展的生力军，在扩大就业、激发创新活力、促进经济发展中发挥着不可替代的作用

2024-11-30 04:40:00

构建智能广域网，助力数字化转型

孙常军魏民寇军营乔一民山东新矿信息技术有限公司近期，新矿集团为解决在广域网组网中专线带宽低、费用高、不稳定的痛点

2024-11-30 04:40:00

以数字技术赋能，对外讲好中国故事

沈婕吴钰江西师范大学面对国际社会了解中国的迫切需要，我们要主动出击，迎合数字时代发展新需求，强化国际传播效能的技术属性

2024-11-30 04:40:00

供应链服务推动合作更加紧密（走进链博会）

本文转自：人民日报本报记者潘俊强走进中国国际展览中心（顺义馆），在南登录厅入口附近主干道的工商银行展台中心位置，一则工商银行服务中国中车集团有限公司的供应链金融故事

2024-11-30 06:27:00

曾经的欧美游戏一哥：成了今年最大的乐子

转眼间，2024 迎来尾声，亲爱的 Bioware ，请查收你的年度成绩单吧！在前两天公布的 TGA 2024 提名列表中

2024-11-30 07:34:00

头条订阅服务