• 我的订阅
  • 头条热搜
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...合成高分辨率、高质量,且具有强文本-图像对其能力的模型。而且,它还能高效生成高达4096×4096像素的图像。项目主页:https://nvlabs.github.io/Sana/论文地址:https://arxiv.org/abs/2410.10629Sana的核心设计包含了以下几个要素:深……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...现”。相比GPT模型,Sora的成功之处在于为图像视频等多模态数据找到了适合Transformer架构的表征方式,从而将ScalingLaw从语言模型复制到了图像视频模型。此外,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...像与人类互动。由此,谷歌追随者高呼:“Gemini让原生多模态(即文本、声音、视频等模态)真正做到丝滑融合,发展原生多模态将成为未来主流路径!”视频发布不到一天,这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...、知识更新鲜,而且能一次性输入一整本书。2、开放新模态API:包括接受图像输入的GPT-4 Turbo、文生图模型DALL·E 3、 文本转语音模型TTS,不久后还将支持自动语音识别模型Whisper v3。 3、GPT定制化服务:支持用户5分钟内、无代码...……更多
英伟达超快stylegan回归
扩散模型的图像生成统治地位,终于要被GAN夺回了?就在大伙儿喜迎新年之际,英伟达一群科学家悄悄给StyleGAN系列做了个升级,变出个PLUS版的 StyleGAN-T,一下子在网上火了。无论是在星云爆炸中生成一只柯基:还是基于虚幻引...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...势值得注意的是,Sora推出的同一天,谷歌发布了Gemini多模态模型的更新版本,而三天前,StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。而在Sora推出后不久,OpenAI发布...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...次发布基于CogVideoX的清影,使其大模型矩阵又扩充类一个模态。值得一提的是,这也是国内做语言大模型起家的大模型独角兽,首次推出视频生成产品——之前这个赛道更多的是字节、快手等短视频大厂,以及爱诗科技、生数科...……更多
腾讯混元文生图大模型升级并对外开源
...显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...布新产品,不是AI搜索引擎,也不是GPT-5,而是GPT-4o旗舰模型。OpenAI在ChatGPT中引入GPT-4o并免费提供更多功能。GPT-4o的“o”代表“omni”,意为全能,与现有模型相比,它在视觉和音频理解方面尤其出色。GPT-4o可以在音频、视觉和...……更多
北大、快手开源视频生成模型Pyramid Flow,1分钟生成5秒视频
...2M、SA-1B以及WebVid-10M和OpenVid-1M等。1、LAION-5B:一个用于多模态AI研究的大型数据集。2、CC-12M:一个由网络爬虫收集的图像文本对的数据集。3、SA-1B:具有高质量、无模糊图像的数据集。4、WebVid-10M和OpenVid-1M:两个被广泛用于文……更多
MSRA:视觉生成六大技术问题
...进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,难以直接拟合。因此,往往需要将复杂的信号做拆分,拆分成多个简单的分布拟合问题,再分别求解。信...……更多
GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?
...诸塞大学、复旦大学的跨学科研究人员团队利用生成式多模态预训练模型 GPT-4V (ision) 突破了人工智能在医学问答中的最佳水平。研究测试了 GPT-4V 回答美国医学执照考试题的能力,特别是题目包含图像的考题 —— 这对医疗人工...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
“最强开源AI模型”,4050亿参数版Meta Llama 3被曝7月23日发布
...上图为机翻字幕,存在错误 报道称 Llama 3-405B 是一个多模态 AI 开源模型,能够理解图像、文本等多种媒体内容。IT之家查询社交媒体等公开信息,发现已经有开发者使用该 AI 模型。 ……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
...华为的盘古大模型,包括盘古 NLP 大模型、CV 大模型、多模态大模型和科学计算大模型。不得不说,华为大模型手机声量越来越高,与其密切关注新兴技术并持续投入掌握这些新技术,根据市场需求进行调整相关。从HarmonyOS 4系...……更多
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
...注意力表现出与视频中的运动和动态相关的中频变化;跨模态注意力是最稳定的,将文本与视频内容联系起来,类似于反映文本语义的低频信号。基于此,研究团队提出金字塔式注意力广播来减少不必要的注意力计算。在中间部...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
Galaxy S24系列上线大模型!三星:不排除未来Galaxy AI收费的可能性
...手让给了苹果。有消息称,苹果此前推出了名为Ferret的多模态大语言模型,而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。有...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...模型进行持续迭代式微调。GPT-4系列:能力跃升,增加多模态能力,最新版4o突破性价比GPT系列模型的技术演变(GPT-4~GPT-4o):继ChatGPT后,OpenAI于2023年3月发布GPT-4,它首次将GPT系列模型的输入由单一文本模态扩展到了图文双模态...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...频。图源:VideoPoetOne More Thing虽然已经是2023年的年底,多模态赛道的玩家们却都还在抢着发布新模型,为本就热闹的市场又增加了一把热度。勤奋如Google,一个月内连发好几款新模型。也有蓄势待发的Midjourney,时隔9个月后终于...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...低了82%。最新发布的GPT-4o更是被称为现实版的斯嘉丽,多模态的输入输出能力和类人化的情感表达让网友直呼,“她来了!”。不仅支持文、图、音频三种信息形态的输入,并且可以做超过50种语言的同声传译。甚而有网友给GPT-...……更多
更多关于科技的资讯:
英特尔酷睿Ultra 200HX/H系列技术解析:超强能效实现150W暴力输出
太平洋时间1月6日上午,英特尔举办了CES 2025展前发布会,全新的英特尔酷睿Ultra 200HX/H系列移动级处理器正式发布
2025-01-08 21:19:00
别克GL8最强对手登场!比亚迪全新MPV夏正式上市:24.98万起
快科技1月8日消息,今日晚间,比亚迪全新中大型MPV夏正式上市,共推出4款车型,售价24.98-30.98万元。新车全系标配“天神之眼”DiPilot 100高阶智驾辅助系统
2025-01-08 21:19:00
中大型智能旗舰MPV又一猛将!一图看懂比亚迪夏
快科技1月8日消息,作为王朝网的首款旗舰MPV车型配置丰富,外观设计基于王朝网设计语言,预热已久,造型获好评。内饰方面
2025-01-08 21:19:00
抖音电商严打违法违规营销!严重违规主播永封带货权限
快科技1月8日消息,今日,抖音电商发布关于保障消费者权益,严打违法违规营销行为的公告。公告提到,为创造公平健康的交易环境
2025-01-08 21:19:00
芝奇达成48GB DDR5-10600!AMD锐龙平台突破10GHz
快科技1月8日消息,芝奇宣布,在AMD锐龙平台上,成功将内存超频到了DDR5-10600的超高速度,突破10GHz大关
2025-01-08 22:49:00
丰田董事长谈日产本田合并:期待他们造出更具竞争力的产品
快科技1月8日消息,丰田汽车董事长丰田章男在CES 2025展览会上谈到了日本两大车企本田、日产面临的合并问题。丰田章男表示
2025-01-08 22:49:00
最美CTO携保定神车亮相 中国智能车扎堆拉斯维加斯
保定智能车勇闯拉斯维加斯,首次亮相“科技春晚”。2025元旦刚过,长城CTO吴会肖从保定出发,途经北京、仁川,几经辗转
2025-01-08 22:49:00
用户期待已久!HDMI 2.2规范来了:带宽暴增
2025年1月6日,美国拉斯维加斯—HDMI Forum,Inc.宣布HDMI规范2.2版本,新HDMI规范为规模庞大的HDMI生态系统带来更多选择
2025-01-08 23:19:00
Switch 2大量情报泄露!配件商自曝:黑市能买到真机吗
虽然任天堂并未参展CES 2025拉斯维加斯消费电子展,但展会上却处处透露着Switch 2即将发布的信息。多家配件厂商纷纷展示了他们为这款新主机准备的首批配件
2025-01-08 23:49:00
印尼维持iPhone 16销售禁令 前一天刚批准建设AirTag工厂
据媒体报道,印度尼西亚维持了对苹果iPhone 16的销售禁令,称苹果承诺的、包括AirTag工厂在内的10亿美元投资计划仍不足以满足当地的投资要求
2025-01-08 23:49:00
腊八节腾讯给员工发巨型甘蔗:员工扛到一楼去削皮
快科技1月8日消息,据媒体报道,1月7日是腊八节,在节日当天,腾讯公司给员工准备了惊喜—巨型甘蔗,祝员工“掂过碌蔗”,寓意今年顺顺利利
2025-01-08 23:49:00
男子4s店花320万订劳斯莱斯库里南 结果车款被4S店挪用无法提车
快科技1月8日消息,据报道,湖南长沙,游先生向媒体反馈称,自己花费320万元订购库里南,结果购车款被4S店挪用,现在仍无法提车
2025-01-09 00:19:00
2025年首次更新!微信安卓版8.0.56正式发布:朋友圈视频支持倍速播放、新增语音倒计时
快科技1月9日消息,日前,微信安卓版迎来8.0.56正式版更新,这是2025年首次版本更新。关于更新内容,依然是那9个字
2025-01-09 00:19:00
千呼万唤!《王者荣耀》今日开启华为HarmonyOS NEXT限量付费删档测试
快科技1月9日消息,今日,腾讯旗下热门手游《王者荣耀》将开启华为HarmonyOS NEXT版本的限量付费删档测试。本次测试限量开放
2025-01-09 00:49:00
Apple Watch芯片首次在美国生产:台积电代工
快科技1月9日消息,据媒体报道,苹果扩大了在美国生产芯片的规模,Apple Watch Series 9使用的S9芯片将在台积电亚利桑那州凤凰城Fab 21工厂生产
2025-01-09 00:49:00