• 我的订阅
  • 头条热搜
北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉
...Next-Scale Prediction》(视觉自回归建模:通过 Next-Scale 预测生成可扩展图像),论文一作为田柯宇(此前因涉攻击内部大模型,被字节起诉)。参见机器之心报道《GPT 超越扩散、视觉生成 Scaling Law 时刻!北大 & 字节提出 VAR 范...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。目前论文和代码均已开源,并提供了在线Huggingface demo供用户使用。ViewCrafter:...……更多
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
...图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型,其中前两款模型击败SD3-Ultra等主流模型,较小规模的FLUX.1[schnell]也超越了Midjourney v6.0、DALL·E 3等更大的……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
【新智元导读】Meta版Sora,就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言,表征也依然有用。基于此,他们提出了 REPA,即表征对齐技术,其能让「训练扩散 Transformer 变得比你想象的更简单。」Yann LeCun 也对他们的研究表示了认可...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...始人雷海波、AI绘画知名博主娜乌斯嘉三人,共同就《AI生成视频往何处去?》分享精彩观点,英诺天使基金合伙人王晟为本次对话主理人。 易子立首先教授表示,随着AI热潮的来临,很多企业已经在尝试使用AI工具,但文生图、...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...FindX7系列首次实现端侧应用70亿参数的大语言模型,以及生成式的视觉模型,在保障用户隐私安全的情况下,带来响应更快、处理能力更强、生成质量更高的本地AI体验。” 得益于完整的端侧应用的AndesGPT70亿参数大语言模型,Fi...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...小变化可能会极大地改变某些模型的性能(比如要求模型生成与参考答案完全匹配时,6.0和6就可能是不同的)。 为了缓解这个问题,作者建议使用「Explicit」提示来明确指定参考答案所需的格式。多模态性能上表显示,在多模...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...智东西12月3日报道,今天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进:...……更多
...球率先上线一站式AI长视频制作平台Clipfly,集合了AI视频生成、AI视频增强、视频编辑等功能,短短两个月已在海外拥有10万名用户。竞逐人工智能新赛道,很多初创公司“拿着锤子找钉子”,先做大模型,再去找应用场景,但实...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
智谱AI再次放大招,上线AI视频生成功能“清影”——曾被国际科技媒体The Information评为最有可能成为“中国OpenAI”5家企业之一的智谱AI,如今在视频生成领域再下一城。不同于至今没有对公众开放、“犹抱琵琶半遮面”的Sora,...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...天使轮融资。36氪曾报道过的「Tiamat」是一家国内AI图像生成技术服务商,成立于2021年。其自研的MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,通过异构的视觉编码-解码网络结构,并引入基于用户反馈...……更多
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
... 的要求时,会发生什么呢?在 2023 年 10 月大规模 AI 图像生成模型刚刚兴起时,我们便进行了这种尝试,得到了以下结果:考虑到 AI 模型更新换代带来的性能提升,我们在 2024 年 7 月又使用了最先进的模型进行了同样的尝试: ...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... 1B 和 3B 版本,则都是纯文本模型,但也具备多语言文本生成和工具调用能力。Meta 表示,这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性,因为数据无需离开设备。在本地运...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...了 LoCoVQA,一种带有干扰项的长上下文视觉问答 (VQA) 基准生成器。LoCoVQA可以提供与问题相关的图像序列,以及一组可配置的视觉干扰项,从而准确评估VLM如何在杂乱的上下文中仅提取与查询相关的信息。从原理上讲,这也是一...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...反馈的开源检索增强框架SearchLVLMs。该框架主要包括查询生成、搜索引擎调用、分层过滤三个部分。 以视觉问答为例,该框架会基于问题和图片生成查询关键词,并调用搜索引擎查找相关信息,再由粗到细地对检索结果进行过...……更多
麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
...在不影响质量的情况下,给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明,由于一项技术可以将整个100个阶段的过程浓缩为一步,流行的人工智能(AI)驱动的图像生成器的运行速度可...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...经充分认识并认可了表征学习的重要性,那么视觉领域的生成模型呢?最近,谢赛宁团队发表的一篇研究就拿出了非常有力的证据:Representation matters!扩散模型如何突破瓶颈? 成本高又难训练的DiT/SiT模型如何提升效率?对于这...……更多
用AI当导演,一个人就能拍电影?
...对话互动,敢于质疑与承认错误。那么,如此强大的AI可以生成一部电影吗?AI创作电影的画面AI在电影方面的应用引发了业内的思考,上海温哥华电影学院电影制作系的高级讲师奥黛·阿瓦迪亚注意到AI的最新趋势,在去年12月底研发...……更多
“平替版Midjourney”,上线1年超700万用户,生成图片超7亿张
...据报道,该公司产品发布1年,用户突破700万人,平台共生成超过7亿张图像,并获得投资者青睐。2023年12月7日,Leonardo.ai宣布获得3100万美元种子轮融资,投资方包括 Blackbird、Side Stage Ventures、Smash Capital、TIRTA Ventur……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...文荣誉提名,其研究成果亦在快速走向产业化。作者使用生成模型的方法,开启了将想象力直接转化为复杂 3D 模型的新路。拿到最佳论文提名的两篇论文——CLAY 和 DressCode,二者的主题分别是 3D 生成和 3D 服装生成。在 SIGGARPH ...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...处理由区域同自由格式文本混合而成的输入,并可以无缝生成每个可定位对象的坐标和文本,由此在输出中定位所提及的对象。假设已经给定提取得出的图像特征图 Z ∈ R H×W×C 和二值化区域掩模 M,团队首先在 M 内随机采样 N ...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...答案。轻量级的1B和3B模型则可以帮助不仅在多语言文本生成和工具调用能力方面表现出色,而且具有强大的隐私保护,数据永远不会离开设备。之所以在本地运行模型备受大家的青睐,主要在于以下两个主要优势:提示词和响...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...不已。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。图片来源:X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大...……更多
Sora是如何实现1分钟一镜到底?
...其真正实力开发出热门聊天机器人ChatGPT后,OpenAI继续在生成式人工智能上玩出新花样。2月16日,OpenAI推出新的AI大模型Sora,该文生视频大模型可通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。Sora一推出立即引发...……更多
300万人将被AI替代,2400亿市场谁先破局?
...会时,工业AI企业已经先行一步。4月13日,创新奇智推出生成式AI产品——“奇智孔明AInnoGC”,基于创新奇智正在建设的工业预训练大模型,面向制造业垂直场景,提供内容生成和代码生成等能力。同一天,阿丘科技推出升级版...……更多
更多关于科技的资讯:
苹果计划2026年推出两款新品头显产品
苹果即将在头戴式显示器(头显)市场迈出关键步伐,据知名市场研究机构TrendForce集邦咨询的最新研究报告揭示,这家科技领航者计划在2026年前推出两款创新的头显产品
2024-12-21 15:55:00
联想将推出全新游戏掌机legiongos
联想近期揭晓了一个令人振奋的消息:在即将举行的CES2025展会上,Valve公司SteamOS操作系统及SteamDeck掌机的核心设计者Pierre-LoupGriffais将作为特邀嘉宾出席
2024-12-21 15:56:00
蓝宝石pulse脉动b650m主板测评
蓝宝石前段时间推出了PULSE脉动B650M主板,主打AMD平台的性价比,因为采用了AM5插槽,所以兼容锐龙7000/8000G/9000/9000X3D处理器
2024-12-21 15:57:00
蓝宝石rx7900xt20g极地版正在热销
3A平台最近一段时间非常受欢迎,A卡普遍因为拥有大缓存设计,不管是创作还是游戏也都非常有市场,正好最近一段时间蓝宝石RX7900XT20G极地版正在热销
2024-12-21 15:57:00
苹果推出appstore充值返利活动,为用户提供充值优惠
苹果公司正式宣布推出AppStore充值返利活动,为用户提供额外的充值优惠。活动规定,在2024年12月30日之前,用户充值AppStore账户时
2024-12-21 15:59:00
寻找合适的手游代理是开启游戏事业的关键一步。首先,可以从行业展会和论坛入手。参加各类游戏展会,如中国国际数码互动娱乐展览会(ChinaJoy)等
2024-12-21 16:00:00
一加ace5系列正式官宣发布时间
一加Ace5系列正式官宣发布时间,同时透露了关于该系列的诸多细节。与此同时,一加还宣布将于2025年1月7日在海外发布一加13系列
2024-12-21 16:00:00
华为mate70系列销量预计突破千万台大关
据爆料,华为Mate70系列在前两周的激活销量相比前代有明显增长,业界普遍预计该系列销量将突破千万台大关。这一消息引发了广泛关注和讨论
2024-12-21 16:01:00
豆瓣崩了?官方回应:已紧急提交新版本
多位网友在社交媒体上反馈称“豆瓣崩了”,表示在使用豆瓣App时遇到了闪退情况,多次尝试点击仍无法进入App首页。这一突发状况引发了广大豆瓣用户的关注和讨论
2024-12-21 16:01:00
现在是入手电视的最好时刻 面板价格马上要涨了
快科技12月21日消息,要买电视的赶快了,电视面板价格要涨了。近日,TrendForce集邦咨询发布了2024年12月下旬的面板价格信息
2024-12-21 16:02:00
特斯拉陶琳:电动车在寒冷地区的强劲表现
特斯拉公司高层近期在社交媒体上发布了一系列令人瞩目的数据,揭示了电动车在寒冷地区的强劲表现。特斯拉副总裁陶琳指出,即使在气候寒冷的地区
2024-12-21 16:03:00
拜雅游戏耳机mmx300pro评测
还记得小时候为了让FPS游戏中的枪声和脚步声能分辨的足够清晰,第一次接触到了游戏耳机的概念,虽然只有50元的耳机放在现在来看哪里谈得上专业
2024-12-21 16:05:00
小米yu7无伪装实车曝光,外观时尚运动范十足
一组小米SUV车型YU7的无伪装实车照片在网络上广泛流传,据称拍摄地点位于北京雁栖湖。这组照片为公众提供了更为真实、立体的视角
2024-12-21 16:06:00
机械革命斩获京东金榜新品金奖,成唯一获此殊荣的电脑品牌
12月20日消息,京东年度金榜揭晓,机械革命斩获京东金榜最重磅奖项之一——2024京东金榜新品金奖,成为唯一获此殊荣的电脑品牌
2024-12-21 16:07:00
华为在主机上云领域取得重大突破
华为在今年成立了主机上云军团,这是由其主机上云军团CEO、混合云总裁尚海峰公布的消息。根据尚海峰的介绍,该军团聚集了华为研发的核心资源
2024-12-21 16:09:00