• 我的订阅
  • 头条热搜
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...是 pi 的数据都会少七八个数量级。MIT 的这个团队希望用生成模型来作为机器人学习的新数据源,用工程手段来取代传统的数据收集,实现一条通过由生成模型加持的物理仿真来训练机器人视觉的技术路线。随着机器人在训练过...……更多
韩国科学团队研发koala人工智能图像生成模型
...,韩国科学团队近日研发了名为KOALA的新型人工智能图像生成模型,大幅降低了对硬件的需求,而且可以在2秒内生成高质量图片。该模型的关键在于采用了“知识蒸馏”(knowledgedistillation)的新技术,极大地压缩了开源图像生成...……更多
火山引擎的云长什么样,看看这场大会就知道
...之前,电脑报作为受邀人,在填写报名信息后就可以自动生成漫画风格头像邀请函。尽管对科技圈人士来说,这已经是比较普遍的多模态生成技术的应用了,市面上基于AI算法、输入文字或图片即可生成相应的高质量图片的产品...……更多
可生成政治人物图像,马斯克旗下xAI发布Grok-2“手撕”OpenAI
...型Grok-2终于面世。马斯克对该模型寄予厚望,并且未对其生成内容范围过多限制,希望能借此进一步追赶OpenAI的领先地位。马斯克旗下人工智能初创公司xAI本次共推出两款型号的产品,包括Grok-2早期预览版及Grok-2 mini。据xAI介绍...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...大模型创新:推出中文原生文生图大模型,突破文字可控生成技术难题;3、全模态技术扩展:新增语音和多模态理解大模型,实现全模态AI技术升级;4、端侧大模型发布:隆重推出3B端侧大模型,能力更强、速度更快、更加安全和...……更多
AI催生新工种,人类或将扮演AI“担保人”?
...速度如此之快,它将成为人类的“对手”还是“搭档”?生成式大模型的本质是一个不限问题范围的“问答机”。这里的“问”和“答”可以是文本、图像、声音、视频以及它们的任意组合。大模型在所有涉及文字、图像和多媒...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开源MoE大语言模型,采用...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年是国内大语...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用...……更多
谷歌CEO反思大模型生成错误图像:不可接受,初期没有完美AI
由于旗下AI(人工智能)Gemini在生成的图像中展现出了过度的“多样性”,在紧急下架Gemini刚上线不到一个月的图像生成功能后,谷歌CEO承认该问题冒犯了客户,公司将为AI产品的发布推出新流程。当地时间2月27日晚间,谷歌CEO...……更多
Meta 公司发布 Imagine Yourself AI 模型
...家 8 月 23 日消息,从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
AI视频生成赛道风起云涌,国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下,当下的视频生成模型各方面已经接近“以假乱真”的效果。但与此同时,大部分视频生成模型的准确程度、遵循指令的能力还...……更多
美女刷屏真假难辨网友:警惕ai网恋诈骗
...是AI画的。原来在ChatGPT的光芒掩盖一切的这段时间,图像生成AI已经从从画画悄悄进化到了“画照片”。 这种风格和质量的AI照片,还有很多在各大网络社区流传,国内贴吧、微博、NGA,国外推特、油管,到处都是。有网友表示...……更多
如何更高效地使用Gemini?7个技巧教你玩转聊天机器人
...、图像、音频、视频和代码五种类型信息,还可以理解并生成高质量代码。谷歌基于Gemini大语言模型开发了Gemini AI聊天机器人。尽管Gemini具备强大的语言理解和生成能力,但如果用户无法准确地给出合适的提示词,就难以获得准...……更多
未来已来!AI大模型,让手机真正开始「智能」
...拍照算法中也巧妙地融入了大模型,例如在抠图中,利用生成式视觉模型做更好的语义分割,不但分割精度高至发丝级,而且最多可以支持6个主体的分割与提取,利用大模型的绘图重建能力,智能消除图片中的路人与杂物,获...……更多
北大、快手开源视频生成模型Pyramid Flow,1分钟生成5秒视频
...快手科技在本周联合开源了一款名为Pyramid Flow的高清视频生成模型。Pyramid Flow能根据文本描述制作长达10秒、分辨率为1280×768、每秒24帧的视频。Pyramid Flow采用了金字塔流匹配算法,优化了视频生成的效率和质量。这一算法将视...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...不佳。近来,自动驾驶世界模型(World Model)证明其可以生成丰富驾驶数据。在此背景下,本文提出了 DriveDreamer4D,是首个利用世界模型来提升自动驾驶场景 4D 重建质量的算法。DriveDreamer4D 可以为驾驶场景提供丰富多样的视角(...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...了其在模拟复杂环境中处理细节和进行决策的能力。环境生成模型(generative models of environments),也可以叫世界模型(world model),在「通用智能体规划」和「推理环境」中的关键组成部分,相比传统强化学习采样效率更高。但...……更多
引领AI设计“范式革命”,暗壳科技亮相广州建博会
...线设计师和专业内测团队实时反馈,能够确保模型在内容生成和产业端应用中的精准性和高质量输出。 在AI技术端,多个全球顶尖技术团队的主要发明人或核心贡献者是暗壳的技术合作方或技术合伙人,暗壳与AI图像领域核心贡...……更多
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
3D生成开源界首个同时支持文字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪...……更多
RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽
...公司 Lightricks,有了重大动作。该公司推出了最快的视频生成模型 LTX-Video,它是首个可以实时生成高质量视频的 DiT 视频生成模型。在一块 Nvidia H100 上,LTX-Video 只需要 4 秒就能生成 5 秒时长的 24FPS 视频,分辨率 768x512,可以说.……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
CVPR 2024最佳论文奖新鲜出炉,生成式AI成最大赢家!一篇是Rich Human Feedback for Text-to-Image Generation,受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等,共同一作……更多
...球率先上线一站式AI长视频制作平台Clipfly,集合了AI视频生成、AI视频增强、视频编辑等功能,短短两个月已在海外拥有10万名用户。竞逐人工智能新赛道,很多初创公司“拿着锤子找钉子”,先做大模型,再去找应用场景,但实...……更多
Adobe推视频生成大杀器!最长生成5秒视频,一键重拍成为现实,已开放公测
...消息,10月14日,Adobe在Adobe MAX大会上宣布推出Firefly视频生成模型,并强化了现有的图像、矢量和设计模型。Firefly视频模型已进入有限公开测试阶段,成为首个可安全用于商业用途的生成式AI视频模型。最新的Firefly图像模型Firefly...……更多
ai视频渲染应用,你了解多少?
...用。而如果使用ONNX、OpenVINO、CUDA等加速的话,单张图片生成速度会缩短到10秒以内。 当前,D5渲染器也引入了众多AI技术,从而大幅提升渲染效率。AIPC也对其实现了很好地的支持,而且会大幅提升渲染出图的效率。这里我们选...……更多
轻薄本AI出图谁更强?锐龙7 7840S完胜i713700H
...显▲Radeon780M的出图速度大约为1分39秒1张 ▲Radeon780M连续生成5批次/5张图的时间为7分47秒Radeon780M和IrisXeGraphics都可以通过DirectML来支持StableDiffusion的AI出图,不过Radeon780M毕竟是当下性能最强的集成显……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
美AI巨头被控秘密“侵吞”数据
...“侵吞”数据对于科技公司来说,庞大的数据“肥料”是生成式AI的核心养分,也是大模型发展的必争之地。唯有足够的数据才能指导技术即时生成与人类创作相似的文本、图像、声音和视频,实现系统创新。图片来源:视觉中...……更多
快手可灵大模型开放视频续写功能 可生成最长约3分钟视频
本文转自:中国新闻网快手的视频生成大模型“可灵”自面世以来,以其惊艳效果引发了国内外的广泛关注。 6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实...……更多
更多关于科技的资讯:
花几个亿建智算中心,八成的GPU租不出去丨焦点分析
作者丨邱晓芬编辑丨苏建勋在过去两年的中国AI行业,有一项奇观:许多没有任何GPU背景、算力行业经验的上市公司,将智算中心当做他们发展第二曲线的抓手
2024-12-21 12:12:00
超算+AI,我国科研团队解锁地球20亿年生命演化“密码”
南京大学科研团队联合中外多家科研单位,研究通过建立早期地球化石大数据,揭示了地球大约从20亿年到5亿年前早期生命多样性演化历程
2024-12-21 08:57:00
社交应用收入排名超ChatGPT,“出道晚增长快”的产品如何靠短剧崛起
“当地人不太爱存钱,有了钱就消费,比较推崇享乐主义,泛娱乐产品在当地比较有市场”一位在巴西做娱乐应用的出海人讲述,在这个拥有2
2024-12-21 09:07:00
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
【新智元导读】北京大学等研究团队优化了Sdcpp框架,通过引入Winograd算法和多项策略,显著提升了图像生成速度和内存效率
2024-12-21 09:14:00
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码
谷歌版o1来了!在奥特曼“双十二”倒数第二天——他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型
2024-12-21 09:15:00
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
来源:硬AI圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1
2024-12-21 09:15:00
日本三和推出插头可 360° 旋转的 USB-C 数据线
IT之家 12 月 20 日消息,大家可能都见过旋转接头的 U 盘,但是否见过插头可旋转的 USB-C 数据线?日本配件厂商三和(Sanwa)推出了一款支持“以任何角度旋转连接”的 USB Type-C 数据线
2024-12-21 09:15:00
又有厂商加入“百镜大战”,学雷军首款AI眼镜定价999元
在近日举行的2024世界互联网大会乌镇峰会期间,周鸿祎提及AI大模型智能硬件缺少爆款时认为,人天生懒得拿那么多东西,不久后每个互联网公司都会做一个眼镜
2024-12-21 09:16:00
欧盟加码半导体,Silicon Box 意大利工厂获批 13 亿欧元投资
IT之家 12 月 21 日消息,Silicon Box 公司将在意大利诺瓦拉(Novara)开设新先进半导体封装工厂
2024-12-21 09:17:00
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
IT之家 12 月 21 日消息,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场
2024-12-21 09:17:00
荣耀Magic7长焦下的港珠澳大桥,先锋影像定格超级工程
12 月 20 日,正值澳门回归祖国 25 周年之际。荣耀官方发布了一支视频,展示了荣耀Magic7长焦下的港珠澳大桥以及香港
2024-12-21 09:18:00
联想“一体多端”战略持续落地,联想新质媒体沙龙在武汉举办
如今,AI 正全方位渗透到个人生活的方方面面,AI 影像定格精彩瞬间、本地大模型带来随问随答的便捷交互体验,海量信息被梳理总结成知识点
2024-12-21 09:19:00
充电盒存在冒烟或烧毁风险,铁三角在国内召回无线耳机
IT之家 12 月 20 日消息,铁三角音频今日发布召回公告,自 2023 年 10 月开始销售的“ATH-SQ1TW2”真无线耳机
2024-12-21 09:20:00
Sweet Baby“多元化文化咨询”游戏顾问公司官网已无法访问
IT之家 12 月 20 日消息,主张“多元化、公平、包容”的顾问公司 Sweet Baby 在不少游戏玩家心中是近年游戏界乱象的推手
2024-12-21 09:21:00
颜值性能全都要!双旦超轻薄AI PC选购攻略华硕 a 豆 14 Air 领衔
在如今这个科技迅猛发展的时代,PC 笔记本早已不仅仅是工作和学习的必需品,它更成为了年轻人表达个性审美、生活品质的一种方式
2024-12-21 09:23:00