• 我的订阅
  • 头条热搜
谷歌人工智能模型gemini生成人物图像存在问题
2月25日,据报道,谷歌公司的人工智能(AI)模型Gemini在生成人物图像时存在一些问题,用户反馈该模型无法准确地生成白人形象。尽管Gemini能够根据文字快速生成各种各样的人物形象,并且输入关键词“高兴的黑人”时也没有...……更多
从OPPO AI手机,看到旗舰争夺战新思路
...“私人助理”,来远程帮你服务的。而在当下这个时代,生成式AI大模型越来越成熟,特别是当端侧AI大模型入驻新一代手机,这个“私人助理”才会变得真正好用。Find X7是率先在端侧应用70亿参数大模型的手机,并且通过端云...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微信小程序IT之家获悉,山海多模态大模型有如下特点:实时秒回,自由插话:与现实对话中人类的响应时间相...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...样本特有提示的 multi-scale chain of thought prompting 模块和将生成的掩码与任务语义相对齐的 mask semantic alignment 模块。前者推断出较为准确的样本特有提示来引导 SAM 进行分割,后者则将生成的掩码与任务语义进行对齐,对齐后的掩.……更多
AI视频修复速度10倍提升,过曝变色也能逐帧搞定
...照片中,不同亮度的像素有多少。△ 图片由Claude 3.5 Sonnet生成而STE通过分析视频中每一帧的直方图,然后用一种叫做高斯滤波的方法来平滑这些直方图,先初步矫正直方图分布突变的图像帧,能够让画面看起来更加稳定,减少闪...……更多
...界模型——Genie(精灵)。其可从合成图像、照片、草图生成多种动作可控的环境。 过去几年,生成式人工智能(AI)模型能通过语言、图像甚至视频生成内容。谷歌此次引入生成式人工智能新范式,即生成式交互式环境,通过...……更多
...接龙灯的男女老少……这些由Sora(一款文生视频模型)生成的视频效果足以“乱真”。当地时间2月15日,OpenAI (一家海外人工智能公司)推出旗下首个文生视频大模型Sora,同时展示了由它生成的48段视频。该模型生成的视频以...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多
技术报告揭秘Sora六大核心优势,影视等行业面临颠覆
...不已。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。图片来源:X平台Sora采用了OpenAI文生图模型DALL-E3背后的强大...……更多
汉王科技新款电纸本搭载天地大模型 办公进入AI时代
...会上表示,汉王电纸本集成了语音识别、语义理解、语义生成等多项核心技术,在办公大模型的加持下,电纸本将变得“更懂你”,为用户提供前所未有的智能化办公体验,大幅提高工作效率。具体来看,汉王电纸本在会议记录...……更多
英伟达展示blackwell平台,否认推迟上市
...将数据中心设施的电力成本最多降低28%。首张使用FP4计算生成的人工智能图像 英伟达™(NVIDIA®)还分享了全球首张使用FP4计算生成的人工智能图像。图中显示,FP4量化模型生成的4位兔子图像与FP16模型非常相似,但速度更快。...……更多
3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA
...模型变“乖”,现在仅需3秒调整模型参数。效果be like:生成的风险图片比以往最佳方法减少30%!像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。在移除裸露内容上,效果达到“只穿衣服,不改结构...……更多
双模卫星通话、70亿参数大模型......OPPO提前发布了一大波Find X7系列新技术
...他模型,OPPO AndesGPT 70亿参数大语言模型可以在200字首字生成带来20倍的更快响应,面向2000字首字生成也可以实现2.5倍的更快速度。 OPPO 的AndesGPT 可以实现最高14000的摘要字数上限,达到了同平台其他模型的3.5倍。以通话摘要功...……更多
...了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于今年3月起,研...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...照”(Subject Consistency)功能,实现对任意主体的一致性生成,让视频生成更加稳定与可控。所谓“主体参照”,就是允许用户上传任意主体的一张图片,AI能够锁定该主体形象,通过描述词任意切换场景,输出主体一致的视频。...……更多
AI视频生成能操控运镜了!轻松推拉升降,秒拍电影大片,Runway出品
...11月7日报道,据VentureBeat报道,11月1日,美国明星AI视频生成创企Runway为其Gen-3 Alpha Turbo模型推出了新的AI相机控制功能。该功能允许用户在基于文本提示、上传的图像或现有视频生成新视频时,进行更精细的AI摄像机控制、动态...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...了 LoCoVQA,一种带有干扰项的长上下文视觉问答 (VQA) 基准生成器。LoCoVQA可以提供与问题相关的图像序列,以及一组可配置的视觉干扰项,从而准确评估VLM如何在杂乱的上下文中仅提取与查询相关的信息。从原理上讲,这也是一...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
...新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型从训练样本中“抄袭”的...……更多
科学家提出基于扩散模型多目标优化算法,提高炼油过程的生产效率
...特图是一种图像”这一性质,巧妙地将扩散模型这一图像生成领域的代表模型引入调度优化领域。课题组通过使用扩散模型学习历史操作数据的分布,并在目标梯度的辅助下进行迭代获得最终解。实验结果显示,DMO 不仅可以提...……更多
“3D视频版Sora”来了!
...定摄像机角度。目前,SV4D可以通过一次推理,在约40秒内生成8个视图的各5帧视频,整个4D优化需要20-25分钟。该模型已在Hugging Face上开源,适用于游戏开发、视频编辑、虚拟现实(VR)等场景的应用,可免费用于研究、非商业用...……更多
西班牙用DALL-E生成老照片,正探索联用回忆疗法治疗痴呆症患者
...十人的记忆以这种方式转化为图片。该工作室使用了图像生成模型,如 OpenAI 的 DALL-E,将人们的记忆具象化。自 2022 年以来,该工作室获得了联合国和谷歌的资助,一直在与世界各地的移民和难民社区合作,将那些从未被拍摄过...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...成几分钟:我直接不装了,截个图复制粘贴别人的网站,生成自己的,只用 40 秒:利用 ChatGPT 与 Bing 的浏览功能以及与 DALL-E 3 图像生成器的集成,沃顿商学院教授 Ethan Mollick 分享了一段视频,展示了他的名为「趋势分析器」的 ...……更多
高通骁龙:端侧AI 启幕移动智能“芯”时代
...AI大模型”这个随ChatGPT火到已经泛滥的概念,是一种基于生成式AI技术的大语言/大视觉模型,主要用于图文相关的自然语义理解、处理乃至于创作生成——即与AI大模型概念同样大热的AIGC概念。换句话说,这阵AI风潮本质上是手...……更多
...自主信创软件品类;推动AIGC产业建链、延链,打造文本生成、图像生成、音视频生成、跨模态生成、3D资产生成、虚拟人生成以及游戏策略生成等数字文创新业态,增强数字内容产业发展的接续性和竞争力。另一方面,积极开发...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...大学 ShowLab 博士研究生, 主要研究方向包括图像和视频生成, AI 安全性。黄施捷:新加坡国立大学硕士二年级学生,目前在 Tiamat AI 任算法工程师实习生,主要研究方向是视觉生成。目前在寻找 2025 fall 博士入学机会。最近,lvm...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
... | 苏建勋2023年4月,成立于纽约的Runway AI发布了一段用AI生成的视频:模糊卡顿、物体扭曲,且仅4秒;四个月后,Runway将文生视频的视频效果拉到了4K的超逼着高度,实现了镜头的连贯稳定。而视频的最大长度也从4秒,提升到了1...……更多
google发布imagen3图像生成技术
Google正在升级图像生成技术,以跟上竞争对手的步伐。在本周二于山景城举行的I/O开发者大会上,Google发布了Imagen3,这是该科技巨头Imagen生成式人工智能模型家族的最新产品。Google人工智能研究部门DeepMind负责人德米斯-哈萨比...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研究者使用最先进的方...……更多
更多关于科技的资讯:
英伟达再次出手收购以色列公司,已通过欧盟委员会反垄断审核
前脚 AMD 苏姿丰刚刚完成针对 AI 初创企业 Liquid AI 的投资,后脚英伟达黄仁勋针对 AI 初创企业 Run:ai 的收购亦通过了欧盟委员会的审核
2024-12-23 09:16:00
高德地图联合蔚来行政旗舰ET9首发全域车道级导航 路网数据天级更新,以AI构建全场景导航体验
12月21日,一年一度的蔚来NIODAY上,高德地图全域车道级导航携手国产新能源明星车型蔚来智能电动行政旗舰ET9合作亮相
2024-12-23 09:16:00
创造能量分辨率新纪录,科学家为磁性超导体存在提供直接实验证据
近年来,超导因无损耗传输电能的特性而备受关注,其在磁悬浮列车、医学成像(例如核磁共振成像)、量子计算等领域具有广阔的应用前景
2024-12-23 09:17:00
苦等大半年,苹果 iOS 19 可算有了好消息
从 6 月 11 日在苹果 WWDC24 中登场,到 7 月 16 日首个公测版上线,再到 9 月 17 日正式版发布
2024-12-23 09:18:00
汤姆猫推出 AI 童伴机器人:支持主动聊天、情绪识别,1499 元起
IT之家 12 月 22 日消息,汤姆猫昨日在京东等平台推出 AI 童伴机器人,共有经典款、豪华款、尊享款三个版本,售价分别为 1499 元
2024-12-23 09:19:00
因需求过高,ASML 取消非员工订购的 High-NA EUV 光刻机乐高模型
IT之家 12 月 23 日消息,X(原推特)用户 @jonmasters 发现,光刻机制造商阿斯麦(ASML)正在取消非员工订购的限量版 Twinscan EXE:5000 乐高模型订单
2024-12-23 09:19:00
腾讯 QQ 更新 Windows 9.9.17、macOS 6.9.63、Linux 3.2.15
IT之家 12 月 23 日消息,腾讯 QQ 于 12 月 20 日更新 Windows 9.9.17、macOS 6
2024-12-23 09:19:00
OPPO 首款高分子玻纤背板由 A5 Pro 手机首发
IT之家 12 月 22 日消息,OPPO A5 Pro 手机将于 12 月 24 日 14:30 发布,新机采用居中大圆相机模组设计
2024-12-23 09:21:00
一加 Ace 5 Pro 手机支持「超远距灵动蓝牙」
IT之家 12 月 22 日消息,一加 Ace 5 系列手机发布会已官宣定档 12 月 26 日 14:30,届时还将带来一加平板
2024-12-23 09:22:00
iCar:大量水军对iCar V23高频恶意攻击、网暴车主,已收集证据
IT之家 12 月 22 日消息,今日奇瑞旗下 iCar 汽车官方在微博发布公告称,近期大量水军账号利用虚假信息,通过单一账号重复发布
2024-12-23 09:22:00
荣耀 Magic7 RSR 保时捷设计手机上线官网,最高 24GB+1TB
IT之家 12 月 22 日消息,荣耀 Magic7RSR 保时捷设计及影像技术发布会定档 12 月 23 日 14:00
2024-12-23 09:22:00
Meta 首席技术官:无线计算单元并非独立 VR 头显的“灵丹妙药”
IT之家 12 月 22 日消息,本周 Meta 首席技术官兼 Reality Labs XR 团队负责人安德鲁・博斯沃思在其 Instagram 问答环节中
2024-12-23 09:22:00
红魔游戏手机官宣:“至尊超大杯”12月23日见
IT之家 12 月 22 日消息,红魔游戏手机官方今日宣布,“红魔至尊超大杯即将来袭”,明天见。红魔游戏手机称:“谁说性能
2024-12-23 09:23:00
填补国内空白,首颗自研 AVS3 视觉智算芯片 SPARK RE3200 发布
IT之家 12 月 22 日消息,博雅睿视宣布,在 AVS 工作组第 91 次会议期间,发布了自主研发的首颗支持 AVS3 / SVAC 编码的端侧视觉智算 SoC 芯片 SPARK RE3200
2024-12-23 09:23:00
华硕电脑惊现“圣诞花环”,用户误以为感染病毒
IT之家 12 月 22 日消息,近日部分华硕电脑用户在 Windows 11 系统下遭遇了一次令人不安的经历:屏幕底部突然出现一个占据屏幕约三分之一的圣诞花环横幅
2024-12-23 09:24:00