• 我的订阅
  • 头条热搜
meta推出“v-jepa”视频预测模型
...高效预测生成图片/视频中被遮蔽的部分。IT之家注意到,研究人员使用一系列经过遮蔽处理的特定视频训练I-JEPA/V-JEPA模型,研究人员要求模型利用“抽象方式”填充视频中缺失的内容,从而让模型在填充间学习场景,进一步预...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较,结果发现,PaLI-3 虽然在标准图像分类基准上略微表现不佳,但基于 SigLIP...……更多
谷歌推出“文生视频”扩散模型
.../24FPS下约3.34秒视频),虽然这一数据看起来很短,不过研究人员提到,5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。除了应用“Space-TimeU-Net”基础架构外,谷歌还介绍了Lumiere的基础特性,该AI建立在一个...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...毁模型\"技术,抵制大型AI模型的恶意应用斯坦福大学的研究人员最近推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也可...……更多
deepmind开发音乐创作工具dreamtrack
...,声称可令视频创作者“更有效率地将想法变为作品”。研究人员介绍了当前通过AI模型生成音乐的挑战,这是因为音乐本身包含极高的信息密度,其中每一秒钟都可能拥有多个节拍、音符及和声。而这也使得“生成音乐”相较...……更多
meta推出两款基于ai的图像编辑工具
...型中,进而在视频生成和编辑中,提供更好的控制能力。研究人员指出,当前的图像编辑模型,通常会过度修改图像,或是修改不足,而EmuEdit的优势在于能够准确按照指令进行编辑。Meta使用了1000万个合成数据集训练EmuEdit,号...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...”刘山松表示。在调研和确定研究现状和研究目标之后,研究人员先选用 MERT、ViT 和 ViViT 这三个特征处理器,来分别处理音乐、图像和视频输入。接着,将编码器的输出引入所选用的 LLaMA2 开源大模型,让其能够理解、处理多模...……更多
微软推出全新vasa-1模型
...,最重要的是几乎没有人工痕迹,如果不细看很难发现。研究人员承认,与所有其他模型一样,该模型目前还无法妥善处理头发等非刚性元素,但整体效果要比其它同类模型要更为优秀。研究人员还表示VASA-1支持离线batch处理模...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进...……更多
Sora为何没能诞生在中国?
...家AI初创公司Pika lab(以下简称Pika),推出自研视频生成模型的新功能,可同时生成画面和声音。此前,人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放,但足以让人见识到AI的进化之快。今年2月16日,OpenAI发布...……更多
字节回应“中文版Sora”:目前无法作为完善产品落地,与...
...物或物体的动作。Boximator的数据来源是WebVid-10M数据集,研究人员从中过滤出110万段动态明显的视频片段,并为其注释220万个对象的边界框,在PixelDance和ModelScope这两个模型上训练了Boximator。字节跳动的研究人员表示,目前这款模...……更多
瑞士研究人员成功训练一只机器狗
近日,瑞士苏黎世联邦理工学院机器人系统实验室的研究人员成功训练了一只机器狗,使其能够利用一条腿完成开门、移动物体等任务,并依靠其他三条腿行走和保持平衡。这种“新颖的”运动方式具有潜在的应用前景,尤其...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
...看他们造出了什么。”他说。虚拟游乐场谷歌 DeepMind 的研究人员感兴趣的不仅仅是游戏生成。Genie 背后的团队致力于研究开放式学习,将人工智能控制的机器人放入虚拟环境中,通过试错(一种被称为强化学习的技术)来解决...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
文|尚恩编辑|邓咏仪封面来源|Figure“大模型”终于有实体了。美国时间3月13日,由OpenAI投资的机器人公司Figure发布了一段视频demo,视频里的机器人,不仅可以与人进行对话交互,理解人类的意图,而且还拥有记忆力。当工...……更多
openai发布sora模型:支持一次性生成多机位视频
...。OpenAI称,该模型正在接受测试,只分享给了一批精选的研究人员和学者。 ……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...Converge 2加速器计划。该计划面向杰出工程师、设计师、研究人员和使用人工智能重新构想世界的产品开发者。通过技术讲座、办公时间、社交活动以及与领先从业者的对话,OpenAI将一起探索在人工智能前沿建设中最重要的机遇...……更多
瑞士研究人员展现四足机器人新技术
...报道,近日瑞士苏黎世联邦理工学院机器人系统实验室的研究人员展现了新的试验成果:训练自己的机器狗,使其利用其中一条腿来完成开门、移动物体等任务,并依靠其他三条腿来行走、保持平衡。研究人员表示,相信这种“...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...识别视觉上不同但编码相似的图像。为了解决这个问题,研究人员提出了“交错特征混合(Interleaved-MoF)”方法,该方法结合了CLIP和DINOv2特征,显著增强了视觉基础能力。在MMVP基准测试中,这种方法实现了10.7%的性能提升,同...……更多
机器人笑了,我却笑不出来
...参考资料[1])事实上,要实现这一点很困难,这首先需要研究人员打造出一张能够实现逼真的面部肌肉运动的机器人脸,其次还要让机器人通过人工智能学习人类表情的细微差别,并迅速做出准确的反应。如何造头? 与机器人E...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
...网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William(Bill)Peebles和纽约大学的一位研究人员谢赛宁共同发表。William(Bill)Peebles之后加入了OpenAI,领导Sora技术团队。然而,戏剧化的是,Meta的AI科学家YannLeCun……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...央视网、小央视频视频号以及智谱AI视频号同步直播。大模型(人工智能)三个阶段首先,智谱AI的CEO张鹏向大家回归了大模型(人工智能)三个阶段:从2017年谷歌提出Transformer开始迅速席卷了整个人工智能领域的研究和产业,...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被该模型颠覆的观点。那么,这到底是一个怎样的模型?具有哪些出色的能力?又将会给哪些领域带来...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...出于已经学习过,内化了的能力,而不是来自远程操作。研究人员将机器人摄像头中的图像输入,和机载麦克风捕获的语音中的文本转录到由 OpenAI 训练的,可以理解图像和文本的多模态模型(VLM)中,由该模型处理对话的整个...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的医疗保健专用人工智能模型MedLM,旨在帮助临床医生和研究人员进行复杂的研究、总结医患互动等。此举标志着谷歌将医疗保健行业人工智能工具货币化的最新尝试。MedLM套件包括一个大型和中型AI模型,均基于Med-PaLM 2构建。Me...……更多
...子里迎接龙灯的男女老少……这些由Sora(一款文生视频模型)生成的视频效果足以“乱真”。当地时间2月15日,OpenAI (一家海外人工智能公司)推出旗下首个文生视频大模型Sora,同时展示了由它生成的48段视频。该模型生成的...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...产品的创新开拓,不断提高AI产品的用户体验,与用户、研究人员、开发者们携手,共创国产大模型的未来。 ……更多
研究人员提出artprompt新大模型注入手段
3月18日消息,据外媒ArsTechnica报道,研究人员近日提出了一种名为ArtPrompt的新大模型注入手段,其使用ASCII字符画替代关键文字进行提示输入,绕过了大模型的安全限制。举例来说,研究人员向大模型输入CounterfeitMoney(IT之家注...……更多
...识别等算法,在全国首创异常船只轨迹、高发江段时段等模型,迭代新增识别岸边人员违法垂钓和撒网、自打自吸冷磅采砂船等模型,对江面所有船只识别过滤,精准跟踪监控异常船只,一旦发现违法行为特征,即可自动拍照留...……更多
...布鲁克斯毕业后加入OpenAI,成为图像生成系统DALL-E的主要研究人员。布鲁克斯还是个多才多艺的人,喜欢摄影和音乐。他高中时的摄影作品曾获得国家地理最佳摄影和国家野生动物联合会的奖项,他还曾在纽约百老汇的灯塔剧院...……更多
大厂要面子,Kimi要里子
...一天,朋友推荐了Kimi,我才知道,什么是好用的国产大模型。”80后李琳是文字工作者,她对大模型的需求主要集中在资料的检索和整理,之前文心一言能够基本满足她的需求。但Kimi给了李琳全新的体验,“仅从资料和素材的...……更多
更多关于科技的资讯:
夜鹰m7pro移动热点路由器发布
9月11日消息,网件NETGEAR当地时间昨日宣布推出夜鹰M7Pro(MR7400)移动热点路由器。该移动热点搭载高通骁龙X75基带
2024-09-12 02:22:00
Galaxy S25系列有可能搭载骁龙8 Gen4
本月早些时候,有韩国媒体报道称,三星计划在其GalaxyS25系列的所有机型上采用高通的骁龙8Gen4移动平台。在X平台(原Twitter)上
2024-09-12 02:36:00
三折叠专属键盘上架华为商城,手感舒适
在昨天华为见非凡品牌盛典上,除了华为MateXTUltimateDesign拥有极高的关注度之外。当余承东从衣服兜里掏出一个三折叠专属折叠键盘时
2024-09-12 02:38:00
小米宣布对受灾地区提供多种免费服务
近日,台风“摩羯”对我国南方部分地区带来了严重的灾害,造成了不小的损失。9月10日晚,小米公布了新的服务政策,对受灾地区提供多种免费服务
2024-09-12 02:50:00
华为三折屏手机来了,价格直逼天价!
今儿咱们得聊聊华为新出的那款三折屏手机,简直是科技圈的一枚重磅炸弹!别急着跟苹果比,这次华为走的可不是寻常路,它直接奔着奢侈品界去了
2024-09-12 02:55:00
人工智能助力矿山安全生产管理
随着科技的飞速发展,人工智能(AI)技术正逐步渗透到矿山安全生产管理的各个环节,以其强大的数据处理、模式识别与决策支持能力
2024-09-12 03:01:00
京东发布“京东鸿蒙上线前瞻”:9月完成正式版上架
9月11日消息,京东官方今日发布“京东鸿蒙上线前瞻”,计划9月完成鸿蒙原生应用正式版上架。2024年1月,京东正式启动鸿蒙原生应用开发
2024-09-12 03:05:00
三星正在研发一款全新的ar/vr头显设备
近日,有报道称三星正在研发一款全新的AR/VR头显设备,预计将在不久的将来发布。根据外媒91mobiles的报道,三星为其即将推出的AR头显设备申请了一项无线充电盒的专利
2024-09-12 03:13:00
谷歌正在更新其消息显示方式
据外媒报道,GoogleMessages应用正在更新其消息显示方式。目前,应用底部会显示“Textmessage”(文本消息)或“RCSmessage”(RCS消息)
2024-09-12 03:13:00
百度地图发布北斗高精车道级导航3.0,号称“去哪都能开”
9月11日消息,百度地图今日发布北斗高精车道级导航3.0,号称“去哪都能开”。用户升级至百度地图最新版,无需设置,该功能自动开启
2024-09-12 03:13:00
星纪魅族lucky08ai手机亮相,内置大容量电池
9月11日,星纪魅族官方宣布将举办星纪魅族AI生态发布会,旗下新款AI手机星纪魅族Lucky08将进入2000元档位,明天正式亮相
2024-09-12 03:15:00
领克09四驱运动版将于9月13日上市,前脸采用直瀑式格栅设计
9月11日消息,领克汽车官方今日宣布,领克09四驱运动版将于9月13日上市。该车型将搭载2.0T发动机和48伏轻混系统
2024-09-12 03:16:00
iphone16系列geekbench最新跑分出炉
9月11日消息,苹果iPhone16系列手机已于昨日凌晨发布,升级A18/Pro芯片。IT之家今天早些时候曾报道iPhone16Pro系列的GeekBench跑分
2024-09-12 03:18:00
路特斯“theory1”将于9月17日亮相
9月11日消息,路特斯市场负责人乔心昱今天发文宣布,路特斯旗下最新车型“THEORY1”将于9月17日亮相。据新浪汽车报道
2024-09-12 03:21:00
腾势z9gt将于9月20日全球上市,提供两种动力选择
8月20日,2024腾势汽车科技日暨腾势Z9GT预售发布会正式召开。在此次发布会上,腾势Z9GT正式开启预售,提供纯电与插混两种动力选择
2024-09-12 03:28:00