• 我的订阅
  • 头条热搜
《卖身契》修复记:AI重现“打工人”喜剧魅力,留住老电影的黄
...香港电影修复计划”中,技术人员就曾首次将AIGC视觉大模型引入到影片修复,对大模型进行了生成质量和效率等方面的算法优化。如今随着Sora等大模型在视觉领域的发展,视觉大模型不仅运用在视频生成、修改、融合和延伸等...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...on CPU、骁龙8 Gen3等在内的王炸产品,后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公...……更多
脚步不会停止,步步关乎高教
...ChatGPT的OpenAI公司宣布推出一款名为Sora的生成式人工智能模型。它的出现似一枚重磅炸弹,立刻在全球引发强烈反响,其影响之大,甚至胜过刚刚出现时的ChatGPT。人工智能的每一次进步,都会牵扯到社会的各个层面,高等教育自...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
快手文生图大模型开源,支持ai创作图像
...裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图正式开源,希望共建更加繁荣的文生图大模型社区生态。注意到,快手“可图”大模型于今年5月对外开放,目前已经上线网页版和微信小程序,支持文生图和图...……更多
OpenAI推出自定义版本ChatGPT,即将上线GPT商店
...用户可以轻松创建自己的GPT,并且有可能与他人分享这些模型。这种开放式的分享与合作将会促进更多人共同努力,改进和发展这些模型,为语言技术领域带来更多创新。 “任何人都可以轻松构建自己的GPT”。“GPTs是一种新方...……更多
国网浙江电力:世界首个电力联邦学习国际标准获批立项
...力电力行业智能化转型。联邦学习是一种分布式人工智能模型训练技术。《基于联邦学习的电力视觉检测系统要求和框架》国际标准将联邦学习技术与电力视觉检测业务相结合,构建了一套分布式模型训练方法,能够有效解决数...……更多
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
OpenAI 最近公布了其令人惊叹的视频生成模型 Sora,打破了文本到视频生成模型的天花板。近日,谷歌 DeepMind 也展示了最新的文本到视频游戏的生成模型。(来源:GOOGLE DEEPMIND)这款名为 Genie 的新模型可以接受简短的文字描述、...……更多
让机器读懂你的情绪 重庆这个学生团队入围全国大赛50强
团队将语言模型与图像和音频处理相结合。受访者供图华龙网讯(首席记者 董进)10月24日-10月29日,由安徽省经济和信息化厅、合肥市人民政府主办的第六届世界声博会暨2023科大讯飞全球1024开发者节在合肥举行。大会期间,...……更多
Kimi视觉思考模型k1发布:数理化超越OpenAI o1、GPT-4o
快科技12月16日消息,今日,月之暗面国产大模型Kimi发布视觉思考模型k1,k1基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。k1已陆续上线最新版Kimi智能助手的Andro...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...自新加坡南洋理工大学 S-Lab 团队提出结构化隐空间扩散模型(Structured Latent Diffusion Model)的三维数字人生成新范式 StructLDM。该范式包括三个关键设计:结构化的高维人体表征、结构化的自动解码器以及结构化的隐空间扩散模型...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微信小...……更多
谷歌大幅更新生成式AI,推出视频模型VEO 2和最新版Imagen3
...级其人工智能驱动的内容生成工具,推出了Veo 2视频生成模型和增强版Imagen 3图像模型,挑战OpenAI在AI图像和视频生成的领先地位。谷歌表示,这些更新有望彻底改变创意工作流程,为视频和图像创作者提供更高的真实感和定制化...……更多
...作,成功研发名为“VisionFM”的人工智能(AI)眼科影像基础模型,为全球首个以视网膜图像预测颅内肿瘤的模型,在眼科疾病诊断技术方面取得突破。据介绍,VisionFM使用了涵盖超过50万人的340万张眼科影像进行开发。它可以处理8...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
谷歌世界模型:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
昨晚,世界模型向前迈出了一大步!Google DeepMind 震撼宣布了他们的新一代世界模型 Genie 2,其可根据一张图生成可供人类或 AI 智能体游玩的无限 3D 世界。消息发布后,好评与震惊如潮水般涌现。有人被这技术进步的速度震撼,...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」:小钢炮...……更多
把大模型装进手机,还要等多久?
...且昂贵。如何在手机、PC等终端侧实现对于生成式AI、大模型能力的支持成为业界期待。近期,移动连接,智能边缘计算领军企业高通所进行一系列创新演示,让业界看到,生成式AI实现在终端侧落地的愿景已经近在眼前。终端侧...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
谷歌CEO反思大模型生成错误图像:不可接受,初期没有完美AI
...,跌1.91%,总市值1.70万亿美元。就在本月初,谷歌为其AI模型Gemini推出了图像生成器工具,允许用户通过输入提示来创建图像。但在过去一周中,网友们发现,该工具似乎在有意避免生成包含白人的图像,并在图像中加入了过量...……更多
...太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声音等。一个智能系...……更多
DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代
...公众号昨日(12 月 13 日)发布博文,宣布开源 DeepSeek-VL2 模型,在各项评测指标上均取得了极具优势的成绩,官方称其视觉模型正式迈入混合专家模型(Mixture of Experts,简称 MoE)时代。IT之家援引官方新闻稿,附上 DeepSeek-VL2 亮...……更多
阿里云通义大模型家族迎来新成员,通义万相已开启定向邀测
...新闻客户端 记者 张云山继通义千问之后,阿里云通义大模型家族迎来新成员。7月7日,在2023世界人工智能大会上,阿里云宣布AI绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计...……更多
stability邀请用户测试文本到图像生成模型
...lityAI近日更新其产品页面,邀请用户测试文本到图像生成模型StableDiffusion3。官方表示新版本大幅提高了处理复杂提示词、生成更高质量的图像和纠正拼写错误方面的能力。StableDiffusion3目前并未公开测试,不过已经启动了早期预...……更多
接近国际水平?我们和专业人士聊了聊中国大模型的真实实力
“都快成红海了。”当我和一个创业者聊起大模型的时候,他直接甩了这句话给我。去年11月,OpenAI发布基于GPT-3.5的ChatGPT,瞬间引爆大模型的热潮。半年多的时间,中国出现了“百模大战”的局面,BAT等头部互联网公司和人工...……更多
OpenAI推出生成式模型Sora,内容创作领域开启新纪元
...面。而就在2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。这意味着,继文本、...……更多
...国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行输出,...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00