• 我的订阅
  • 头条热搜
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「图...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多
Meta 公司发布 Imagine Yourself AI 模型
...家 8 月 23 日消息,从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多
快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线
...通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。例如,用户只需上传一张面部轮廓清晰的照片,并选择偏好的风格,调节保留面部特征的程度,便...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...型进行模态扩展,得到不仅能够处理语言,还可以理解并生成图像、音频、视频等多种信息的全模态模型,如 GPT-4o、Chameleon 等。也包含目前最为流行的开源视觉语言模型,Llama-3.2-Vision。以 Llama-3.2-Vision 为代表的大语言模型多模...……更多
谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图
... 17 日消息,谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。使用 Whisk 时,...……更多
腾讯3D大模型全面开源,文本图像10秒转3D资产
3D生成开源界首个同时支持文字、图像转3D的模型来了,效果还是SOTA级别。就在刚刚,腾讯宣布推出Hunyuan3D-1.0,一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像,再进行多视角重建,“啪...……更多
shutterstock新增“创意编辑”功能
...利用了公司对OpenAI最新技术的优先访问权,用户可使用AI生成新内容,或者对Shutterstock图库中的任何图片进行简单编辑、转换。这套“创意编辑”功能拥有6大类别,以及AI设计助手等辅助功能和号称是行业内“最先进”的滤镜等...……更多
AIGC工具测评:生成式AI的产品表现如何
过去这一年,全球涌现出了众多生成式AI产品。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。2023年,AI技术迎来了其发展史上的一次重大飞跃。随着技术突破和...……更多
苹果智能为iPhone、iPad和Mac引入强大的生成式模型
...d和Mac的个人智能化系统AppleIntelligence,基于个人场景发挥生成式模型的强大功用,结合用户情况提供有助益且相关的智能化功能。AppleIntelligence深度集成于iOS18、iPadOS18和macOSSequoia中,充分运用Apple芯片对语言和图像的理解与创作..……更多
英伟达超快stylegan回归
扩散模型的图像生成统治地位,终于要被GAN夺回了?就在大伙儿喜迎新年之际,英伟达一群科学家悄悄给StyleGAN系列做了个升级,变出个PLUS版的 StyleGAN-T,一下子在网上火了。无论是在星云爆炸中生成一只柯基:还是基于虚幻引...……更多
苹果将在ios18中推出一系列新功能
...能回应框架及在苹果设备上运行的LLM技术,以此提升响应生成能力。未来,Siri生成回复和摘要时,能综合考虑人名、公司信息、日历事件、地点、时间等多重因素,使互动更加贴合实际情境。此前,有外媒报道了Safari18、AjaxLLM...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...开发商Moreh完成2200万美元B轮融资Zero123++:从单一图片,生成多张从不同角度看这个物体或场景的图像Anthropic AI发布论文,表示大模型存在“拍马屁”问题大事件高通骁龙峰会,新品碾压英特尔苹果10月25日,高通骁龙峰会推出了...……更多
AI拜年火了,通义千问上线一张照片生成拜年视频
...多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法,共提供超300套照片模板,用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照;此外,一个月前火爆全网的全民舞王应用也迎来上新,用户可...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...反馈的开源检索增强框架SearchLVLMs。该框架主要包括查询生成、搜索引擎调用、分层过滤三个部分。 以视觉问答为例,该框架会基于问题和图片生成查询关键词,并调用搜索引擎查找相关信息,再由粗到细地对检索结果进行过...……更多
MWC联发科展台速览:端侧AI和移动通信黑科技有突破
...题的展厅,吸引了众多行业专家和媒体关注。特别是现场生成式AI技术演示,令众多与会者纷纷争相体验。 实时AI视频生成展示人气爆棚来到展会现场,今年联发科不仅重点展出了很多端侧生成式AI技术的创新应用,包括SDXLTurbo...……更多
Sora未开放课先火 选课当心被割韭菜
输入寥寥数语便能生成效果炸裂的60秒视频!美国开放人工智能研究中心(OpenAI)推出的视频生成模型Sora近日震惊全球。目前,Sora只发布了多个演示视频和技术指导,并对一些专家开放内测,但该模型尚未对公众开放注册。也...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个...……更多
...自己面前对话一样。”“AI复活主要用到语音合成、图像生成和对话交互三大技术。”看科技博主黄海峰向记者介绍了AI复活背后的核心技术。在语音合成方面,借助Tacotron等深度学习模型,剖析大量语音数据,提取特征并关联文...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...成几分钟:我直接不装了,截个图复制粘贴别人的网站,生成自己的,只用 40 秒:利用 ChatGPT 与 Bing 的浏览功能以及与 DALL-E 3 图像生成器的集成,沃顿商学院教授 Ethan Mollick 分享了一段视频,展示了他的名为「趋势分析器」的 ...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...T打造成一个AI助手,让开发者通过简单的自然语言对话,生成所需要的定制化AI助手。可见,其野心已经远不止于做一个对话机器人,而是要做类似一个生产力工具的“超能”产品。OpenAI将向推出最有用和最常用GPTs的开发者付费...……更多
腾讯混元文生图大模型升级并对外开源
...DiT架构。混元DiT是一个基于Diffusiontransformer的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型,支持中...……更多
“Sora目前仍不够可靠,应用场景受限”
近日,博主“AI疯人院”在网络上发布了一部利用AI技术生成的《西游记》动画短片。短片中展现了错落有致的宫殿群、郁郁葱葱的花果山,还有山间云卷云舒、山石崩裂等动画画面,令众多网友赞叹不已。这段短片利用了AI规...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...大模型创新:推出中文原生文生图大模型,突破文字可控生成技术难题;3、全模态技术扩展:新增语音和多模态理解大模型,实现全模态AI技术升级;4、端侧大模型发布:隆重推出3B端侧大模型,能力更强、速度更快、更加安全和...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...频游戏中的镜头几乎相同(左侧为原作,右侧为Midjourney生成图片)。(图片来源:IEEE Spectrum)这些图像均由Midjourney制作生成,提示词中均包含“screencap”。 (图片来源:IEEE Spectrum)大语言模型(LLM)在多大程度上“记住”了...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...维度,MultiTrust构建了32个多样的任务场景,覆盖了判别和生成任务,跨越了纯文本任务和多模态任务。任务对应的数据集不仅基于公开的文本或图像数据集进行改造和适配,还通过人工收集或算法合成构造了部分更为复杂和具有...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
...gle 发布了 Gemini 2.0 Flash,该公司称其除文本外,还能原生生成图像和音频。 2.0 Flash 还可以调用第三方应用程序和服务,使其能够接入 Google 搜索、执行代码等。2.0 Flash 的实验版本将从今天开始通过 Gemini API 和 Google 的人工智能.……更多
快手可灵大模型开放视频续写功能 可生成最长约3分钟视频
本文转自:中国新闻网快手的视频生成大模型“可灵”自面世以来,以其惊艳效果引发了国内外的广泛关注。 6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实...……更多
更多关于科技的资讯:
越见企业家|卓谊生物让安全“看得见” 一支疫苗的承诺
二十年前,一位南方企业家踏上黑土地;二十年后,他手中的一支疫苗,凝结着南北融合的智慧,更承载着对生命安全的极致承诺。在2025长春健康产业博览会上
2025-12-09 16:55:00
不少家长对儿童电话手表“又爱又恨”。爱的是其定位、通话功能能让家长随时掌握孩子动态、保持联系;恨的是它功能日渐繁杂,从“安全工具”沦为“社交神器”
2025-12-09 16:59:00
技术赋能与文化活化双轮驱动— 沉浸式交互动漫人工智能创作高研班精彩不断
当数字技术遇上传统文化,会碰撞出怎样的创作火花?截至11月30日,国家艺术基金2025年度资助的“沉浸式交互动漫人工智能创作高级人才培养”项目
2025-12-09 12:34:00
以创新叩响未来之门:“凯叔讲故事”荣获第五届未来视听创新大赛优秀奖
以创新叩响未来之门:“凯叔讲故事”荣获第五届未来视听创新大赛优秀奖近日,第五届未来视听创新大赛获奖名单在京正式揭晓。在这场由国家广播电视总局
2025-12-09 13:04:00
科技创新铸就发展引擎 东风汽车自主动力技术再攀新高峰
2025年岁末,中国汽车产业科技创新版图再添浓墨重彩的一笔。12月8日,东风汽车自研全新马赫1.5T混动发动机凭借48
2025-12-09 13:34:00
乌江榨菜登顶山姆“双榜第一”,终端销售额突破千万元大关
近日,『乌江x山姆』双拼组合装乌江爽脆涪陵榨菜在山姆会员商店交出亮眼成绩单。这款10月22日在全国上市的新品,仅用一个月时间便荣登山姆会员店新品热度榜TOP1与酱菜类热度榜TOP1
2025-12-09 13:34:00
聚焦健博会|17 项专利加持!长春本土 “康复黑科技”设备 “走进寻常百姓家”
9日,在2025长春国际医药健康产业博览会现场,展厅内人流如织,聚焦“医学、医药、医疗、医养”的展馆内,带来智能康复设备的吉林省微渺医疗科技有限公司
2025-12-09 13:47:00
租赁市场价格“退烧” 租个人形机器人从每天两万元降至数千元
人形机器人在活动现场“上岗”。 (受访者 供图)人形机器人在展会现场“接待”。(厦门日报记者 杨霞瑜 摄) 厦门网讯 (厦门日报记者 杨霞瑜)有机器人在学校运动会上岗当纪律员
2025-12-09 08:57:00
钉钉安全护航:祝贺“国产GPU第一股”摩尔线程成功上市
12月5日,钉钉客户摩尔线程智能科技(北京)股份有限公司(以下简称“摩尔线程”)正式在上海证券交易所科创板挂牌上市,成为“国产GPU第一股”
2025-12-09 09:53:00
RGB-MiniLED 电视哪款值得入手?重点关注这几点
面对市场上各式各样的RGB-MiniLED电视,如何挑选一台真正适合自己、能提升生活品质的型号?如果你正在纠结“哪款值得入手”
2025-12-09 10:05:00
RGB-MiniLED 电视选哪款?一文读懂RGB-MiniLED为何成为高端首选
当电视行业步入以RGB-MiniLED为关键词的高画质竞赛,甄别技术的真伪与深度成为选购第一步。真正的RGB-MiniLED
2025-12-09 10:01:00
炎黄盈动重磅发布企业级AI平台,全面加速企业AI价值落地
随着AI技术的飞速发展,企业正面临从技术试点到全面应用的关键转折点。技术加速:Gartner报告显示,当前AI智能体和AI就绪型数据发展最快
2025-12-08 11:12:00
路边放一台南迪售货机,打造全时段消费新主张
还在为寻找稳定、低风险的增收渠道而烦恼吗?将一台南迪自动售货机放置在路边,它不仅是24小时不休的“金牌销售”,更是能创造被动收入的坚实资产
2025-12-08 13:35:00
人人租亮相2025中国企业家博鳌论坛平行论坛-创新探索、生态共筑
十年博鳌潮海阔,百舸争流共进发。12月2日至5日,2025企业家博鳌论坛系列活动在海南博鳌举办。围绕“链接全球,引领未来
2025-12-08 13:39:00
鲁网12月8日讯在制造业转型升级与企业全球化布局的双重浪潮中,科技型小微企业正成为激活新质生产力的重要引擎。近日,兴业银行济南分行精准对接企业需求
2025-12-08 14:14:00