• 我的订阅
  • 头条热搜
一文看懂AI结果优化(AIRO)和生成引擎优化(GEO)的区别
...(适配大模型语义解析)。(3)跨模态适配:针对文本、图像、视频等生成引擎制定差异化策略(如优化Midjourney提示词以关联品牌视觉风格)。三、应用场景与典型案例1.AIRO的典型场景消费决策引导:用户通过智能助手询问“最佳XXX产品...……更多
“图片生成领域的DeepSeek”!智象未来图像生成大模型全面开源 登顶全球权威榜单
...模型,具备强大的视觉内容生成与理解能力。其模型生成视频内容关联性强、画面自然流畅、拥有 4K 高清画质,且采用影视级的镜头语言,在 AIGC 技术与数字化创意等方面具备领先优势。目前,智象未来已形成“1+3+N”的商业化...……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...觉的感知和理解能力,能够对手机屏幕更深度的理解,在视频流的实时对话上也更加流畅自然。蓝心语音大模型、图像大模型和多模态大模型,综合能力都获得行业机构的高度认可,在多家专业榜单上位列第一。【本文结束】如...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...ro、Premier四个版本的语言模型,还有图像生成模型Canvas、视频生成模型Reel。其中Reel现支持生成6秒视频,很快将会延长到2分钟。亚马逊总裁兼CEO安迪·贾西现场剧透:明年,AWS不仅将发布语音转语音模型,还有更高能的任意转任...……更多
...型,并发布了多个多模态模型,如图像生成模型Imagen 4和视频生成模型Veo 3,具备从文本等多种输入形式生成高质量视觉内容的能力。音乐生成模型Lyria 2为音乐人提供了多模态创作工具。AI电影制作工具Flow集成了先进的多模态技...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...人工智能可以像人类一样感知和理解音频、文本、图像、视频等多种模态信息,并与人类进行更加自然高效的交互,展现出了强大的功能和广泛的商业应用前景。 多模态能力是实现通用人工智能的重要路径之一,也是趣丸科技...……更多
AI拜年火了,通义千问上线一张照片生成拜年视频
...全民舞王应用也迎来上新,用户可通过一张照片生成拜年视频,用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费“拍”全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...的场景运动建模方法,可用于通过静态图像生成无缝循环视频,还能实现与图像中对象的交互。这项研究来自谷歌,一作谷歌DeepMind研究员Zhengqi Li(李正奇)。最佳学生论文奖也一同公布。一篇BioCLIP: A Vision Foundation Model for the Tr...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的...……更多
AIGC工具测评:生成式AI的产品表现如何
...工具,它们按功能可以划分为:文本生成、图像创作、音视频处理等多个类别。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。一、ChatGPT-4所属公司:OpenAI 发布时...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...lassification)——深度学习表明,人类可训练AI,对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”,“对话才是未...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
AI视频生成赛道风起云涌,国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下,当下的视频生成模型各方面已经接近“以假乱真”的效果。但与此同时,大部分视频生成模型的准确程度、遵循指令的能力还...……更多
...Qwen2.5-Omni-7B。这个模型能够同时处理文本、图像、音频和视频等多种输入,并实时生成文本和自然语音合成输出。用户可以像打电话或视频通话一样与通义千问Qwen聊天,甚至能识别音视频中人物的情绪。在复杂任务中,通义千...……更多
中国企业调用大模型日均超10万亿Tokens,阿里通义份额第一
...大模型,以及AI编程模型Qwen3-Coder、文生图模型Qwen-Image和视频生成模型通义万相Wan2.2等多模态模型,在全球引发接入中国模型热潮。海外知名大模型API聚合平台OpenRouter数据显示,阿里千问模型全球市场份额最高超12.3%,超越美国O...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...0秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。 「天工SkyMusic」具有以下五大特点:1. ...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...件的交互方式。未来,AI PC可以直接基于电脑上的照片和视频,直接剪辑生成内容。它也可以作为工作助手,写文档或者提炼总结要点。Meta公布2023年第三季度财报10月25日,Meta公布截至9月30日的2023财年第三财季业绩,第三财季...……更多
AI角色创作平台「捏Ta」完成超千万元融资
...以来,捏Ta的社交媒体曝光量已达到约2.5亿次,多次位列视频号动漫游戏日榜前十。捏Ta在社交媒体上的曝光。图源:看见概念捏Ta团队认为,AIGC技术的发展对图像生产带来的最大改变是,生产资料从原有的像素或图层,变成了...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...雅在云栖大会展示了“珠峰AI创作服务平台”:珠峰AI音视频创作平台,依托通义文本大模型对文本内容语义的深度理解,打造珠峰AI音频大模型,结合喜马拉雅独有的全品类音色库和数字人大模型,为创作者提供高品质的AIGC音...……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...花“开年大戏”用笑点戳中职场痛点领导天天开会没空拍视频,扔张照片让你后期合成,美其名曰“造血式创新”;为公司写宣传文案,没有时间没有预算,领导还要让你戳中用户的心趴;和“金主”同姓的空降新人,满口大厂...……更多
...提升数据精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平...……更多
我国自研视频大模型面向全球上线
输入文字描述或上传图片,就能生成一段逼真视频。近日,我国自主研发的通用视频大模型Vidu(www.vidu.studio)面向全球正式上线。据悉,这款视频大模型开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分...……更多
依图科技“天问”大模型赋能安防,智慧应急跨越式发展
...始研究以Transformer为基础的大模型,并成功将图像感知、视频感知与大模型结合,推动了AI安防技术的跨越式发展。 安防行业,作为社会稳定和公共安全的重要保障,一直是科技创新的先行者。随着AI技术的不断进步,安防行...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...等模型能够根据自然语言提示词生成美观且逼真的图像和视频,广受用户喜爱。然而,这些模型在处理复杂的提示词时仍存在不足。例如,当让Stable Diffusion或Midjourney生成「棕色的狗绕着一棵树追黑色的狗」时,模型可能会错误...……更多
破晓之光:2025 ChinaJoy AIGC大会圆满召开 | ChinaJoy2025
...模态技术正加速演进,其团队开发的Vidu Q1 进一步实现了视频模型的“高可控性”与“高一致性”。依托全球创新的“参考生视频”功能,Vidu 显著提升了视频内容的一致性,并已成功应用于泛互联网、广告营销及智能硬件等多...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...mi-ai.github.io/技术报告:https://arxiv.org/abs/2412.00174完整介绍视频:https://www.bilibili.com/video/BV1D6zpYHEyc/ 从技术报告中我们可以看到,SOLAMI支持多种角色,有超级英雄蝙蝠侠,小可爱机器人……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
龙年伊始,Sora的发布引发热议,开启视频动画领域的AIGC新篇章。一夜之间, “AI创作”不再只是科技爱好者的美好构想,同时让普通人的AI创作从“文生文”、“文生图”进一步拓展到了“文生视频”。这是否意味着传统广告...……更多
...到在线平台的全面教育应用。平台可以处理学生的文本、视频和音频数据,识别学习行为与偏好,并动态生成个性化的学习路径和资源推荐,助力全面、智能化的教育服务。智能座舱一体化平台:基于MatrixOne的多模态数据处理能...……更多
“Sora”王炸,20篇研报带你走进人工智能(下载)
...工智能热潮还在席卷全球,OpenAI又在近日发布了首款文生视频模型“Sora”。人工智能的广泛应用将给人类未来的生产和生活方式带来巨大而深远的影响,并有望作为新的底层通用技术,点燃第四次科技革命!本期三川汇文化产...……更多
大模型到了该「验收」的时候
...AI PPT等新兴应用层出不穷,Sora的火热更是催生了一大批AI视频应用紧锣密鼓地集中亮相。在B端,“百模大战”与“Token价格战”连番上演,实打实地冲开了一片广袤的市场;两年前,GPT 3.5每百万Token的价格约为60美元,而今天,G...……更多
更多关于科技的资讯:
在杭州城西科创大走廊东首的西湖区紫金港科技城云谷中心,国内最大模型开源社区“魔搭社区”的首个线下实体空间——魔搭社区(杭州)开发者中心(以下简称“开发者中心”)
2025-12-05 08:13:00
眼下,养宠群体逐渐壮大,带来的刚需消费、悦己消费持续升温、充满潜力,宠物经济迅速崛起。最近,省农业农村厅联合省发改委、省商务厅等五部门印发《关于促进宠物经济发展的意见》
2025-12-05 08:13:00
海运到货 福州车厘子上新整体售价稳步回落4日,随着海运而来的智利车厘子到达福州,福州市场上车厘子全面上新,整体售价开始稳步回落
2025-12-05 08:13:00
苏州作为全国数字经济、数字金融的先行城市,始终以敢为人先的魄力,争当保险科技应用的“试验场”与“示范区”。苏州市数字金融高质量发展大会保险科技专题活动在苏州人保财险成功举办
2025-12-05 10:56:00
近日,2025系统医学与健康大会在苏州工业园区举行,四大慢病国家科技重大专项技术总师陈竺,创新药物研发国家科技重大专项技术总师曹雪涛
2025-12-05 11:45:00
《中国电影经济发展研究报告》在海南岛国际电影节首发
孙向辉解读《报告》。中青报·中青网记者 任明超/摄中国青年报客户端讯(李争艳 中青报·中青网记者 任明超)12月4日,《中国电影经济发展研究报告》(以下简称《报告》)在海南岛国际电影节主论坛首发
2025-12-05 11:50:00
近日,由市稳外贸专班主办,苏州市分公司、供应链数字治理研究中心、苏州世标检测有限公司共同承办的“新外贸‘涨’字诀:精通美国知产合规赋能企业竞强价增”活动
2025-12-05 11:54:00
南京企业奋战四季度
进入四季度,南京企业在新品发布与订单签订上成果显著,重点产业创新动能强劲 产业是城市经济发展的基石。进入四季度以来
2025-12-05 12:11:00
AI时代“一人公司”迎来发展良机AI应用爆发前夜,中国第二经济大省江苏的“双子星”——南京、苏州抢先布局“单人成军”的OPC新形态OPC的全称是One Person Company
2025-12-05 12:11:00
潮品、文创、黑科技一站式打卡!河南品牌“秀”出多元消费新体验
大河网讯 蜜雪冰城诠释着国民饮品的亲切感,河南博物院文创产品让厚重历史走入百姓日常生活,力量钻石折射出河南制造闪耀的科技光芒……12月5日
2025-12-05 12:12:00
“智”绘康养,AI上美味!看豫企如何玩“智”变
大河网讯(记者 刘高雅 王靖/文 杨鑫阳/图)12月5日,“供给焕新程 服务跃新阶——2025河南省新服务新供给品牌建设交流活动”在商丘市举行
2025-12-05 12:12:00
为提升团队惠民保展业能力,夯实业务根基,太湖人保财险成功开展新员工惠民保专项培训,各团队主管全程参与研讨推进,以多维度培训为全体坐席赋能
2025-12-05 12:40:00
解锁服务新玩法!河南品牌靠数智、跨界跑出加速度
大河网讯(记者 刘高雅 王靖/文 杨鑫阳/图)12月5日,“供给焕新程 服务跃新阶——2025河南省新服务新供给品牌建设交流活动”在商丘市举行
2025-12-05 13:13:00
文创爆品、网红奶茶齐出圈,河南新品牌如何撑起新供给?
大河网讯(记者 刘高雅 王靖/文 杨鑫阳/图)12月5日,“供给焕新程 服务跃新阶——2025河南省新服务新供给品牌建设交流活动”在商丘市举行
2025-12-05 13:13:00
在当前全球化格局深度调整与数字技术革命交汇的时代背景下,研究生国际联合培养模式的数字化转型,已成为国家教育战略的核心关切
2025-12-05 13:18:00