• 我的订阅
  • 头条热搜
视频应用或有惊喜!微软高管透露将于下周推出GPT-4
...亚斯·布劳恩透露,微软将在下周推出GPT-4,它是一个多模态模型,可以处理文本、图像、音频和视频。他表示,大型语言模型(LLM)已经适用于几乎所有语言,可以在一种语言中提出问题,然后在另一种语言中得到答案。[#zolspl...……更多
开源证券:AI应用“更加好用且性价比更高”
...证券研报指出,近期AI大模型升级版本密集推出,除了多模态、长文本及Agent能力大幅提升之外,API成本大幅优化亦成为竞争的焦点,有望推动影视、音乐、教育、营销、搜索、办公各个领域的AI应用“更加好用且性价比更高”,...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会,在“人工智能+”主题馆吸引众多市民驻足围观体验。AI(人工智能)已经在深刻影响着我们的生活,也影响和改变着内容创作行业。作为在线音...……更多
长春“紫东长空”低空大模型正式发布
...布的“紫东长空”低空大模型,融合了“紫东太初3.0”多模态大模型的混合专家模型架构与深度推理能力,并针对国产化算力平台进行了深度优化,面向低空经济行业具备更加专业化、智能化、精细化的服务能力。具体来说具有...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进:1、引入超大规模数据处理系统,提升视频画质;2、采用多模态大语言模型(MLLM),...……更多
文化元宇宙四大共性技术打造沉浸式虚拟场景
...写实数字人资产数据,以及数字人动作表情数据,构建多模态大模型学习的数据库。此外,制作超写实数字人还需要自然语言对话系统和多模态数字人实时驱动与交互呈现系统。在姜文波看来,大场景3D扫描与重建是构建虚拟场...……更多
...具身基座模型—智元启元大模型,该模型框架由“VLM(多模态大模型)+MoE(混合专家)”组成,将集合采训推一体,小样本快速泛化、“一脑多形”的跨本体应用、持续进化、人类视频学习等能力。业内人士表示,具身智能在各大企...……更多
魔法原子人形机器人小麦新动态曝光 场景驱动人形机器人下一轮发展
...,参与活动开场、嘉宾对谈等主持环节,以世界领先的多模态交互能力掌控全场节奏。在AWE2025展台上,小麦在现场互动中获得大量围观,引爆了观众和媒体的关注,成为展会的顶流明星。软硬一体应对商业服务应用复杂场景 小...……更多
涂鸦智能×DeepSeek:多模态AI重塑宠物养护新范式
...AIoT平台与DeepSeek等AI大模型融合,通过自然语言处理、多模态场景感知等前沿技术,推动设备向“主动智能”升级,从而为AI应用的落地开辟了新路径。 【宠物养护场景】 (图片由AI生成)此次,《全球智能商业》便将聚焦“宠...……更多
ETF成交额创近四周新高,3只宽基ETF周成交额过百亿
...创近60日新高。在券商看来,当前海外科技巨头基于AI多模态大模型的竞争日趋激烈,或驱动大模型多模态底层能力不断突破,叠加GPTs的出现,AI应用有望迎来快速成长期,建议继续布局已开启商业化或将受益于AI多模态模型的游...……更多
全新的coloros15正式登场,新系统带来全面提升
...而OPPO的一键问屏功能却可以做到边看边说,实现同步多模态的交互。这就意味着用户在浏览内容时,可以立即询问或发出指令,AI能够实时响应,用户不再需要在不同模态之间来回切换操作。OPPO的目标是让AI助理像真人助理一样...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...搭载了国产 14nm 的边缘训推芯片Deep Edge10 Max,以及自研多模态大模型“云天天书”。陈宁在会上表示,离不开核心能力算法芯片化。而“深目”AI模盒的算力基础,来源于去年云天励飞推出的14nm Chiplet大模型训推芯片DeepEdge10 Max...……更多
...机、PC等,张雪薇看好相关产业链机遇。 大模型正在向多模态发展,由之前的文本、语音到现在的图片,包括未来视频,不同的媒介会诞生出新的应用,会把模型通用化能力提升,未来比如广告推荐、用户画像都会像大模型靠拢...……更多
...感知集群及AI集群,支持语音、手势、表情情感识别等多模态交互。海信集团宣布其自主研发的星海大模型接入DeepSeek。所有搭载该智能体的海信电视用户均可通过语音直接唤醒DeepSeek进行对话。海信集团相关负责人向记者介绍,...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
...全球多家科技公司发布新的大模型,它们在语义理解、多模态等方面进一步提升,人工智能(AI)的能力边界在不断扩大。随着无人驾驶、机器人等技术借助AI快速进化并逐步投入市场,不少国家通过推进法规建设、开展国际合...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...的。现在试想,如果上传的商品信息既能在文字、图像等模态上保持不变,又能够与文字、图片、视频等模态模型实现很好的融合,从而为商家产出AI商品图、海报、短视频,甚至是3D交互内容,这个市场需求是很大的。今年,...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而下一代的输入法...……更多
公路水路交通基础设施数字化转型升级,卓视智通准备好了
...012年成立以来就一直专注于交通视频识别及智能分析、多模态融合感知、多模态大模型等前沿技术的原创研发,并在智慧公路与交通基础设施数字化领域实现了广泛的应用落地,公司连续多年获评“AI+智慧交通”十大优秀企业、...……更多
上海码极客人工智能科技有限公司盛大开业 开启人工智能新篇章
...绿洲隆重举行。活动发布了公司最新产品——悠然视界全模态AI交互智能体。上海市副市长、闵行区委书记陈宇剑,闵行区委副书记、区长陈华文,同济大学党委常务副书记冯身洪,上海市文史研究馆馆长汪胜洋,上海市委组织...……更多
CHINC2024丨史文钊:大模型时代 神州医疗全面领跑医疗AI行业
...作为医疗大数据AI行业领军者,神州医疗依托大数据及多模态等核心技术,倾力打造神州医疗大模型。创新性地自主研发文本、影像、病理、精准4大模型支持的多模态大模型,赋能医疗领域多场景应用。同时,史文钊强调医学研...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
AI社交出海,商业前景几何?
...模式要素是互相关联的。”在王振龙看来,后续大模型多模态能力升级和更多的玩法创新有望驱动AI社交用户继续增长。而参考移动互联网发展经验,更强的用户黏性和使用时长有望赋予平台更强的用户变现能力。同时,也需要...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
全国首款情感大模型养老陪护机器人落地重庆
...融合了人工智能、云计算、AI心理学等前沿技术,运用多模态情感大模型,构建起了涵盖智能情感陪伴、数字素养提升、健康安全守护、娱乐休闲服务、生活辅助管理等5大模块10项功能的服务体系。“智慧养老情感陪护机器人”...……更多
更多关于科技的资讯:
从榨菜月饼到榨菜咖啡,乌江榨菜以创新打破品类边界
近年来,伴随区域化、特色化产品的迅速增长,各大品牌在深耕主业的同时也开始积极探索新赛道、新领域。乌江榨菜作为涪陵榨菜集团旗下的核心品牌
2025-09-29 08:03:00
华北首家!多美卡品牌专卖店登陆北京玩具反斗城
[北京] – 继中国首家多美卡品牌专卖店入驻玩具反斗城上海南丰城店并成功引爆小车收藏热潮后,玩具反斗城(Toys“R”Us)与多美(TAKARA TOMY)的战略合作再结硕果
2025-09-29 07:33:00
南报网讯(记者张甜甜)10月2日至3日,由南京报业传媒集团旗下南报优选供应链公司主办的首届紫金山国潮漫文化嘉年华,将在南京国际展览中心举办
2025-09-29 07:42:00
9月26日,购在中国(山西站)暨中石化易捷第八届易享节在我市启动,诸多三晋名特优产品将陆续入驻中石化易捷,走向全国。今后
2025-09-28 08:20:00
刚刚闭幕的长春航空展上,“净月号”成瞩目焦点
9月23日,长春航空展圆满闭幕,“净月号”凭借其震撼的实体造型与深厚的文化内涵,成为展会瞩目的焦点。这艘承载中式太空梦想的“星舰”
2025-09-28 10:07:00
为更好的服务广大客户,富德生命人寿安平支公司积极组织员工开展《产品健康增值服务》培训。培训中,讲师细致讲解公司产品健康增值服务
2025-09-28 10:12:00
河北新闻网讯(王丽英)9月24日至25日,宁晋县晶龙集团举行人力资源专业培训,内训师靳桂峰、王素峰和张晓宁分别围绕工伤保险及识人辨人
2025-09-28 10:18:00
美团Keeta上线阿联酋!40天连开3国,国际化全速推进
当地时间9月27日上午11点,美团旗下国际外卖品牌Keeta正式在阿联酋迪拜启动运营,这是Keeta继8月上线卡塔尔、9月上线科威特后
2025-09-28 10:22:00
小米17系列9月27日开售,卢伟冰称ProMax需求远超预期,已安排快速提拉生产
9月27日上午10点,小米17系列开售,价格4499元起!并全系首发第五代骁龙 8 至尊版。据悉,小米17尺寸6.3,7000mAh 电池
2025-09-28 10:22:00
齐鲁晚报·齐鲁壹点 王会广 通讯员 李杰在数字经济蓬勃发展的当下,大数据、云计算、物联网、移动互联网、人工智能以及区块链等新兴技术的广泛应用
2025-09-28 10:56:00
实时互动x高效制播:佳能携手《密室大逃脱大神版 互动直播》真人秀实现制作新范式
在直播与正片并行制作逐渐成为综艺内容生产新常态的当下,真人秀现场对影像系统的要求不断提升:既要满足直播的即时输出,又要兼顾正片制作的高质量成片
2025-09-28 11:51:00
齐鲁晚报·齐鲁壹点菏泽光影在线摄影摄像实战培训班11月初开启
从“拍摄小白”到“拍摄大神”,你只差这一套实战课!齐鲁晚报(光影在线实战培训)告别“自动挡”,用镜头讲故事。这是一个视觉统治注意力的时代
2025-09-28 12:03:00
烟台银行威海荣成支行“金融+”开辟服务新路径
近日,烟台银行荣成支行通过创新推出的“智慧物业”合作解决方案,成功为当地多家物业公司纾困解难,有效破解了长期困扰行业发展的收费难
2025-09-28 12:05:00
莫林酒店洛阳首店落子!完善文旅服务补中高端住宿
作为中国第一古刹,洛阳白马寺的文旅热度在 2025 年暑期再攀新高 —— 日均接待游客超 8000 人次,35 元亲民票价搭配免费斋饭政策
2025-09-28 12:22:00
国庆车票开抢第三天,在全网“开票即候补”的声音中,假期出行的火热程度可见一斑。而且今年又是一次中秋假期叠加国庆假期,连续八天假
2025-09-28 12:22:00