• 我的订阅
  • 头条热搜
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...oyunfeng@jiqizhixin.com本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决...……更多
...信达证券指出,受益于全球生成式 AI 持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效。多家A股公司披露视频生成模型领域的业务情况据不完全统计,包括万兴科技、博汇科技、当虹...……更多
OpenAI CEO又创办了一家AI健康公司
...基础模型升级,新增首尾帧控制和镜头控制等功能,文生视频开放到10秒,同时可图开源。快手拥有包括可灵、可图、快意等在内的大模型矩阵,并搭建了数字人全流程AIGC服务,还在APP评论区上线了智能体“AI小快”。快手坚持...……更多
生成式人工智能新时代
...角。 生成式AI是什么?张亚林介绍,文本、音频、图像、视频、游戏生成,跨模态、多模态的生成,虚拟人的生成等,都可以通过各种素材的生成进行互换,这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式AI大模型的发...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
记者 黄寿赓2月16日,OpenAI发布首个文生视频模型Sora,可快速制作长达一分钟的视频,由此引爆A股Sora概念,据同花顺数据,截至2月21日收盘,Sora概念累计涨幅达35.57%,安诺其、因赛集团等录得连板。概念“三连阳”的同时,个...……更多
...成能力;(2)消费图片的生成和自动化修改能力;(3)视频内容自动生成及剪辑能力;(4)多模态输入理解能力;(5)从多模态中提炼情感倾向能力等。 ……更多
华为harmonyosnext重塑全新“星盾”安全架构
...实现了质的飞跃。它不仅能够更精准地理解文本、图片、视频等传统模态,还能处理雷达、红外、遥感等新型模态数据,为物理世界的数字化呈现提供了更丰富的视角。在内容生成方面,盘古5.0能够生成符合物理世界规律的多模...……更多
百融云创荣获“2024大模型创新应用奖”
...环节中沉淀下大量数据,涵盖文本、表格、图片、音频和视频等多模态格式。知识库可以说是企业的“独家配方”,具有机密性、专业性和规模化的特点。知识库不仅是大模型发挥能力的核心“语料”,更是大模型真正在产业发...……更多
商汤徐立内部信:生成式大模型AI的普及和商业化需要降低生产和使用成本
...随着尺度定律(Scaling Law)在大语言模型、多模态模型、视频生成模型以及慢思考推理过程中得到验证,生产和使用大模型的成本可以直接等价于算力资源的消耗。简言之,生成式大模型AI的普及和商业化,需致力于降低大模型...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...多个实际场景中得到应用。例如,在游戏中为 NPC 配音,视频创作中进行方言配音等。通过这一技术,游戏和视频内容能够更加贴近地域文化,提升用户的沉浸感和体验感。未来,随着端到端语音交互大模型的进一步发展,这项...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...超过70万次,在线可用的演示程序也已帮助用户在图像和视频数据中分割了数十万个物体,并且在跨学科(包括医学图像、气象学等研究)中产生了巨大的影响。 本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重,性能更强。...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...而更长的上下文使模型处理的信息更多,例如长文档、长视频,这种能力同样为更多现实世界的应用程序提供了所需的功能。然而,目前面临的问题是一些工作已经启用了长上下文视觉语言模型(VLM),但通常是采用简化的方法...……更多
...景、提升体验,为用户带来幸福感和归属感。”全双工音视频通话能力探索,实现真正“有温度”的人机交互2025年,当技术积累逐渐成熟,“AI应用爆发”成为共识。在人工智能席卷各行业过程中,一个核心关注点在于,“AI+”为每个个...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...体发挥创意,利用 GLM-4V-Flash 开发出更多图像理解、内容生成相关的创新应用,共同丰富和拓展大模型的应用生态!体验中心:https://www.bigmodel.cn/console/trialcenter说明文档:https://www.bigmodel……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...技术的发展方向。正如互联网时代从文字到图片、语音、视频的创作方式演变,未来AI时代人类与大模型的交互也一定不会局限于文字。借助“中文逍遥”大模型,中文创作者将更早获得无边界思想盛宴的快乐。任何作者都希望...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以...……更多
天风证券:视频AIGC加速突破 多模态应用发展正当时 【天风证券:视频AIGC加速突破 多模态应用发展正当时】财联社12月4日电,天风证券表示,文生视频是一个年轻的方向,该领域面临多方面的挑战,包括高算力成本、缺乏高质...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。再往后发展,AI将从虚拟的世界里走向真实的世界。AI能够进入真实的世界,捕捉真实世界的各个场景的和和视频音频等等的和人交互...……更多
浪潮数字企业三款大模型产品入选济南市首批人工智能大模型推荐名录
...合并解析项目施工过程中涉及表格、文本、设计图纸、音视频等在内的多模态数据,支撑铁路工程施工知识进一步加工、梳理,进一步强化工程项目施工的标准与规范。浪潮海岳矿山大模型主要面向矿山场景下全过程智能化管理...……更多
谷歌发力世界模型:从OpenAI挖来Sora核心负责人!
...了解,该团队的负责人是蒂姆·布鲁克斯,他此前是OpenAI视频生成器Sora的联合负责人之一,后于2024年10月离开OpenAI,跳槽至谷歌的人工智能研究实验室谷歌DeepMind。据蒂姆·布鲁克斯在社交媒体X上的最新发帖透露,他领导的这个...……更多
活力中国调研行|好用好玩!AI点亮百姓生活
...生成”的AI魔法:上传一张产品图,即可自动生成广告短视频;输入一句描述,即可生成创意图片和短视频;选好一款虚拟职业装,再自拍一下,即可生成卡通形象照……7月2日,在智象未来(合肥)信息技术有限公司,一名参...……更多
高通aihub正式发布:支持75个ai模型
...以为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。开发者只需选择应用所需的模型以及其开发应用所使用的框架,然后确定目标平台,例如一款特定型号的手机、或者...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是一个重要的里程碑」!现已可在官网上体验Le Chat的使用。体验地址:h...……更多
齐鲁壹点“F4”亮相车展 速来AI互动展区详细了解
...使用的数字分身,为创作者提供AI帮写、AI作画、图文转视频等多种AIGC服务,零门槛创作数字人视频。3D数字人平台可按需求进行形象3D建模,借助全身动作捕捉设备和虚拟形象驱动平台,实时驱动实现数字人在各场景下的灵活应...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...AIHub为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。 在使用高通AIHub时,开发者可以选择所需的大模型,例如Baichuan-7B,然后可以选择开发应用所使用的框架,例如例...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
文|王怡宁编辑|尚恩最近AI视频赛道大火,Pika推出1.0版本,并宣布融资千万美金,出尽风头。而作为AI视频生成的老大哥,现象级产品Gen-1、Gen-2的开发商Runway突然宣布组建团队开发通用世界模型(General World Models,以下简称GWM...……更多
中国首个高一致性、高动态性视频大模型发布
...学联合生数科技正式发布了中国首个高一致性、高动态性视频大模型Vidu。从放出的视频来看,Vidu生成的视频效果非常惊艳,在一致性、运动幅度等方面已经达到了Sora的水准,虽然比不上Sora的时长,但整体上已经可以对标Sora。V...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...维度,MultiTrust构建了32个多样的任务场景,覆盖了判别和生成任务,跨越了纯文本任务和多模态任务。任务对应的数据集不仅基于公开的文本或图像数据集进行改造和适配,还通过人工收集或算法合成构造了部分更为复杂和具有...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...学习技术优势,实现了医学影像诊断与诊疗意见的多模态生成功能,能提供糖尿病视网膜病变辅助诊断结果及个性化糖尿病综合管理意见。该系统在覆盖亚非欧三大区域七个国家的多中心队列中进行了回顾性验证,以及针对中国...……更多
更多关于科技的资讯:
清华大学安徽校友会AI大数据专委会揭牌
大皖新闻讯 11月20日,清华大学安徽校友会AI大数据专委会揭牌仪式暨人工智能前沿洞察与产业创新论坛在中国视界举行。人工智能是安徽省十大战略性新兴产业之一
2025-11-21 12:23:00
中新经纬11月21日电 据中消协网站21日消息,近日,有媒体曝光了一批盗版剧APP,这些APP不仅盗用大量剧集资源,更会窃取用户个人隐私信息
2025-11-21 12:37:00
“消失的法老”回来了!“BesTV上海博物馆”今天上线 计划实现上海电视用户全覆盖
11月18日,“廿念不忘,帧帧日上——百视通成立20周年分享会”在国际会议中心举行。作为20周年重磅发布之一,由百视通与上海博物馆联合打造的“BesTV上海博物馆”产品正式亮相并登陆上海移动高清电视
2025-11-20 08:06:00
入住4年仍甲醛超标!福建卫视《现场》探访实录,解码智能门的健康升级路径
近日,福州居然之家王力安防门店迎来了一位特别的客人——消费者丁先生专程送来一面写有“贴心服务暖人心,智能监测护健康”的锦旗
2025-11-20 08:06:00
厦门网讯(厦门日报记者 林露虹) 近日,专注于毫米波雷达芯片研发的厦企——矽杰微电子(厦门)有限公司(简称“矽杰微电子”)完成C1轮增资
2025-11-20 08:29:00
厦门围绕“金鸡”品牌 在影视产业链上持续发力
陈铎(中)指导员工进行《活宝档案》动画制作。海丝(厦门)电影工业产业基地施工现场。 厦门网讯(文/图 厦门日报记者 邬秀君)走进位于软件园一期的继来之(厦门)人工智能研究院有限公司
2025-11-20 08:30:00
记者走基层|集装箱“搬上”无人车 解锁配送新技能
11月1日,在廊坊座头鲸科技有限公司智能制造基地,工作人员对蓝丁智能无人配送车底盘进行性能测试。 河北日报记者 刘 杰摄11月1日清晨
2025-11-20 08:49:00
破局之法,精耕之道 《精耕者访谈》第三季·区域之王重磅开启!
11月18日,由蓝河乳业独家冠名的《精耕者访谈》第三季·区域之王正式启动。作为母婴行业首个高端访谈栏目,其始终着眼于市场一线
2025-11-20 09:06:00
北京博大健康体检管理中心盛大启幕 以“科技+精准”重新定义健康管理新标杆
11月18日上午,北京博大健康体检管理中心(简称“博大体检”或“中心”)在京举行开业典礼,正式落地北京经济技术开发区南海绿茵国际园区
2025-11-20 09:06:00
以儿童为本——赖园青的幼儿教育科学实践之路
在人工智能与教育深度融合的浪潮中,如何让技术真正服务于幼儿认知发展?上海浦东新区民办普瑞姆幼儿园园长赖园青用贯穿理论与实践的智慧教育探索
2025-11-20 10:06:00
山东移动招远分公司秋冬宽带服务义诊暖心启动 专业服务守护数字生活
胶东在线11月19日讯(通讯员王少娜徐冰鑫)秋冬时节,居民居家上网需求激增,网络卡顿、信号盲区、设备老化等问题更易影响用户使用体验
2025-11-20 10:17:00
四梯科技重磅发布智能产业工程师证书项目 推动教育科技人才一体化发展
2025年11月14日,在深圳第二十七届中国国际高新技术成果交易会第二届产教融合与科教融汇论坛上,北京四梯科技有限公司(以下简称“四梯科技”)首次面向社会正式发布“四梯智能产业工程师证书项目”(4T SIEC)
2025-11-20 11:37:00
一屏承古韵,元景越千年!联通数智重构文博文创新范式的野望
11月17日,“中华文明起源系列——‘看·见殷商’”展览总结暨博物馆高质量发展研讨会在北京大运河博物馆举行。会上回顾了“看·见殷商”展览的创新实践
2025-11-20 12:07:00
名创优品斩获国际零售地产大奖MAPIC 2025\
在法国戛纳举办的 2025 年全球零售商业地产峰会大奖(MAPIC Awards)中,名创优品凭借其MINISO LAND战略级店态
2025-11-20 14:38:00