• 我的订阅
  • 头条热搜
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...oyunfeng@jiqizhixin.com本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决...……更多
...信达证券指出,受益于全球生成式 AI 持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效。多家A股公司披露视频生成模型领域的业务情况据不完全统计,包括万兴科技、博汇科技、当虹...……更多
OpenAI CEO又创办了一家AI健康公司
...基础模型升级,新增首尾帧控制和镜头控制等功能,文生视频开放到10秒,同时可图开源。快手拥有包括可灵、可图、快意等在内的大模型矩阵,并搭建了数字人全流程AIGC服务,还在APP评论区上线了智能体“AI小快”。快手坚持...……更多
生成式人工智能新时代
...角。 生成式AI是什么?张亚林介绍,文本、音频、图像、视频、游戏生成,跨模态、多模态的生成,虚拟人的生成等,都可以通过各种素材的生成进行互换,这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式AI大模型的发...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
记者 黄寿赓2月16日,OpenAI发布首个文生视频模型Sora,可快速制作长达一分钟的视频,由此引爆A股Sora概念,据同花顺数据,截至2月21日收盘,Sora概念累计涨幅达35.57%,安诺其、因赛集团等录得连板。概念“三连阳”的同时,个...……更多
...成能力;(2)消费图片的生成和自动化修改能力;(3)视频内容自动生成及剪辑能力;(4)多模态输入理解能力;(5)从多模态中提炼情感倾向能力等。 ……更多
华为harmonyosnext重塑全新“星盾”安全架构
...实现了质的飞跃。它不仅能够更精准地理解文本、图片、视频等传统模态,还能处理雷达、红外、遥感等新型模态数据,为物理世界的数字化呈现提供了更丰富的视角。在内容生成方面,盘古5.0能够生成符合物理世界规律的多模...……更多
百融云创荣获“2024大模型创新应用奖”
...环节中沉淀下大量数据,涵盖文本、表格、图片、音频和视频等多模态格式。知识库可以说是企业的“独家配方”,具有机密性、专业性和规模化的特点。知识库不仅是大模型发挥能力的核心“语料”,更是大模型真正在产业发...……更多
商汤徐立内部信:生成式大模型AI的普及和商业化需要降低生产和使用成本
...随着尺度定律(Scaling Law)在大语言模型、多模态模型、视频生成模型以及慢思考推理过程中得到验证,生产和使用大模型的成本可以直接等价于算力资源的消耗。简言之,生成式大模型AI的普及和商业化,需致力于降低大模型...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...多个实际场景中得到应用。例如,在游戏中为 NPC 配音,视频创作中进行方言配音等。通过这一技术,游戏和视频内容能够更加贴近地域文化,提升用户的沉浸感和体验感。未来,随着端到端语音交互大模型的进一步发展,这项...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...超过70万次,在线可用的演示程序也已帮助用户在图像和视频数据中分割了数十万个物体,并且在跨学科(包括医学图像、气象学等研究)中产生了巨大的影响。 本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重,性能更强。...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...而更长的上下文使模型处理的信息更多,例如长文档、长视频,这种能力同样为更多现实世界的应用程序提供了所需的功能。然而,目前面临的问题是一些工作已经启用了长上下文视觉语言模型(VLM),但通常是采用简化的方法...……更多
...景、提升体验,为用户带来幸福感和归属感。”全双工音视频通话能力探索,实现真正“有温度”的人机交互2025年,当技术积累逐渐成熟,“AI应用爆发”成为共识。在人工智能席卷各行业过程中,一个核心关注点在于,“AI+”为每个个...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...体发挥创意,利用 GLM-4V-Flash 开发出更多图像理解、内容生成相关的创新应用,共同丰富和拓展大模型的应用生态!体验中心:https://www.bigmodel.cn/console/trialcenter说明文档:https://www.bigmodel……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...技术的发展方向。正如互联网时代从文字到图片、语音、视频的创作方式演变,未来AI时代人类与大模型的交互也一定不会局限于文字。借助“中文逍遥”大模型,中文创作者将更早获得无边界思想盛宴的快乐。任何作者都希望...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以...……更多
天风证券:视频AIGC加速突破 多模态应用发展正当时 【天风证券:视频AIGC加速突破 多模态应用发展正当时】财联社12月4日电,天风证券表示,文生视频是一个年轻的方向,该领域面临多方面的挑战,包括高算力成本、缺乏高质...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。再往后发展,AI将从虚拟的世界里走向真实的世界。AI能够进入真实的世界,捕捉真实世界的各个场景的和和视频音频等等的和人交互...……更多
浪潮数字企业三款大模型产品入选济南市首批人工智能大模型推荐名录
...合并解析项目施工过程中涉及表格、文本、设计图纸、音视频等在内的多模态数据,支撑铁路工程施工知识进一步加工、梳理,进一步强化工程项目施工的标准与规范。浪潮海岳矿山大模型主要面向矿山场景下全过程智能化管理...……更多
谷歌发力世界模型:从OpenAI挖来Sora核心负责人!
...了解,该团队的负责人是蒂姆·布鲁克斯,他此前是OpenAI视频生成器Sora的联合负责人之一,后于2024年10月离开OpenAI,跳槽至谷歌的人工智能研究实验室谷歌DeepMind。据蒂姆·布鲁克斯在社交媒体X上的最新发帖透露,他领导的这个...……更多
活力中国调研行|好用好玩!AI点亮百姓生活
...生成”的AI魔法:上传一张产品图,即可自动生成广告短视频;输入一句描述,即可生成创意图片和短视频;选好一款虚拟职业装,再自拍一下,即可生成卡通形象照……7月2日,在智象未来(合肥)信息技术有限公司,一名参...……更多
高通aihub正式发布:支持75个ai模型
...以为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。开发者只需选择应用所需的模型以及其开发应用所使用的框架,然后确定目标平台,例如一款特定型号的手机、或者...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是一个重要的里程碑」!现已可在官网上体验Le Chat的使用。体验地址:h...……更多
齐鲁壹点“F4”亮相车展 速来AI互动展区详细了解
...使用的数字分身,为创作者提供AI帮写、AI作画、图文转视频等多种AIGC服务,零门槛创作数字人视频。3D数字人平台可按需求进行形象3D建模,借助全身动作捕捉设备和虚拟形象驱动平台,实时驱动实现数字人在各场景下的灵活应...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...AIHub为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。 在使用高通AIHub时,开发者可以选择所需的大模型,例如Baichuan-7B,然后可以选择开发应用所使用的框架,例如例...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
文|王怡宁编辑|尚恩最近AI视频赛道大火,Pika推出1.0版本,并宣布融资千万美金,出尽风头。而作为AI视频生成的老大哥,现象级产品Gen-1、Gen-2的开发商Runway突然宣布组建团队开发通用世界模型(General World Models,以下简称GWM...……更多
中国首个高一致性、高动态性视频大模型发布
...学联合生数科技正式发布了中国首个高一致性、高动态性视频大模型Vidu。从放出的视频来看,Vidu生成的视频效果非常惊艳,在一致性、运动幅度等方面已经达到了Sora的水准,虽然比不上Sora的时长,但整体上已经可以对标Sora。V...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...维度,MultiTrust构建了32个多样的任务场景,覆盖了判别和生成任务,跨越了纯文本任务和多模态任务。任务对应的数据集不仅基于公开的文本或图像数据集进行改造和适配,还通过人工收集或算法合成构造了部分更为复杂和具有...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...学习技术优势,实现了医学影像诊断与诊疗意见的多模态生成功能,能提供糖尿病视网膜病变辅助诊断结果及个性化糖尿病综合管理意见。该系统在覆盖亚非欧三大区域七个国家的多中心队列中进行了回顾性验证,以及针对中国...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00