• 我的订阅
  • 头条热搜
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...oyunfeng@jiqizhixin.com本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...的突破?2024年2月16日凌晨,OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限,而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是,Sora较好地表现...……更多
火山引擎发布大模型训练视频预处理方案 已应用于豆包
10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经...……更多
生成式人工智能新时代
...角。 生成式AI是什么?张亚林介绍,文本、音频、图像、视频、游戏生成,跨模态、多模态的生成,虚拟人的生成等,都可以通过各种素材的生成进行互换,这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式AI大模型的发...……更多
...信达证券指出,受益于全球生成式 AI 持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效。多家A股公司披露视频生成模型领域的业务情况据不完全统计,包括万兴科技、博汇科技、当虹...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决...……更多
...成能力;(2)消费图片的生成和自动化修改能力;(3)视频内容自动生成及剪辑能力;(4)多模态输入理解能力;(5)从多模态中提炼情感倾向能力等。 ……更多
OpenAI CEO又创办了一家AI健康公司
...基础模型升级,新增首尾帧控制和镜头控制等功能,文生视频开放到10秒,同时可图开源。快手拥有包括可灵、可图、快意等在内的大模型矩阵,并搭建了数字人全流程AIGC服务,还在APP评论区上线了智能体“AI小快”。快手坚持...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...实现了质的飞跃。它不仅能够更精准地理解文本、图片、视频等传统模态,还能处理雷达、红外、遥感等新型模态数据,为物理世界的数字化呈现提供了更丰富的视角。在内容生成方面,盘古5.0能够生成符合物理世界规律的多模...……更多
百融云创荣获“2024大模型创新应用奖”
...环节中沉淀下大量数据,涵盖文本、表格、图片、音频和视频等多模态格式。知识库可以说是企业的“独家配方”,具有机密性、专业性和规模化的特点。知识库不仅是大模型发挥能力的核心“语料”,更是大模型真正在产业发...……更多
商汤徐立内部信:生成式大模型AI的普及和商业化需要降低生产和使用成本
...随着尺度定律(Scaling Law)在大语言模型、多模态模型、视频生成模型以及慢思考推理过程中得到验证,生产和使用大模型的成本可以直接等价于算力资源的消耗。简言之,生成式大模型AI的普及和商业化,需致力于降低大模型...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
记者 黄寿赓2月16日,OpenAI发布首个文生视频模型Sora,可快速制作长达一分钟的视频,由此引爆A股Sora概念,据同花顺数据,截至2月21日收盘,Sora概念累计涨幅达35.57%,安诺其、因赛集团等录得连板。概念“三连阳”的同时,个...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...多个实际场景中得到应用。例如,在游戏中为 NPC 配音,视频创作中进行方言配音等。通过这一技术,游戏和视频内容能够更加贴近地域文化,提升用户的沉浸感和体验感。未来,随着端到端语音交互大模型的进一步发展,这项...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...技术的发展方向。正如互联网时代从文字到图片、语音、视频的创作方式演变,未来AI时代人类与大模型的交互也一定不会局限于文字。借助“中文逍遥”大模型,中文创作者将更早获得无边界思想盛宴的快乐。任何作者都希望...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...而更长的上下文使模型处理的信息更多,例如长文档、长视频,这种能力同样为更多现实世界的应用程序提供了所需的功能。然而,目前面临的问题是一些工作已经启用了长上下文视觉语言模型(VLM),但通常是采用简化的方法...……更多
高通aihub正式发布:支持75个ai模型
...以为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。开发者只需选择应用所需的模型以及其开发应用所使用的框架,然后确定目标平台,例如一款特定型号的手机、或者...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...界,就需要将各种模态能力打通,例如文本-图像、文本-视频等跨模态甚至全模态的综合能力。再往后发展,AI将从虚拟的世界里走向真实的世界。AI能够进入真实的世界,捕捉真实世界的各个场景的和和视频音频等等的和人交互...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以...……更多
天风证券:视频AIGC加速突破 多模态应用发展正当时 【天风证券:视频AIGC加速突破 多模态应用发展正当时】财联社12月4日电,天风证券表示,文生视频是一个年轻的方向,该领域面临多方面的挑战,包括高算力成本、缺乏高质...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...AIHub为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。 在使用高通AIHub时,开发者可以选择所需的大模型,例如Baichuan-7B,然后可以选择开发应用所使用的框架,例如例...……更多
齐鲁壹点“F4”亮相车展 速来AI互动展区详细了解
...使用的数字分身,为创作者提供AI帮写、AI作画、图文转视频等多种AIGC服务,零门槛创作数字人视频。3D数字人平台可按需求进行形象3D建模,借助全身动作捕捉设备和虚拟形象驱动平台,实时驱动实现数字人在各场景下的灵活应...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...维度,MultiTrust构建了32个多样的任务场景,覆盖了判别和生成任务,跨越了纯文本任务和多模态任务。任务对应的数据集不仅基于公开的文本或图像数据集进行改造和适配,还通过人工收集或算法合成构造了部分更为复杂和具有...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...学习技术优势,实现了医学影像诊断与诊疗意见的多模态生成功能,能提供糖尿病视网膜病变辅助诊断结果及个性化糖尿病综合管理意见。该系统在覆盖亚非欧三大区域七个国家的多中心队列中进行了回顾性验证,以及针对中国...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
文|王怡宁编辑|尚恩最近AI视频赛道大火,Pika推出1.0版本,并宣布融资千万美金,出尽风头。而作为AI视频生成的老大哥,现象级产品Gen-1、Gen-2的开发商Runway突然宣布组建团队开发通用世界模型(General World Models,以下简称GWM...……更多
中国首个高一致性、高动态性视频大模型发布
...学联合生数科技正式发布了中国首个高一致性、高动态性视频大模型Vidu。从放出的视频来看,Vidu生成的视频效果非常惊艳,在一致性、运动幅度等方面已经达到了Sora的水准,虽然比不上Sora的时长,但整体上已经可以对标Sora。V...……更多
北大、快手开源视频生成模型Pyramid Flow,1分钟生成5秒视频
...学和快手科技在本周联合开源了一款名为Pyramid Flow的高清视频生成模型。Pyramid Flow能根据文本描述制作长达10秒、分辨率为1280×768、每秒24帧的视频。Pyramid Flow采用了金字塔流匹配算法,优化了视频生成的效率和质量。这一算法...……更多
视频大模型Vidu发布3个月后正式全球上线 记者实测
7月30日,曾于3个月前亮相中关村论坛的AI生成视频大模型Vidu正式上线,开放给全球用户使用。Vidu是文生视频大模型Sora爆火之后,国内最早号称要“对标Sora”的大模型。4月27日,在中关村论坛未来人工智能先锋论坛上,清华大...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...临的主要挑战。一、从基础设施、工具链到AI应用,构建生成式AI完整技术栈陈晓建首先解读了AWS的生成式AI技术栈。目前,AWS在基础设施层面提供GPUs、自研Trainium芯片、Nitro系统等底层设施,在大模型构建工具层面提供大模型托...……更多
百度世界2023剧透丨百度将发布国内首个生成式商业智能产品
...行业专业知识,让它成为行业专家。 百度网盘再升级,视频里找东西提炼金句样样通“AI时代的网盘,已经不再聚焦文件中转或存储,”百度智能云网盘产品部总经理吴天昊表示,“而是进一步迈向个人与企业的知识管理,实...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
... 刘阿龙10月24日下午,2023年科大讯飞全球1024开发者节“生成式AI输入法论坛”拉开帷幕。讯飞输入法总经理程坤、科大讯飞AI研究院副院长丁克玉、讯飞输入法产品总监赵明路、讯飞输入法内容生态总监卢洁分别作主题演讲。本...……更多
更多关于科技的资讯:
国产超大规模智算平台“飞星二号”将在今年交付使用首批算力
大皖新闻讯 1月25日,科大讯飞董事长刘庆峰在公司年会现场透露了“飞星二号”的最新进展,表示该平台的首批算力将在2025年交付使用
2025-01-25 22:56:00
李楠点评iPhone 17系列:除了薄没什么意思
快科技1月25日消息,李楠发微博表示,iPhone 17系列不是unibody(一体成型),除了薄没什么意思。此前有博主爆料
2025-01-25 23:05:00
北京佛爷顶开始飘雪花了:今天夜间和明天有降雪
1月25日消息,据气象部门消息,1月25日20时20分降雪开始影响北京西部山区,延庆佛爷顶开始下雪了,近一小时降雪量不足1毫米
2025-01-25 23:05:00
余承东展示科幻一幕:智界新S7自己开过来接他
快科技1月25日消息,今天华为余承东展示了鸿蒙智行强大的智能驾驶功能之一——泊车代驾。视频中,余承东在手机APP上打开这一功能
2025-01-25 19:35:00
三星S25 Ultra在3DMark测试中击败iPhone 16 Pro Max:领先幅度达36%
快科技1月25日消息,三星Galaxy S25 Ultra在3DMark的Steel Nomad Light基准测试中以36%的领先优势击败了苹果iPhone 16 Pro Max
2025-01-25 19:35:00
首发自研芯片 谷歌Pixel 11系列曝光:4剑齐发
快科技1月25日消息,据报道,谷歌将在2026年下半年推出4款Pixel 11系列机型,包含Pixel 11、Pixel 11 Pro
2025-01-25 20:05:00
超百家企业参加新年浙江首批拓市场增订单团组 “千团万企”收获了什么
拓市场,增订单,新年首个工作日,浙江外贸已“开跑”。1月2日下午,浙江省2025年“千团万企拓市场增订单”行动正式启动
2025-01-25 20:17:00
小屏之王!三星Galaxy S25预售:尝鲜价6499元
快科技1月25日消息,三星将在2月11日发布Galaxy S25系列国行版,这次三星同时推出了Galaxy S25、Galaxy S25+和Galaxy S25 Ultra三款机型
2025-01-25 20:35:00
看好自己的物品!南京南站4天捡到1000个身份证
1月25日消息,据媒体报道,南京南站的遗失物品招领处引发关注。据了解,南京南站专门开辟了一个位置用于存放旅客遗失的物品
2025-01-25 20:35:00
零售商员工公然变黄牛!2倍价格倒卖RTX 5090
快科技1月25日消息,RTX 5090/5090D已经性能解禁,很快就会上市,这次供货之紧张绝对前所未有,比如英国顶级零售商OCUK就透露
2025-01-25 20:35:00
春节机票跳水!多条航线大降价:部分跌至百元
快科技1月25日消息,据报道,春节前夕,多条航线降价,部分航线低至百元。去哪儿数据显示,如天津-上海裸票价格最低145元
2025-01-25 20:35:00
最新爆料:苹果调动善战老将整顿AI业务 期盼能打翻身仗
知名科技爆料人马克·古尔曼周五表示,面对AI项目的现状,苹果公司决定先从人事问题下手。知情人士透露,擅长整顿“问题产品”和推动重大项目上市的项目管理副总裁金·沃拉斯(Kim Vorrath)
2025-01-25 21:05:00
中国台湾台南市再发5.1级地震:福建多地有震感 之前致台积电6万块晶圆报废
据中国地震台网正式测定,1月25日19时49分,在台湾台南市(北纬23.31度,东经120.46度)发生5.1级地震,震源深度11千米
2025-01-25 21:05:00
73岁喜当爹!张纪中哄四胎女儿睡觉引围观:网友直呼老当益壮
1月25日消息,近日,杜星霖在网上分享了张纪中哄娃睡觉的视频,引起了不少网友的讨论。张纪中在美国家中哄四胎女儿睡觉,尽管他已73岁
2025-01-25 21:05:00
男子学狗语驯狗:一开口就被咬穿脸
1月25日消息,据媒体报道,胡先生学习说狗语,跟家里的宠物犬交流,没想到刚一开口就被狗咬了。据了解,胡先生家的宠物狗是一条阿拉斯加犬
2025-01-25 21:35:00