• 我的订阅
  • 头条热搜
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...训练数据,包括日韩等国外歌手和舞者的音舞数据。基于高质量数据和大算力模型训练,PARO已可实现文生舞、文生音、音生舞功能。具体而言,在PARO的文生动作功能中,用户输入简单的文字描述,即可快速生成高质量动态内容...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...日,是一个高保真图生视频框架,基于多粒度图像注入和高质量的数据集及训练策略,能够保持生成视频与给定参考图像之间的高保真度,同时实现丰富的运动强度和良好的时间一致性。项目主页:https://atomo-video.github.io/2、EasyA...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新,具体可参见技术报告。腾讯混元3D生成大模型则是业界首个同...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...领域大模型。这类模型专注于特定行业的需求,通过使用高质量的行业语料库进行训练,以实现对行业知识的深入理解和应用。浙江大学人工智能研究所所长、求是特聘教授、国家杰青获得者吴飞分享了智海系列垂直领域大模型...……更多
全国首个 成都创新团队发布机器人多模态模型
...新工程,成都今年初出台的《关于前瞻培育未来产业构筑高质量发展新动能的实施意见》《关于前瞻培育未来产业的政策措施》,也将人形机器人列为重点发展的未来产业之一。“作为目前国内唯一致力于研发‘真正拥有大脑的...……更多
...底,努力做到数据可控、框架可控、模型可控。加快建设高质量中文数据资源库。要在不断完善国家数据基础制度基础上,推动典型行业数据汇集、访问、共享、处理和使用,着力盘活数据资源存量;加强数据标准体系建设,提...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...、尽量减少对提示工程的需要,很多功能都是自动识别,一键触发,不需要什么学习成本。深度阅读功能就初步整合了多模态理解能力,上传一个论文PDF进去,生成的“精度”页面中不仅有文字总结,还能把相应的图表从文档里...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...向更复杂的动作、情感交互等方向探索。展望未来,结合高质量的交互能力将是未来数字人发展的重要方向。 腾讯混元大模型赋能AIGC应用落地 推进产业智能化升级 腾讯云大模型产品专家屈蕾 腾讯混元大模型历经迭代日趋...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不仅背景细致,还包含复杂的多角度镜头和富有情感的角色,并根据相应的物理原理在时空上向过去或未来推演。其在演示视频中展现出色的运动连...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...。通过文本描述或其他简单操作,AI视频工具即可生成较高质量和完成度视频内容,这降低了视频创作门槛,让业外人士能够精准用视频进行内容展现,有望广泛赋能各细分行业的内容生产降本增效和创意输出。国盛证券宋嘉吉...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...合「序列猴子」的强大文案生成能力以及「魔音工坊」的高质量语音合成技术,我们进一步强化了数字人的呈现效果,实现高度仿真的外观,同时还精心打造了生动的表情,媲美真人。综合来看,在WetaAvatar 4.0中,不论是数字人...……更多
视频大模型 快手美图殊途同归
...4月,生数科技联合清华大学发布的视频大模型Vidu,支持一键生成16秒、分辨率1080P的高清视频内容。6月初,生数科技宣布,已完成数亿元Pre-A轮融资,由百度、北京市人工智能产业投资基金领投,此前这家创业公司还获得了来自...……更多
Adobe神级AI视频媲美Sora!拖拽一键秒生大片,最强PS震撼设计圈
...芒。色彩温暖,阳光呈「魔幻时刻」(magic hour)风格。高质量,电影感。Adobe从很多业内人士那里了解到,如果能填补时间线上那些留待稍后添加视觉效果的空白,将大大加快工作流。这样,我们就不再需要使用「在此插入镜头...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...为拥有故事形态的作品,所想即所得。基于中文在线海量高质量正版中文网络文学图书、文献语料库,“中文逍遥”大模型已然成为中文创作领域“最能写”的AI助手。多:一张图片写一部小说创作是思考的过程。人类的思考载...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
...集的数据集将开源开放,用户可以免费下载;有意向互换高质量数据集的主体,可以参与构建数据池,合作共建、共享数据集;高价值数据集则通过数算一体模式,确保模型在加工、训练过程中,数据不出安全域,保障数据安全...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...,竟在视觉模型中体现出来了。至此,Vidu已不再仅仅是高质量、高效的视频生成器,在生成过程中融入上下文和记忆,无疑意味着视觉模态智能的大跨越。具备更强认知的视觉模型,将成为AGI的一块重要拼图。参考资料:https://...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...这意味着即便在资源有限的计算环境下,CogVideoX仍能生成高质量的视频内容,显著提升了其应用的可行性。如果说CogVideoX负责生成可视的动态内容,那么CogSound则赋予这些画面以听觉上的生命。CogSound是一种为无声视频自动生成...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视频片段,并将这些视频片段逐层插值得到最终的视频片段。这个工作引起脸书、谷歌...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...富的人工智能及图形学经验。VAST团队的目标是减少制作高质量3D资产和环境所需的专业知识和成本,使3D内容生成变得更加容易。3D大模型生成的内容通过集结来自全球顶级高校和技术大厂的团队,VAST在技术和数据方面取得了双...……更多
百度打通两大国民产品!六边形AI创作新物种「自由画布」来了
...读起来简单多了:这还没完,接下来还有重头戏——生成高质量长文。报告里的内容还可以继续编辑,现在不少办公软件有的润色、缩写、扩写等AI编辑功能在画布中也能直接操作。最后,当你的创作结束时,自由画布适配了当...……更多
更多关于科技的资讯:
江南时报讯 翩翩起舞、精准踢球、熟练做家务……多才多艺的机器人是外贸领域新焦点,而让机器人动作灵活起来的“秘密”则藏在一枚枚手掌大的谐波减速器里
2025-12-08 22:40:00
江南时报讯 “订单催得紧,就怕资金审批慢耽误生产,没想到泗洪农商银行的授信流程这么快!”泗洪县某服装加工小微企业负责人陈先生由衷点赞
2025-12-08 22:55:00
河北新闻网讯(闫丽颖、罗俊明)近日,开滦股份范各庄矿自主研发的“矿井提升机液压制动油温度自动调节装置”创新成果投入运行
2025-12-08 19:33:00
虎鲸文娱人才创作基地落户陵水,助力海归青年创作者“回家筑梦”
日前,第七届海南岛国际电影节“青椰计划”特别活动——虎鲸文娱集团旗下大麦娱乐“海纳圆桌对谈”在三亚举行。虎鲸文娱集团正式宣布
2025-12-08 13:54:00
平台默认勾选开启、强制关联支付软件、开通容易取消难……网络上,有关免密支付的“吐槽”层出不穷,反映出消费者对加强支付业务安全管理的迫切愿望
2025-12-08 12:30:00
新闻纵深·冀货出海新探索|平乡自行车童车:从“贴牌代工”到“骑向全球”
平乡自行车童车出口销量占国际市场的百分之四十从“贴牌代工”到“骑向全球”阅读提示平乡县,被誉为“中国童车之都”。在这里
2025-12-08 08:26:00
杭州市康复医院近日组织开展第34个国际残疾人日宣传教育活动。“杭州市智能仿生假肢适配服务基地”在本次活动上揭牌成立。未来将为肢体残疾人提供智能仿生假肢适配相关服务
2025-12-08 09:24:00
米连科技率先跑通新赛道,成实时视频情感社交重要实践者与引导者
当众多社交平台仍在探索可持续的商业模式时,米连科技通过将“视频社交+实时互动”作为产品核心,不仅成功开辟了新的市场空间
2025-12-08 09:24:00
国际人才嘉年华2025(秋季)盛大启幕丨科创动能全景绽放,多元机遇职引未来!
《2025年世界人才排名》显示,香港已跃居全球第四、亚洲首位,彰显了港府近期在人才引进与培育方面取得显著成效。港府推行的多项人才计划累计收到申请逾52万份
2025-12-08 10:24:00
“苏新消费·暖冬购物季”正式启动 苏宁易购这波精彩 很给“利”
12月5日,2025“苏新消费·暖冬购物季”正式启幕,本次购物季将持续至2026年3月。重点围绕十三地市“苏品苏货”,结合“双12”
2025-12-08 10:28:00
工行河北省分行:金融“活水”浇开智造之花 为科技自立自强蓄能加力
从7人团队起步,到现已成长为年营收超40亿元的全国电气百强企业,科林电气在智能电网领域成果斐然。工行河北省分行以源源不断的金融活水和与时俱进的智慧服务精准滴灌
2025-12-08 10:36:00
近期,民生银行张家口分行全面开展“金融护航·幸福养老”主题宣传活动,以专业服务赋能养老规划,以暖心举措守护金融安全。多维布局
2025-12-08 10:41:00
王涵不是戴上面具之后才能放飞自我,而是那个看似放飞的自我其实是面具的产物。对于社会交往而言,认为需要加入或取消某种媒介才能体验交往的快乐
2025-12-08 10:54:00
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00