• 我的订阅
  • 头条热搜
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...“文心百中”。去年,阿里达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破。其中使用 512 卡 V100 GPU 实现全球最大规模 10 万亿参数多模态大模型 M6,同等参...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...或者语音的交互。这促使我们思考:如何构建具有更丰富模态的3D自主角色呢?要实现这个目标,主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息,并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多
...。AIGC不仅提升了新闻采编工作的效率与质量,还通过多模态、多渠道的新闻生产、整合、分发重塑新闻传播业态。AIGC助推报道效率与质量“双提升”AIGC在新闻报道中的应用体现在自动化内容生成和数据驱动的深度分析两个方面...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
高德地图首次将交通行业大模型应用于精细化治堵场景
...模型首次应用于城市交通精细化治理拥堵等场景,支持多模态指令(文字、语音、图像等)输入,超百种解决方案秒级生成。尤其在针对交通出行独有的分时段、分路段、分方式、分车型所造成的随机、开放、非线性等系统特性...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
...士、清华大学智能产业研究院院长张亚勤认为,首先是多模态;其次是人工智能大模型走向自主智能,可以进行目标制定、规划任务,自我制定路径、自我完成方案、自我编码等;第三则是边缘智能,现在大模型主要还是在云端...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...像/稀疏视角甚至一段文字描述中进行3D高斯重建,以支持实时渲染和沉浸式3D体验。对比实验团队从多个角度对比了新方法。从新视角生成来看,团队在Tanks-and-Temples,CO3D, RealEstate10K这三个真实世界数据集上与SOTA方法进行了定...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...,与之前extreme parkour, 使用 transformer 大大减少了处理多模态输入时控制模型架构的复杂度,如下图 8 所示。以往四足跑酷的相关工作使用复合架构,首先使用 ConvNet 将深度图处理成紧凑的潜在向量,然后使用循环骨干网络。 ...……更多
...大模型Soul X,该模型具备条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。同时,Soul正在围绕用户需求和社交场景推进“模应一体”落地。 ……更多
昆仑万维上半年收入25亿,AI应用加速落地,商业化成果显著
...。基座大模型侧,公司坚持技术创新,对文本大模型、多模态图文大模型、音乐大模型、3D大模型、视频大模型进行了全面升级,在性能上均达到行业领先水平,为用户带来前所未有的智能体验。AI应用侧,公司多款产品在全球...……更多
百度打通两大国民产品!六边形AI创作新物种「自由画布」来了
百度突然扔出了个AI创作界的Game Changer!一个由文心多模态大模型加持的万能白板,因为支持任何模态的素材输入,并能精准满足用户原始创作需求,被命名为「自由画布」。一切都在一块类似“空白画布”的界面上操作,只需...……更多
上海:加速实施“模塑申城”
...潮的特点是训练和推理的成本更低、模型能力更强以及多模态融合。其中,随着整体推理成本的降低,我们可以在相同硬件上部署更大、更通用的模型,这也是我们在产业落地上非常重要的关键点。”商汤科技产品总监、小浣熊...……更多
全面AIGC时代,豆包模型家族准备好了
...片、音乐、视频的AIGC全家桶共计13款模型,不断增加各类模态,并进入规模化调用时代。在4个月2次迭代的过程中,据火山引擎披露,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态...……更多
...性等特征,并在自然语言处理、视频生成、人机交互、多模态整合等方面取得了跨越性突破,被认为是强人工智能的“奇点”。可以预见,GAI将给各行各业带来结构性变革,民航业也不例外。民航是一个高度信息化且沉浸在大数...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
小米SU7前车识别功能除了识别车辆 还可以干啥
...别更加精准、功能更加丰富。同时,小米也会持续探索多模态大模型在各类产品上的应用落地,挖掘更多有趣的、好玩的功能,给用车生活带来更多惊喜互动,敬请期待。据了解,小米汽车的“前车识别”功能主要基于小米自研...……更多
齐鲁壹点“F4”亮相车展 速来AI互动展区详细了解
...海量的新闻行业大数据训练,加私域小数据微调,具有跨模态内容理解、多模态内容生成、私域数据解析、多轮人机对话等功能,数据安全可控,可高效便捷地帮助用户进行内容生产与传播,是为传媒行业量身打造的专属大语言...……更多
大模型到了该「验收」的时候
...最后,以Stable Diffusion为首的技术突破也使得大模型在多模态内容创作生成上表现极佳。抽取一下关键词:知识密集、自然语言、泛化与小样本、多模态内容创作。顺着大模型技术能力往下匹配,场景呼之欲出:知识管理、智能...……更多
...力物力。为解决这一高频结算场景难题,桂林银行依托多模态AI大模型,短短几秒便可完成收付款方账户信息、结算币种、金额等多项关键字段智能抓取。今年以来,国产AI大模型DeepSeek持续火爆。2月初,桂林银行积极响应自治...……更多
生成式AI收入增超2.5倍!商汤上半年减亏两成,总算力突破两万P
...来,商汤先后发布了日日新大模型的5.0及5.5两大版本,多模态能力全面加强,实时交互体验对标GPT-4o,同时还推出了云、端、边全栈大模型产品矩阵。商汤董事会执行主席兼CEO徐立27日在业绩会上再次强调了聚焦端侧,他表示该...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
华为影像未来十年十大发展趋势
...、后期编辑等高级功能,为作品增添了电影感。⑨多摄多模态,让影像超越人眼当下,华为Pura70系列手机可以实现35x微距变焦,让用户可以轻松探索微观宇宙中的奇妙景观。未来,华为手机将借助超微距能力、超光谱相机、新型...……更多
周睿:起跑要趁早
...自动驾驶、机器人等领域。迄今,周睿已经发表了多篇多模态AI研究和机器人领域的论文。读大一期间,周睿还到苹果公司实习。在那里,他见识到了硅谷顶尖的公司团队之间是怎么合作的,包括他们的工作方式——怎么创造产...……更多
高通在waic大会上展示了什么?
...和视觉助理大模型(LLaVA)。这是一个超过70亿参数的大型多模态语言模型(LMM),我们在与之对话的时候可以输入文本或者图像,或者其他多种类型的数据,可以就已经输入的图像与AI助手进行多轮对话。这款LMM能够在终端侧分析理...……更多
由厦门市人民政府主办的第五届中国人工智能大赛正式启动
...生成式人工智能技术快速发展,人工智能生成内容具有多模态、高品质、主题丰富等特点,迅速在多个领域得到广泛应用,但其潜在的滥用和版权等风险也受到国家高度重视。为应对风险,可通过在内容生成过程中添加显式水印...……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...化应用的标准化平台产品。通过集成大模型、虚拟人、多模态语音、知识库等技术,利用人机对话的交互方式,轻松完成展厅和展会的讲解互动,实现用户行为分析,精准定位商机。在团队碰头会场景,星火快答可通过问答快速...……更多
工商银行联合腾讯云发布《中国金融生成式AI多模态内容鉴伪与安全防御白皮书(2025)》
...,金融行业在加速迈向“AI原生”时代的同时,也面临多模态深度伪造内容带来的新型安全挑战。利用生成式AI合成的语音、图像、视频与文本,已能够高度模拟真实身份与业务材料,对远程开户、线上信贷、大额交易授权等核...……更多
更多关于科技的资讯:
“直播+平台+跨境”生态加速“杭州智造”货通全球杭州日报讯 近日,杭州综试区全球跨境电商产业基地在滨江阿里中心正式启动
2025-12-11 06:40:00
杭州具身智能机器人“加速起跑”
与未来共舞从图纸到现实,外骨骼机器人成为人类好帮手。患者使用外骨骼机器人进行康复训练。杭州日报讯 具身智能,正从实验室快速走向产业化
2025-12-11 07:11:00
坚定信心 勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事(五):关键设备共享为宁晋线缆带来什么
关键设备共享为宁晋线缆带来什么——河北特色产业集群共享智造故事(五)11月26日,位于宁晋县的缆芯高导(河北)科技有限公司共享车间
2025-12-10 08:07:00
厦门网讯(厦门日报记者 吴晓菁 通讯员 许佳琦 杨怡婷)昨日,厦门空港元翔货站跨境电商出口区一片忙碌景象,一辆辆满载货物的叉车来回穿梭
2025-12-10 08:38:00
警惕伪装成办公文件的木马病毒窃密 国家安全机关提示
中国网12月10日讯 据国家安全部微信公众号消息,国家安全部发布安全提示文章,“本月考勤公示”“年度放假安排”“高温补贴发放声明”等办公类文件
2025-12-10 08:41:00
清华、维信诺联合开发的pTSF技术破解OLED“不可能三角”,中国显示掌握关键材料主导权
屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 11:13:00
智能机器人大赛昌平收官 73支队伍四大赛道沉浸竞技 机器人实战化任务催生真实行业解决方案
本报讯(记者 张月朦)12月8日至9日,2025智能机器人大赛决赛在昌平举办。大赛设制造业类、康复养老类、安全应急类和创新类四大赛道
2025-12-10 14:14:00
研究揭示:人生黄金期在55-60岁,整体能力达顶峰
鲁网12月10日讯人们普遍认为,“年轻即巅峰”。然而,一项发表于国际权威心理学期刊《智力》的最新研究,彻底颠覆了这一传统认知
2025-12-10 16:21:00
鲁网12月10日讯山东移动临沂分公司坚决落实“以人民为中心”发展理念,强化“全心全意为人民服务”的宗旨意识,筑牢高质量发展生命线的服务方针
2025-12-10 16:24:00
潮评丨从独角兽榜单看浙江创新之势
全球独角兽企业数据库(Unicorn500)潮新闻讯 据央视新闻报道,近日,2025全球独角兽企业500强榜单发布,我国共有150家企业上榜
2025-12-10 16:24:00
大河网讯 (记者 李彤)大家好,我是水银体温计。我的时间,已经进入了倒计时。一直以来,我是每个家庭药箱里不可少的存在。我见证过无数滚烫的额头
2025-12-10 17:16:00
公益广告H5丨安全快门 快乐连拍
扫描二维码进入H5
2025-12-10 17:28:00
福州新闻网12月10日讯(记者 吴桦真)记者10日获悉,福州企业米多多集团股份有限公司正式向香港联交所递交招股说明书,拟主板上市
2025-12-10 18:02:00
大数据产业从“单点布局”迈向“生态闭环” 张家口数字经济拔节向上河北日报讯(郭晓通、王雯)“十四五”时期,张家口市把数字经济作为高质量发展的重要增长极
2025-12-10 18:34:00
QuestMobile报告:00后月活用户达1.79亿,闲鱼增速领跑移动购物行业
12月9日,第三方数据机构QuestMobile发布《2025“00后”用户消费洞察报告》,显示闲鱼00后月活跃用户规模达到4361万
2025-12-10 19:13:00