• 我的订阅
  • 头条热搜
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
微软机器学习模型专利曝光:可创作逼真头像
11月16日消息,微软的一项新专利于当地时间周二在美国专利商标局网站上公开,这是一种新的机器学习模型专利,可为用户创作出“更加有生命力”的逼真头像。据介绍,通过新的机器学习模型,头像或照片可针对细节部分进...……更多
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来|钛媒体AGI
...数十名员工已加入苹果的AI部门。苹果推出300亿参数MM1多模态大模型在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,苹果正式公布自家的多模态大模型研究成果。这是一个具……更多
微软正研发面部照明AI技术:视频时可自动调整屏幕亮度
快科技8月14日消息,据媒体报道,微软正致力于一项创新性的面部照明技术研发,旨在视频会议场景中自动优化屏幕亮度,为用户带来前所未有的视觉体验。这项技术的核心在于智能调节,确保每位参与者的面部在会议中都能...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
...提供标准化交互方式不同的AI技术,该技术利用声音等多模态数据,结合每位用户的特征来创建对应的账号文件,以更加个性化地响应和反馈用户需求。据了解,该专利适用于多用户办公等环境,能够差异化满足不同用户的需求...……更多
微软修改azure人工智能行为准则
5月8日消息,微软似乎并不希望执法部门利用AzureOpenAI进行实时面部识别,该公司最近修改了其有关警方使用人工智能服务的行为准则。图源Pixabay注意到,执法机构近年来越来越多地采用人工智能技术。例如,军警技术供应商Axo...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;
...定义GPTs服务,以及其他新功能和API,如Assistants API和新的模态API。百家号宣布“AI笔记”功能将下线百度百家号将于2023年11月30日下线其创作工具平台的“AI笔记”功能,但其他功能不受影响,创作者可以继续使用。 xAI推出PromptI...……更多
微软推出全新vasa-1模型
4月19日消息,微软亚洲研究院(MicrosoftResearchAsia)近日发表论文,介绍了全新的VASA-1模型,用户只需要提供一张静态肖像图片和一段语音音频片段,该模型就能自动让图片中的人物自动说话。VASA-1特别有趣的地方在于,它能够...……更多
微软win1123h2更新中已整合copilotai功能
...和提供标准化交互的传统AI模型不同,可以基于声音等多模态数据,结合每位用户的特征来创建对应的账号文件,可以更加个性化地响应和反馈用户需求。这项专利适合拥有多名用户的办公等环境下,可以区分不同用户的需求,...……更多
谷歌发博文介绍vloggerai模型可让人物“动起来”
...表情地朗读音频内容。VLOGGERAI是一种适用于虚拟肖像的多模态Diffusion模型,使用MENTOR数据库进行训练,该数据库中包含超过80万名人物肖像,以及累计超过2200小时的影片,从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...或者语音的交互。这促使我们思考:如何构建具有更丰富模态的3D自主角色呢?要实现这个目标,主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息,并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多
Cyan 青心意创“全面拟人”机器人 Orca Ⅰ 发布
...器人视觉观测和自身状态向量输出运动轨迹,将端到端多模态模型置于模仿学习框架下,并结合数据回收系统,让机器人具备拟人的双臂操作能力。Cyan 青心意创表示,OrcaⅠ 从操作模型、多模态处理能力、数据及传感器等方方...……更多
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均显著提升。星火语音大模型、星火开源大模型“星火开源-13B”也将同步发布。 马斯克:脑机接口公司Neuralink的首个产品名为“心灵感应”马斯克称,脑...……更多
...度学习的音乐练习行为分析指导云平台V1.0”通过建构AI多模态情感对话系统,关联语言、面部表情、肢体动作等多方面的信息,基于语音识别模型、意图识别模型、多模态情感计算算法、闲聊模型、语音合成技术等,在人机交互...……更多
双录视频,创造你与偶像的私密时刻!
...案提供商。通过自主研发的领域大模型、大数据分析、多模态交互三大核心技术,打造了数字化洞察与营销、数字化服务与运营、数“智”底座三大产品矩阵,全面升级云呼叫中心、智能客服、智能外呼、质检陪练、智能音视频...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
世优科技携手人民中科打造AI数字人智能体助力智慧校园
...体,接入人民中科研发的“白泽”大模型,使用先进的跨模态智能理解技术,对文本、图像、视频等多种模态信息进行统一理解、统一表达、统一度量,从而实现跨模态生成、跨模态搜索、跨模态对话等功能。 AI数字人智能体...……更多
微软宣布:copilot将持续实现创新
...bing.com/create或要求Copilot创建一个图像来访问此功能。多模态搜索基础此功能结合了GPT-4功能、视觉、Bing图像搜索和网页搜索数据的能力,从而提供更好的图像理解能力。如下图所示。传统的多模态系统只能泛泛地描述图像中的...……更多
平安银行申请身份验证专利,提高了基于智能眼镜的身份验证的准确性
...用户进行身份验证,得到第二验证结果;提取人脸图像的面部特征,并根据面部特征对用户进行身份验证,得到第三验证结果;根据第一验证结果、第二验证结果和第三验证结果,生成用户的身份验证结果。本申请还提供一种身...……更多
...混合专家模型,并将同步选择开源。天工3.0是全球首个多模态“超级模型”(Super Model),集成了AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI漫画创作、AI音乐生成等多项能力。其中,AI音乐生成大模型SkyMusic还将于4月...……更多
...统等等。而在AI大模型方面,最主要事件则是OpenAI推出多模态大模型ChatGPT-4o,这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力,被誉为技术上一个巨大突破。事实上,中国在AI大模型方面也已有足够竞争力。...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...型GPT-4o,现已在AzureAIStudio中提供,并作为API提供。该多模态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。此外,由微软开发的Phi-3列AI小型语言模型(SLM)中的一种新型多模态模型Phi-3-vision现已...……更多
唯一躲过韩国空气酵母的神颜顶流,怎么脖子比脸还粗啊?
...挡地物体,会自动估计被遮挡部分的样子,专业术语称为模态补全。例如帽子、口罩是男人最好的医美,很容易营造出帅哥氛围感。图源网络然而这种模态补全并不总是准确的,大部分时候都是偏向于可见部分。所以才会有那么...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
机器人笑了,我却笑不出来
...一款名叫Emo的机器人就不会这么瘆人。它可以分析人类的面部表情,并在人类做出表情前的0.839秒就预测出人类即将做出的表情,于是它可以和人类几乎同时一起微笑,从而避免尴尬或让人害怕。机器人Emo会预测人类的微笑,并...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。此外,OmniGen 可以处理经典的计...……更多
烟台曙光整形金琳琳馒化脸修复攻略
...鲁网9月14日讯(记者 魏萱)在医美领域,"馒化脸"是指因面部过度填充注射剂所引起的一种综合征,表现为面部饱满而缺乏起伏感,没有正常的骨相结构和高光点,看起来充气感、肿泡感,且随着年龄增加可能出现下垂和松弛问...……更多
更多关于科技的资讯:
聚焦服务品质 福州千名经纪人共赴贝壳福州站搏学大考
贝壳福州站搏学大考考场11月19日,贝壳找房福州站第26届新经纪品牌搏学大考正式拉开序幕,福州数千名房产经纪人通过线下机考的形式完成了本届搏学大考
2025-11-20 13:38:00
当输入一句简单指令,AI就能在几秒内给新鲜水果添上霉斑、给完好衣物制造破洞,这样的技术能力如今却成了少数人薅商家羊毛的利器
2025-11-20 11:16:00
发展新质生产力 推进新型工业化11月18日至25日,全球半导体行业盛会——德国慕尼黑半导体展览会隆重举行。总部位于太原的山西天成半导体材料有限公司受邀参展
2025-11-20 06:54:00
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00