• 我的订阅
  • 头条热搜
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
微软机器学习模型专利曝光:可创作逼真头像
11月16日消息,微软的一项新专利于当地时间周二在美国专利商标局网站上公开,这是一种新的机器学习模型专利,可为用户创作出“更加有生命力”的逼真头像。据介绍,通过新的机器学习模型,头像或照片可针对细节部分进...……更多
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来|钛媒体AGI
...数十名员工已加入苹果的AI部门。苹果推出300亿参数MM1多模态大模型在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,苹果正式公布自家的多模态大模型研究成果。这是一个具……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
...提供标准化交互方式不同的AI技术,该技术利用声音等多模态数据,结合每位用户的特征来创建对应的账号文件,以更加个性化地响应和反馈用户需求。据了解,该专利适用于多用户办公等环境,能够差异化满足不同用户的需求...……更多
微软修改azure人工智能行为准则
5月8日消息,微软似乎并不希望执法部门利用AzureOpenAI进行实时面部识别,该公司最近修改了其有关警方使用人工智能服务的行为准则。图源Pixabay注意到,执法机构近年来越来越多地采用人工智能技术。例如,军警技术供应商Axo...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;
...定义GPTs服务,以及其他新功能和API,如Assistants API和新的模态API。百家号宣布“AI笔记”功能将下线百度百家号将于2023年11月30日下线其创作工具平台的“AI笔记”功能,但其他功能不受影响,创作者可以继续使用。 xAI推出PromptI...……更多
微软win1123h2更新中已整合copilotai功能
...和提供标准化交互的传统AI模型不同,可以基于声音等多模态数据,结合每位用户的特征来创建对应的账号文件,可以更加个性化地响应和反馈用户需求。这项专利适合拥有多名用户的办公等环境下,可以区分不同用户的需求,...……更多
谷歌发博文介绍vloggerai模型可让人物“动起来”
...表情地朗读音频内容。VLOGGERAI是一种适用于虚拟肖像的多模态Diffusion模型,使用MENTOR数据库进行训练,该数据库中包含超过80万名人物肖像,以及累计超过2200小时的影片,从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同...……更多
微软推出全新vasa-1模型
4月19日消息,微软亚洲研究院(MicrosoftResearchAsia)近日发表论文,介绍了全新的VASA-1模型,用户只需要提供一张静态肖像图片和一段语音音频片段,该模型就能自动让图片中的人物自动说话。VASA-1特别有趣的地方在于,它能够...……更多
微软称GPT-4将会很快发布,该模型拥有更强大的理解能力
...GPT-4,这是我们所拥有的一个能提供完全不同可能性的多模态模型,比如说在视频方面。”多模态模型指的是能够接受多种方式的输入并进行处理和输出,比如说,你能给AI发送一张图,然后让AI看图写话,又或者说反过来,告诉...……更多
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均显著提升。星火语音大模型、星火开源大模型“星火开源-13B”也将同步发布。 马斯克:脑机接口公司Neuralink的首个产品名为“心灵感应”马斯克称,脑...……更多
...度学习的音乐练习行为分析指导云平台V1.0”通过建构AI多模态情感对话系统,关联语言、面部表情、肢体动作等多方面的信息,基于语音识别模型、意图识别模型、多模态情感计算算法、闲聊模型、语音合成技术等,在人机交互...……更多
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
视频应用或有惊喜!微软高管透露将于下周推出GPT-4
...亚斯·布劳恩透露,微软将在下周推出GPT-4,它是一个多模态模型,可以处理文本、图像、音频和视频。他表示,大型语言模型(LLM)已经适用于几乎所有语言,可以在一种语言中提出问题,然后在另一种语言中得到答案。[#zolspl...……更多
微软宣布:copilot将持续实现创新
...bing.com/create或要求Copilot创建一个图像来访问此功能。多模态搜索基础此功能结合了GPT-4功能、视觉、Bing图像搜索和网页搜索数据的能力,从而提供更好的图像理解能力。如下图所示。传统的多模态系统只能泛泛地描述图像中的...……更多
...混合专家模型,并将同步选择开源。天工3.0是全球首个多模态“超级模型”(Super Model),集成了AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI漫画创作、AI音乐生成等多项能力。其中,AI音乐生成大模型SkyMusic还将于4月...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...型GPT-4o,现已在AzureAIStudio中提供,并作为API提供。该多模态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。此外,由微软开发的Phi-3列AI小型语言模型(SLM)中的一种新型多模态模型Phi-3-vision现已...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
...公告,中国第一汽车股份有限公司申请一项名为“副车架模态计算有限元建模方法、装置、终端及存储介质“,公开号CN117216865A,申请日期为2023年7月。专利摘要显示,本发明属于汽车技术领域,具体的说是一种副车架模态计算...……更多
唯一躲过韩国空气酵母的神颜顶流,怎么脖子比脸还粗啊?
...挡地物体,会自动估计被遮挡部分的样子,专业术语称为模态补全。例如帽子、口罩是男人最好的医美,很容易营造出帅哥氛围感。图源网络然而这种模态补全并不总是准确的,大部分时候都是偏向于可见部分。所以才会有那么...……更多
GPT-4o:“更像人”的人工智能模型
...目前GPT-4o已经支持包括中文在内的20种语言进行音频等多模态交互,这次更新在多语言方面更加强大。 GPT-4o数据优势明显。在数据层面,根据传统基准测试,GPT-4o的性能对比GPT-4 Turbo处于优势,对比其他模型更是大幅领先。GPT-4o...……更多
机器人笑了,我却笑不出来
...一款名叫Emo的机器人就不会这么瘆人。它可以分析人类的面部表情,并在人类做出表情前的0.839秒就预测出人类即将做出的表情,于是它可以和人类几乎同时一起微笑,从而避免尴尬或让人害怕。机器人Emo会预测人类的微笑,并...……更多
本文转自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
更多关于科技的资讯:
HMD 新款 TA-1645 5G 智能机与 TA-1683 2G 功能手机现身认证机构
IT之家 6 月 23 日消息,HMD 新款TA-1645 与TA-1683 手机现已通过部分监管机构认证。HMDTA-1645 5G 智能机HMDTA-1645 手机昨日通过蓝牙认证
2024-06-23 18:49:00
全球版图稳步扩张!华为海外发展势头强劲,口碑卓越
今年 4 月份,分析机构 TechInsights 发布报告称,华为 Pura 70系列将在 2024 年出货超过 1000 万部
2024-06-23 18:48:00
微软 Copilot 与骁龙芯双加持,全新 Surface Laptop 体验如何?
前不久,微软在新园区举行了一场特别活动,定义了一个专为 AI 体验而设计的全新 PC 品类:Windows 11 AI PC
2024-06-23 18:49:00
索尼 ZV-E10 Ⅱ Vlog 相机被曝即将发布,新 APS-C 套头同期推出
IT之家 6 月 23 日消息,据 Sonyalpharumors 报道,索尼 Vlog 相机新品ZV-E10 Ⅱ即将发布
2024-06-23 18:49:00
新品抢先购,一加 Ace 3 Pro Pop-up 快闪活动 6 月 29 日举行
IT之家 6 月 23 日消息,一加 Ace 3 ProPop-up 快闪活动官宣将于 6 月 29 日12:00-21:00于 13 城同步举行
2024-06-23 18:50:00
WPS鸿蒙版来了:新增跨端调用、跨屏协同、墨迹批注等功能
中新经纬6月23日电 6月21日至23日,在2024华为HDC开发者大会上,WPS鸿蒙版正式亮相。基于HarmonyOS NEXT的原生互联
2024-06-23 18:51:00
顶级配置无悬念 三星Galaxy Tab S10 Ultra平板电脑设计图泄露
2024-06-23 13:41:14作者:姚立伟据外媒报道,三星即将在下个月举办新品发布会,尽管平板电脑不会出现在这次的舞台上
2024-06-23 18:51:00
飞傲翡声 JT1 头戴耳机星空灰配色上架:50mm 动圈单元,399 元
IT之家 6 月 23 日消息,飞傲旗下翡声 JT1 高保真头戴耳机新推出星空灰配色,将于 6 月 24 日 10:00 正式开售
2024-06-23 18:52:00
华为鸿蒙生态伙伴 SDK 市场发布
IT之家 6 月 23 日消息,华为今日正式发布鸿蒙生态伙伴 SDK 市场,提供各类 SDK 的聚合平台,旨在帮助开发者搜索
2024-06-23 18:54:00
PS掌机更新疑似存在严重问题:多人反应断连 画质下降
索尼串流掌机PlayStation Portal日前推送了3.0.0版本更新。新的变化包括:支持酒店、机场等公共Wi-Fi网络
2024-06-23 18:55:00
消息称《原神》《绝区零》等米哈游游戏有望登陆微软 Xbox 主机
IT之家 6 月 23 日消息,外媒 Windows Central 记者 JezCorden 在回复网友评论时透露,微软正尝试将《原神》等米哈游游戏带往 Xbox 平台
2024-06-23 18:55:00
小米不断创纪录,却为何总有人,质疑小米SU7销量?
自从小米SU7发布以来,已经创造了一个又一个的纪录。比如最早的27分钟破5万订单的纪录,24小时超8.8万的订单纪录。后来交付后
2024-06-23 18:55:00
618手机榜:苹果是最大赢家,小米第2,华为第3
每年,电商有两个最大促销节日,上半年是618,下半年是双11,这两个日子,各大品牌都是卯足了劲搞促销,特别是手机厂商们
2024-06-23 18:57:00
最香小折叠!荣耀Magic V Flip获5K-8K折叠屏首销日销量冠军:4999元
2024-06-23 17:08:43作者:姚立伟近日,荣耀官方宣布其最新产品荣耀Magic V Flip在5K-8K折叠屏手机的首销日销量中夺魁
2024-06-23 18:58:00
曝三星3nm良率仅20%!但仍不放弃Exynos 2500
2024-06-23 17:26:27作者:姚立伟据最新消息,三星首款采用SF3工艺的智能手机SoC Exynos 2500的良品率目前仅为20%
2024-06-23 19:01:00