• 我的订阅
  • 头条热搜
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。此外,OmniGen 可以处理经典的计...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
GPT-4撞上文心一言,百度压力骤增:多模态和中文能力受关注,或多种方式落地
...”文心一言发布前夕,OpenAI抢先发布了功能更为强大的多模态大模型GPT-4,巨大的压力给到了百度。前后脚发布,高调宣传的百度难免会被拿来对比,或将面临发布即落后的尴尬。毫不夸张地讲,如果明日发布的文心一言达不到...……更多
OPPO AI 中心产品总监张峻:多模态和个性化是将要深耕的方向
...的主要方向,表示 OPPO 会在 AI 方面带来更多的惊喜。多模态和个性化是将要深耕的方向,同时端云协同将是重点架构。“我们相信,在这些领域持续投入后,一定能为用户带来更加与众不同的体验。”张峻进一步说明,未来会...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
世优波塔AI数字人多模态交互系统,赋能智慧医疗服务升级
近日,世优科技“波塔发布会”在京举行,AI数字人多模态交互系统——波塔重磅发布。世优波塔是以世优科技多年积累的全栈数字人技术为基础,致力于打造人工智能时代有温度的多模态人机交互界面。 医疗水平提升、市场...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,蓝心小V在文本能...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...力的建设。目前,小红书技术团队同时针对语言模型和多模态能力进行了综合研发,结合小红书自身的业务场景和需求,更早做了视觉理解大模型方向的技术攻关:在多模模型架构、多模态alignment和整个数据体系和视觉感知能力...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
软通智慧数智成果发布暨战略合作签约仪式举行
...算力灵畅服务体系、卧龙策渊人工智能平台,以及基于多模态感知的多元共治产品体系。活动现场。软通智慧供图正式发布“AI算力灵畅服务体系”,助力算力从“可用”走向“好用”,为人工智能产业区域发展带来全新解决方...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...域。我们认为ChatGPT中短期内产业化的方向主要分为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。ChatGPT的成功,预示着人工智能(AI)无论在经济性与可获得性上都达到了支持普及的水平。同时,ChatGPT...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...模型展开合作,强化其在图片生成、图片理解等方面的多模态AI生成能力,并在小米汽车、手机等多类设备落地。以最新推出的小米汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...热词。打造新的经济增长点需要发展新质生产力,而以多模态大语言模型为代表的人工智能技术将成为形成新质生产力的重要引擎。作为国内头部基座大模型公司,智谱AI在过去一年中备受关注。去年6月,在科技媒体The Information...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...的盘古大模型5.0版本,标志着人工智能技术在全系列、多模态、强思维三个方面的全新升级。盘古大模型5.0以其全系列的模型规格,为不同业务场景提供了定制化的解决方案。PanguE系列,拥有十亿级参数,专为手机、PC等端侧智...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
更多关于科技的资讯:
骁龙8至尊版被榨干了!一加13性能实测
2024年10月31日,一加正式发布了其年度旗舰手机——一加13。作为一加品牌新十年的旗舰大作,一加13在性能、设计、屏幕
2024-11-05 23:09:00
三只羊总部深夜灯火通明:有主播靠直播三只羊总部涨粉数十万
11月5日消息,据媒体报道,有记者探访了位于合肥高新区的三只羊总部,晚上的时候这里灯火通明。在三只羊总部附近,部分主播以直播三只羊总部为主
2024-11-05 23:09:00
MacBook Pro 2026年重磅升级:OLED屏+轻薄机身
MacBook Pro系列有望在2026年迎来一次“革命性升级”,这一变革将主要体现在屏幕的革新与机身设计的轻薄化上。具体而言
2024-11-05 23:39:00
iPhone 16 Pro变飞船上太空!网友吐槽苹果最新广告:看的尴尬症犯了
快科技11月6日消息,日前,Apple官方抖音发布iPhone 16 Pro广告片,主题是介绍苹果A18 Pro芯片的神经网络引擎
2024-11-06 00:09:00
小鹏汽车CEO何小鹏晒大学照 中分发型配曼联球衣
11月5日,小鹏汽车CEO何小鹏分享了自己在大学时期的旧照片,照片中的他梳着中分发型,身穿曼联球衣,面容青涩。他表示,回到母校华南理工大学进行彩排
2024-11-06 00:09:00
岚图CEO卢放:国外大厂拆车研究岚图追光 产品力已远超BBA
快科技11月5日消息,岚图CEO卢放今晚发布视频称,岚图追光的产品力已经远超BBA。卢放表示,之前有很多国外大厂,拆车研究岚图汽车
2024-11-06 00:09:00
小米汽车智驾更新速度太快 官方揭秘背后运作机制
快科技11月6日消息,小米汽车官微带来了新一期微博问答,在这期问答中,小米揭秘了“小米汽车智驾如何实现快速迭代更新”。官方表示
2024-11-06 00:09:00
看完懂车帝的30款车“安全大碰撞” 我们到底该喷谁
这两天,脖子哥全在刷短视频了。吃饭刷,摸鱼刷,上厕所时候还在刷。吸引我的不是哪个漂亮妹子,而是懂车帝的碰撞小视频,一个接一个推给我
2024-11-06 00:39:00
用一星期变漂亮!董明珠示范9800元格力美容仪用法
快科技11月6日消息,日前,格力电器董事长董明珠和新东方创始人俞敏洪进行了一场合体直播,期间参观了格力工厂,聊到创新研发等话题
2024-11-06 00:39:00
极智嘉携手英特尔发布全球首款纯视觉机器人方案
11月5日消息,极智嘉(Geek+)昨日(11月4日)宣布,携手英特尔发布全球首款搭载英特尔视觉导航模块的纯视觉机器人方案
2024-11-06 01:39:00
《最终幻想7:重生》ps5pro主机增强版试玩视频发布
11月5日消息,索尼官方发布博文,宣布PlayStation5Pro主机11月7日首发支持55款游戏,SquareEnix工作室今日也发布了游戏《最终幻想7
2024-11-06 02:40:00
特斯拉推送2024.44更新,升级盲区警示系统
11月5日消息,据NotaTeslaApp报道,特斯拉近期向员工推送了2024.44更新,升级了其车辆的盲区警示系统,进一步提高了车辆的安全性
2024-11-06 02:47:00
2025款宝马m5旅行版正式投产,纯电续航40公里
11月5日消息,2025款宝马M5 旅行版已在宝马位于德国丁格芬的工厂正式投产,该车搭载了一套由4.4升V8双涡轮增压发动机和电动机组成的插电式混合动力系统
2024-11-06 02:48:00
东风本田和京东汽车签署战略合作协议,提升车主服务体验
11月5日消息,东风本田和京东汽车今日签署战略合作协议,宣布达成战略合作。未来,双方将在零售渠道、配件授权、整车销售、京东养车服务体系等方面展开深入合作
2024-11-06 02:52:00
五菱发布五菱之光纯电版官方图片
11月5日消息,五菱发布了五菱之光纯电版的最新官方图片,展现了这款全电动微面的多样化应用场景,涵盖了摆摊、货物运输、露营等多种功能
2024-11-06 02:53:00