• 我的订阅
  • 头条热搜
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
云知声荣登甲子光年榜单,彰显AI大模型商业潜力
...现出色,行业领先。2024年8月,云知声正式推出了山海多模态大模型,该模型通过整合跨模态信息,能够接收文本、音频、图像等多种形式的输入,并实时生成文本、音频和图像的任意组合输出,带来了实时多模态拟人交互体验...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
...。 但与此同时,Google将发布一个应用程序接口(API)--多模态实时应用程序接口(Multimodal Live API),以帮助开发人员创建具有实时音频和视频流功能的应用程序。Google表示,通过使用多模态实时 API,开发人员可以创建实时、多...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一,甚至还支持国风水墨,支持在图片生成过程中,增加汉字...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
...选择基于扩散模型、文本和掩码的图像编辑方法、以及多模态大型语言模型(MLLMs) 进行实现,并设计了简约实用的用户界面。MagicQuill的具体构成一起来看看MagicQuill系统的具体构成是什么样的。主要分为3个部分:1.编辑处理器...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
智象多模态生成大模型3.0版发布
...合肥举行。现场,智象未来科技有限公司正式发布智象多模态生成大模型3.0版。智象未来创始人兼CEO梅涛发布智象多模态生成大模型3.0版。主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创...……更多
vivo OriginOS 5发布,加入想要的AI功能
...心大模型矩阵,核心的升级点,是加入了语音大模型、多模态大模型,升级的语言大模型、图像大模型等。其中语音大模型主要实现了自然对话、模拟人声、同声传译等功能。而图像大模型则是更加能理解中文语境创作,多模态...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...技术普惠的理念,在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。这一多模态免费模型将进一步降低开发者在各个领域深入...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Video模型经历了四项核心改进:1、引入超大规模数据处理系统,提升视频画质;2、采用多模态大语言模型(MLLM),...……更多
更多关于科技的资讯:
iPhone 17系列重磅升级:全系LTPO高刷屏 尺寸增大
快科技2月21日消息,iPhone 16e已经正式发布,首次升级为刘海屏,依然后置单摄,核心搭载A18。按照苹果惯例,廉价版机型一定会用淘汰的设计
2025-02-21 00:29:00
iPhone 16E很好 但跟咱们没啥关系
这回没有 Good morning !沐浴着加州清晨的阳光,库克老头子又带着新品来了。跟大家此前预想的一样,这次带来的是 iPhone SE 的继任者
2025-02-21 00:29:00
连续奇袭的京东 能挤进外卖行业吗
京东上线外卖,美团、京东都在同一天宣布给骑手交社保的事儿,相信各位差友都听说了。反正一直处在吃瓜前列线的差评君,昨个是被这俩巨头的消息
2025-02-21 00:29:00
iPhone 16e首发就国补:降到3999元起 还送《哪吒2》电影兑换券
快科技2月21日消息,iPhone 16e目前已经在各大电商平台上架,将在今晚21点正式开售,官方定价4499元起。根据目前京东平台显示
2025-02-21 00:29:00
900光年外新发现的行星:刮着7万公里/小时的铁风
地球上的大气层主要由氧气和氮气组成,这两种气体的沸点非常低,地球的气温下两者只能以气态的形式存在。地球上大气层中还有不停循环的水
2025-02-21 00:29:00
特斯拉车主吐槽在线广播报时延迟15分钟 官方回应
快科技2月20日消息,近日,有特斯拉车主通过拨打12345反映,自己驾驶Model Y时发现北京交通广播直播存在整点报时延迟的情况
2025-02-21 00:29:00
比尔盖茨自述:中学时期就开始偷偷996写代码
57年前的西雅图冬夜,一个瘦削少年翻出卧室窗户,奔向名为“C的立方”的计算机实验室。比尔·盖茨不会想到,这段在寒夜中追逐代码的岁月
2025-02-21 00:59:00
贵州人抢疯了!3秒抢光的消费券都花在哪儿了?今晚八点又双叒开抢!
最近,多彩贵州欢乐购普惠消费券的发放活动,在贵州掀起了一波又一波消费小高潮!第三批次的消费券于2月19日结束发放,紧接着第四批次的消费券也马上开抢
2025-02-21 01:00:00
《湖南高泽:科技服务双驱,数据赋能卓越》
湖南高泽信息科技有限公司作为区域性科技服务领军企业,现已构建起完善的全渠道营销服务生态。公司围绕"科技+服务"双核驱动战略
2025-02-21 02:08:00
本文转自:人民日报海外版本报电(记者赵珊)近日,马蜂窝宣布其自主研发的AI智能应用正式接入DeepSeek大模型,首阶段将优先应用于已上线发布的“AI游贵州”“AI游黔西南”“AI游西江”省市景区三级AI应用
2025-02-21 04:44:00
本文转自:人民日报曹景芳2018年7月,我家购置了一辆新能源汽车,使用体验符合预期。身边更多同事、朋友加入新能源车主行列
2025-02-21 06:00:00
让政策尽知尽享  助企业向新而行(人民眼·持续优化营商环境)
本文转自:人民日报广东佛山市探索“创享易”科创服务供给新机制,疏通科技型企业政策获取堵点让政策尽知尽享 助企业向新而行(人民眼·持续优化营商环境)本报记者 胡 健  王云娜广东万和新电气股份有限公司员工登录“创享易”平台查询税惠政策
2025-02-21 06:01:00
本文转自:人民日报据新华社法国图卢兹2月20日电 (记者李文昕)欧洲飞机制造商空中客车20日在位于法国图卢兹的企业总部发布的财报显示
2025-02-21 06:03:00
本文转自:人民日报去年境外人士在深非现金支付交易近两百亿元同比增长近八成本报深圳2月20日电 (记者李刚)2024年深圳出入境人员达2
2025-02-21 06:08:00
苹果最便宜手机!iPhone 16e今日预售 国补3999元起 首发自研5G芯片
快科技2月21日消息,日前,苹果正式发布iPhone16e,售价4499元起,是苹果官网目前在售最便宜的一款机型。该机将于今晚21:00开启预售
2025-02-21 06:59:00