• 我的订阅
  • 头条热搜
AI 2.0 的机会在哪里?中美之间有差距但可追赶
15日一早,创投圈与互联网行业都在热议OpenAI发布的多模态大型语言模型GPT-4——其回答准确性更高,解决问题能力更强,可以处理超2.5万字的文本,并支持图像输入。但由于图像输入仍未公开,用户暂时不能体验。ChatGPT的火热...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
“试用完谷歌的新AI模型,再也不爱GPT”
...越 GPT-4 , Gemini 最特殊的一点是,它是谷歌带来的首个多模态大模型,也就是能不光能打字互动,也能进行语音、视频、图片的互动。按照谷歌的说法,现有的所谓多模态大模型,都是单独训练了文本、视觉和音频等模型,再把...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
...模型检索问答一体机;财跃星辰发布国内首个千亿参数多模态金融大模型;幂方科技发布大模型驱动的外脑穿戴智能硬件等。 ……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
AI制药加速落地 多家巨头抢滩
...类最佳潜力。郭晋疆指出,生命科学领域的数据呈现出多模态、多尺度、异质化的特征,既有来自于基因测序的数据、蛋白质或化学化合物结构化的数据,也有来自于生物活性的特定数据等,数据量初步估算为百亿级。而AI缺乏...……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...全系列算法与模型,覆盖了图像、音乐、文本、编程等多模态的AI内容生成能力。“天工”大语言模型的推出,标志着昆仑万维的AI版图进一步扩大,也再一次证明了其在人工智能领域的技术积累和坚定投入。十四年航海史造就...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
年轻人的好友列表,AI越来越多
...字人,还可以实时进行沉浸式语言、肢体互动。“以前多模态交互是一个连续生成过程,会有延时,Soul 现在语音对话延迟不到 200 毫秒,因为我们已经推出了端到端大模型能力——过去先生成文本/图像再转换为语音,现在能将...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
...能沉浸式体验3D生成、音视频生成、智能编码等十余项多模态模型如何一步步化作生产力。“值得一提的是,由生数科技团队打造的首个国产纯自研视频大模型Vidu将进行公开展示。”刘湘雯介绍,大会也邀请到十余家多模态模型...……更多
小红书布局大模型:多媒体算法负责人牵头、上线AI绘画应用 | Long China 50独家
...负责AI和音视频算法方向。在更早期,他还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。除了成立大模型团队以外,36氪了解到,小红书内部还有多个独立部门同时推进AIGC方向的落地探索。今年4月份,小红书...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...超过90%。在启用视觉感知能力的情况下,o1模型在MMMU(多模态理解)测试中获得了78.2%的高分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
Bonus独家 | 揭秘腾讯大模型新项目组「混元助手」人才地图
...」并不是混元AI大模型的第一次亮相。2022年6月,腾讯多模态AI大模型先被应用在了广告投放这一toB业务领域进行“降本增效”:先以腾讯混元AI大模型助力系统理解广告内容,其次以精排大模型提升广告和用户的匹配准确率,模...……更多
前商汤通用模型负责人打造3D大模型「Tripo」,3D生成迈入「秒级」时代 | 早期项目
...VAST团队认为通过统一表示、模型和数据,以及借鉴其他模态的成功经验,可以有效地解决当前3D内容生成面临的挑战,实现通用且可扩展的解决方案。这对算法、数据量、服务器等有很高的要求一一不过这恰恰也是VAST团队的核...……更多
字节跳动计划在欧洲设立AI研发中心,已开始招募大模型等领域技术人才
...大模型团队于2023年2月开始组建,分别在语言和图像两种模态上发力,由TikTok产品技术负责人朱文佳带队。2023年8月,字节自研的底层大模型“云雀”上线,随即推出AI对话产品“豆包”。今年5月,字节发布“豆包大模型”家族...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
...wen2-Math还是各自负责一部分。但不久的将来,我们会把多模态能力和数学推理能力结合到一个模型上哟。不少网友对这种交互模式挺买账:歪瑞古德!用图像来上传,然后等大模型解决问题,喜欢! 那么,最强数学大模型Qwen2-M...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
...批12个长三角跨区域创新联合体正式发布。其中长三角多模态大模型创新联合体由科大讯飞牵头,德清阿尔法研究院等6家机构参与。为头部互联网企业提供技术支撑长三角多模态大模型创新联合体主要研究什么项目?德清阿尔法...……更多
大模型通向AGI,腾讯云携手业界专家探索创新应用新风向
...项目,而非“AI+”的项目;· 保持前瞻性眼光,如关注多模态等前沿方向;· 强调“产业闭环”。向量数据库:实现多模态数据打通和人与数据的互动“大语言模型的本质是把治理范式进行了转移,它的作用主要体现在即使是非程...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在美开售,库克称将很快登陆中国脑机接口公司Neuralink完成首例人脑植入手术 Hugging Face推出可定制AI个人助手苹果发布2024年Q1财报...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...议关注券商、银行。(三)券商行业掘金 开源证券:多模态模型再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长...……更多
自研视频生成模型实现升级,「CreativeFitting」即将面向海外市场发布AI短剧APP | 早期项目
...作内容的门槛,一些具有AI生成特点——有想象力的、多模态的——内容会聚集起来形成新一代ToC超级内容平台,CreativeFitting就在打造这样的平台。”其实,朱江对于公司的长远规划是,创业前期,先专注在研发针对高质量情节...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
...磁共振技术具备无创无辐射的优势,并且能呈现大脑的多模态信息,因此能在胎儿和婴幼儿等特殊人群中发挥独特优势。这无疑是一项“米粒雕花”的艰辛探索。历时5年,吴丹和团队开发出胎儿和婴幼儿的成像和后处理技术,...……更多
更多关于科技的资讯:
彭博社:iOS 18.4将于明年4月发布
据报道,iOS18.2的公开发布日期将比预期提前。原本预计在12月中旬发布,现在新的发布日期定在了12月2日。这一消息来自彭博社的苹果内部人士MarkGurman
2024-11-05 00:17:00
天津北方网讯:11月4日,天开科创专板启动暨首批企业挂牌仪式活动在天开园成功举行。天开科创专板是依托天津区域性股权市场与新三板建立的“绿色通道
2024-11-05 00:32:00
网吧登录QQ、WeGame担心被盗号吗:2步教你鉴别真假客户端
快科技11月5日消息,和朋友到网吧开黑、在网吧临时处理工作,你是否会担心网吧的QQ、WeGame是假客户端,目标是盗取账号和个人信息
2024-11-05 01:08:00
感受科技神奇魅力,告别传统睡眠耳机,创新骨传导黑科技助眠
在当今快节奏的生活中,优质睡眠成为了许多人的奢望。若你能在23:00之前安然入睡,无疑已超越了大多数人的作息状态;而若从未被失眠所困扰
2024-11-05 01:10:00
redmik70至尊版上市15周销量远超上代生命周期
K80系列还在传闻阶段,RedmiK70至尊版的销量倒是先曝光了。据CNMO了解到,该机15周销量远超上代生命周期。RedmiK70至尊版近日
2024-11-05 01:12:00
官宣!红魔10pro系列新机发布会定档11月13日
此前,网上有不少关于红魔10PRO系列的消息,暗示这款新机将于不久后发布。果不其然,11月4日,红魔游戏手机官宣,红魔10PRO系列新品发布会定档11月13日15:00在北京举行
2024-11-05 01:13:00
鸿蒙版微信在华为应用市场大规模放量尝鲜
有知情人士透露,鸿蒙版微信近日在华为应用市场大规模放量。目前鸿蒙版微信已发布新的测试版,增加了更多功能。11月4日,余承东宣布
2024-11-05 01:14:00
华为nova13首销表现惊艳
Mate70系列将在本月正式发布,在此之前,上市不久的nova13系列仍然是华为的明星机型。说它是“明星”真不是吹捧,因为有数据作为支撑
2024-11-05 01:59:00
iqooneo10系列采用双摄设计,删繁就简
近期手机市场热闹非凡,新机发布会层出不穷,令人目不暇接。在这股潮流中,中端市场同样暗流涌动,各大品牌均全力以赴,力求在这片竞争激烈的市场中分得一杯羹
2024-11-05 03:04:00
2024年第三季度中国智能门锁市场全渠道销量同比下降7.5%
洛图科技(RUNTO)最新发布的数据显示,2024年第三季度,中国智能门锁市场的线上线下全渠道销量为373万套,同比下降7
2024-11-05 03:15:00
前oppo副总裁沈义人:蔚来大概率不会搞增程
近段时间,不断有报道称蔚来第三品牌将采用混合动力,产品有望2026年面世。11月4日,博主@自信的眉毛(前OPPO副总裁沈义人)发文称
2024-11-05 03:48:00
一加ace5pro预计年底正式面世,将配备超大容量电池
一加Ace5及一加Ace5Pro预计将于年底正式面世。而近日,CNMO注意到,博主“智慧皮卡丘”透露了一加Ace5系列的最新动态
2024-11-05 04:02:00
零跑汽车11月政策权益汇总:c16下定至高可节省4万元
日前,零跑汽车官方发布了11月的政策权益汇总,涵盖了C16、C10、C11、C01和T03五款全系车型,购车优惠力度相当大
2024-11-05 04:08:00
真我gt7pro正式发布,全球首发Eco苍穹屏
11月4日下午14:00,真我2024年度旗舰大作——真我GT7Pro正式发布。新机搭载骁龙8至尊版移动平台,配备潜望长焦摄像头
2024-11-05 05:04:00
三星s25ultra六大升级点曝光
S25Ultra是接下来三星将推出的重磅旗舰。据CNMO了解,近日有外媒曝光了该机的六大升级点,包括更亮的屏幕和可变长焦镜头等
2024-11-05 05:05:00