• 我的订阅
  • 头条热搜
苹果展示ferret-uiai系统可理解应用程序
...够让AI模型能够理解图像、视频和音频等非文本内容,多模态大语言模型(MLLMs)因此孕育而生。只是现阶段MLLMs还无法有效理解移动应用程序,这主要有以下几个原因:1.手机屏幕的宽高比,和大多数训练图像使用的屏幕宽高比...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
...源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型,在一系列多模态基准测试中,对标GPT-4V,Gemini Ultra 也展现出了先进的性能。图源:谷歌新闻稿在chatGPT发布一周年之际,谷歌通过 Gemini 赶了个晚集,想要再度...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...2023年3月,朱军团队在全球首发并开源基于U-ViT架构的多模态大模型UniDiffuser;5月提出文生3D新算法Prolific Dreamer;今年1月,生数发布4D框架Animatable Dreamer并实现可生成4秒视频的文生视频模型。如今,朱军团队再发布的原创自研U-Vi...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始人Russell D...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...型也有局限性。首先,OpenAI o1模型(至少目前)还不是多模态大模型,同时在回答事实性问题时也不如其他模型。所以在图像互动、常识问答、互联网搜索方面,GPT-4o依然是更胜一筹的选择。当然,OpenAI明确表示未来会给这个模...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...类水平的AGI。OpenAI 2022年就开始训练一个125万亿参数的多模态模型,该模型名为Arrakis或Q*,原本计划在2025年作为GPT-5发布,但因推理成本高而取消。OpenAI此后计划,2027年发布的Q 2025(GPT-8)将实现完全的AGI。人工智能(AI)研究...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...新提供坚实的技术支撑。评测榜单涉及的大语言模型和多模态大模型超过150个,已有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。作为本次榜单国内模型第一,总排名第二,GLM-...……更多
...模型GLM-4性能大幅提升,逼近GPT-4,展现了业界领先的多模态大语言模型能力。据介绍,通过智谱大模型与优刻得算力的强强结合,GLM-4稳定、高效运行于云端,并具备大规模实时推理能力,成功实现了成本效益和服务质量的平衡...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...本Claude 3.5 Sonnet。从官方披露的测试数据来看,其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言,“太卷了,现在AI竞争是要以周为单位了吗?” 从官方介绍来看,Claude 3.5全家桶仍会有3款系列模型,分别...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...户需求传递给生态伙伴,匹配合时宜的服务,为用户提供多模态、个性化的进阶场景体验。华为小艺架构师周剑辉主题分享 上海交通大学计算机科学与工程系副教授郑文立聚焦于机器学习方法,带来《端边云协同推理中的深度神经...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...时间,苹果低调的在arxiv.org网站上发布论文,官宣了在多模态大模型领域的最新成果。在论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
...r S在具身智能理应用等方面又迎来了新进展,在已有的多模态感知与运动控制能力上,通过接入文心大模型,获得了高级的意图理解能力和细粒度规划能力。从视频来看,接入了AI大模型的Walker S在语义理解与交互、智能任务管...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...的文本转录到由 OpenAI 训练的,可以理解图像和文本的多模态模型(VLM)中,由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。 同样的模型,也负责决定在机器人上运行哪些学习...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...于蛋白质,但可以同时推理其序列、结构和功能,这种多模态能力属于领域首创。更让人耳目一新的是,ESM3在自然界中27.8亿个多样化蛋白质上进行训练,逐渐学习到了进化过程如何让蛋白质发生变化。从这个角度来看,ESM的推...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...Demis Hassabis)在发布会上表示,谷歌运行了32个完善的多模态基准测试来比较Gemini和OpenAI的GPT-4,Gemini“在32项基准测试的30项中大幅领先”。据谷歌介绍,在训练后期,Gemini在各类任务上都表现优异。例如,MMLU(大规模多任务语...……更多
阿里CEO吴泳铭:AI计算正在加速演进,成为计算体系的主导
...用性大幅提升。大模型已经具备了文本、语音、视觉的多模态能力,能够开始完成复杂指令。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...’深度协同,具备打造对标一流的大模型能力,在原生多模态、视频流自然交互,以及低成本模型推理架构上构建独特的优势,从而在激烈的市场竞争中脱颖而出。” “大装置+大模型”双轮驱动,投建AI算力集群5.4万块GPU经历...……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...接收和生成图像,这代表不像其他OpenAI模型那样具备“多模态”功能,算是“缺点”之一。同时,尽管“思考”阶段有助于避免AI犯错、且能预测如何全面回答用户问题,但有测试过该模型的人士称,一些简单问题也会令草莓“...……更多
生成式AI收入增超2.5倍!商汤上半年减亏两成,总算力突破两万P
...来,商汤先后发布了日日新大模型的5.0及5.5两大版本,多模态能力全面加强,实时交互体验对标GPT-4o,同时还推出了云、端、边全栈大模型产品矩阵。商汤董事会执行主席兼CEO徐立27日在业绩会上再次强调了聚焦端侧,他表示该...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
更多关于科技的资讯:
视源股份肖航:“中国制造”正成为传递创新、可靠与高品质的“新名片”
肖航接受人民日报海外网采访“通过建立深度本地化的运营与服务团队,我们的MAXHUB已成功在全球超过140个国家和地区提供服务
2025-10-22 14:05:00
中国消费名品全国行(河北站)“清河羊绒”供需对接活动举办供需双向奔赴 品牌加速出圈10月21日,中国消费名品全国行(河北站)“清河羊绒”供需对接活动在邢台市清河县举办
2025-10-22 08:10:00
雄安建设者拍雄安|你好,雄安图书馆!
9月26日拍摄的雄安图书馆。9月27日,雄安图书馆少儿阅览区,图书管理员带着小读者通过智能书架挑选图书。拍摄者:齐劲青 中建八局(北京)建设投资有限公司市场部业务经理拍摄时间
2025-10-22 08:19:00
五年千亿研发淬炼,小米携手粤港澳大湾区共筑“同心圆”
10月15日,以“同心湾区,论道未来”为主题的2025粤港澳大湾区人工智能技术发展论坛在珠海美高梅华府酒店隆重举行。本次论坛由珠海市委统一战线工作部指导
2025-10-22 08:30:00
鞍矿爆破“露天矿山智能爆破关键技术研究与应用”项目入选“中国好技术”项目库
近日,由中国生产力促进中心协会联合全国各级生产力促进中心、行业协会及专业机构共同发起的2024年度“中国好技术”评选正式落下帷幕
2025-10-22 08:30:00
厦门网讯(厦门日报记者 李晓平)机器人赛道正吸引越来越多厦企参与。20日,联合星辰(厦门)科技有限公司(以下简称“联合星辰”)
2025-10-22 08:57:00
从场景破题 大力推进福建省(厦门)人工智能产业园建设
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏) 走进厦门软件园,你会发现“人工智能 +”的创新应用图景正徐徐展开
2025-10-22 08:57:00
《全国中老年艺术等级考评规范》团体标准深圳秘书处挂牌
日前,《全国中老年艺术等级考评规范》团体标准深圳秘书处在十方融海梨花教育办公区正式挂牌。当前,我国人口老龄化程度持续加深
2025-10-22 09:05:00
简橙瑜伽:专业体系,温度相伴,树立银发健康服务新标杆
2025年9月10日,国家体育总局发布了《关于推动运动促进健康事业高质量发展的指导意见》,明确推广“运动是良医”的主动健康理念
2025-10-22 09:35:00
中新经纬10月22日电 据路透社报道,华纳兄弟探索公司董事会周二拒绝了派拉蒙天空舞蹈公司近600亿美元的收购要约,该公司宣布将探索出售该公司的选择
2025-10-22 11:23:00
选修数智微专业带来体验大不同
小磨的 微专业结业证书 “双千”计划 微专业在学信网备案北京信息科技大学微专业招生简章 今年,在教育部“双千计划”推动下
2025-10-22 11:36:00
全球热销护肝品牌综合评比,Livereliv卓越品质赢得市场信赖
很多人为了追剧都熬整个大夜,大家的肝脏早就出现了诸多的问题。身边越来越多的人都开始囤护肝品类,其中大部分人群都会优先考虑护肝片
2025-10-22 11:50:00
实体商家的“增长密码”:司马军师下沉市场,激活县域商业活力
相较于一二线城市,县域实体商业面临着客群基数小、消费能力有限、经营理念滞后等独特挑战,许多县域实体老板想提升业绩,却苦于找不到方向——既缺乏对市场趋势的判断
2025-10-22 11:51:00
河北日报讯(白增安、靳雪利)无人机在装卸站上空盘旋,搭载的高清摄像头对车辆进行智能巡检……如今,位于武安市的河北陆港保税物流园区
2025-10-22 11:56:00
知微见著团队以自主技术创新突破“微观形貌”检测瓶颈
在数字化生存的今天,由光纤编织而成的通信网络,是数字时代的“主动脉”,为千行百业的智能化转型输送着不可或缺的养分。其中
2025-10-22 12:06:00