• 我的订阅
  • 头条热搜
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
OriginOS 5来了!2024 vivo开发者大会定档10月10日:还有自研操作系统
...以及性能优化上呈现新面貌,并搭载蓝心大模型,提供多模态交互体验,包括语音、视觉及文字等领域的智能解决方案。蓝心大模型于去年11月初举行的2023 vivo开发者大会上首次对外公布,包含十亿、百亿、千亿三个参数量级共5...……更多
深圳:“深目”AI模盒发布  “深目2.0”生态联盟成立
...目”AI模盒的大模型能力,来源于云天励飞自主研发的多模态大模型“云天天书”。云天天书大模型包含语言大模型、多模态大模型等不同系列。 ……更多
大模型通向AGI,腾讯云携手业界专家探索创新应用新风向
...项目,而非“AI+”的项目;· 保持前瞻性眼光,如关注多模态等前沿方向;· 强调“产业闭环”。向量数据库:实现多模态数据打通和人与数据的互动“大语言模型的本质是把治理范式进行了转移,它的作用主要体现在即使是非程...……更多
2024年投资展望丨AI、MR、短剧等概念爆发,传媒板块去年逆市涨近17%
...的发展,带来结构化的成长趋势。一、AI应用拓展 1、多模态加速应用端落地 目前,多家厂商快速布局卡位多模态大模型,AI文生图、文生视频等多模态能力持续提升带动AI应用持续迭代升级。海内外爆款AI应用频现,如Pika 1.0、R...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
...提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力,与此同时,在应用产品层面也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展...……更多
...好用”。5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o多模态大模型,相较于4月发布的GPT-4Turbo速度更快、价格更便宜;5月15日,谷歌在I/O 开发者大会上发布了通用AI新模型Project Astra,可实现跨文本、音频、视频多模态实时推理...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
船长与舵:百度的AI路线图
...,文心一言发展到什么程度折射出国内大模型的现状,从李彦宏和何俊杰的OKR,我们或许可以看到AI与大模型究竟如何重构百度,又是如何改变我们当下的移动应用。 Jackson是盾,“抖哥”是矛“Q1Q2猥琐发育,Q3Q4冲刺业绩。”10...……更多
加速落地 京东云大模型已支持数百个场景
...态资源统一管理。在智能体构建方面,平台提供一系列多模态组件与应用框架,如文生图、语音识别等多模态组件,以及检索增强生成、智能体等AI应用框架,分钟级即可启动AI Agent构建,帮助企业高敏、高效地进行AI应用的开发...……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...模型数量最多的开发平台。早前百度创始人、董事长、CEO李彦宏则表示,因为基础模型文心 4.0 可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这...……更多
从产品“出海”到生态“出海” 中国新能源汽车“驶”向全球
...国、阿联酋、新加坡四地自动驾驶牌照的科技公司。在多模态传感器融合感知以及NVIDIA DRIVE Orin强劲算力的加持下,“博世中国高阶智能驾驶解决方案”全面打通行泊一体等多场景应用,为全球OEM客户提供极具拟人化的防御性驾...……更多
联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单
...联汇科技预训练大模型拥有国际领先的能力优势,自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一,在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军,大模型...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家族,企业可根据自身业务场景需求灵活选择,实现模型使用及成本控制的正循环。人人用得起 才是好模型谭待认为,降低成本是推动大模型快进到“价值创造...……更多
...代面向智慧园区场景的智能服务器AIS 4.0。集成领先的多模态大模型能力,实现软硬件全面国产化,为各类园区综合管理效能提升提供更安全、更智能、更易用的AI新智引擎。自2019年首版推出以来,商汤星云AIS智能服务器以算法...……更多
百融云创荣获“2024大模型创新应用奖”
...知识为大模型后续的价值释放提供了源源不绝的动力。多模态融合百融云创大模型与多模态进行了有效的融合。比如基于大模型和语音技术的融合,大模型和动画影像的融合,打造的数字员工和数字人产品,能支持多国语言,提...……更多
...,同参数级性能达到业界领先水平。在此基础上演进出多模态模型,支持声图文3种模态,具备面向多种行业场景的快速定制能力。在大模型底座方面,中国联通借鉴人类职业技能形成规律,打造选模型—改模型—用模型工具链...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
推动数智+大健康产业深度融合 又一研发总部落子长沙天心经开区
...会现场。单位供图活动现场发布了最新的深思考Dongni.ai多模态搜索引擎、智能终端(AI PC Suite、AI 摄像头、AI 显微镜)、重大疾病早期筛查等重磅产品,并宣布深思考人工智能机器人科技有限公司研发总部正式落户天心经开区。...……更多
...互动,没法解决更多的问题,但其实更多的场景是需要多模态组合,结合不同其他的模块,做你自己的产品。一个小公司,把GPT和相关的能够结合的模块熟悉掌握了,就已经能够涉及很多的行业领域了,也能够实解决很多的痛点...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训...……更多
...育之路 与爱同行——记岳阳市第十四中学优秀青年教师李彦青李彦青,全日制英语专业研究生,虽从教仅八年,但她早已出类拔萃:连续多年被评为先进工作者,2024年又被授予“三八红旗手”称号……作为一名教师,李彦青用...……更多
李彦宏:百度AI构架有优势,性能较低的国产芯片仍可高效运作!
3月7日消息,据外媒报道,百度创始人、董事长兼CEO李彦宏在最近的财报电话会议中对外透露,虽然美国限制了英伟达(NVIDIA)和AMD等厂商的高性能AI芯片的对华出口,使得百度无法获得最先进的AI芯片,但百度公司强大的本土...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...包和腾讯的混元等。今年4月,百度董事长兼首席执行官李彦宏就曾在内部讲话中表示,闭源模型在能力上会持续地领先,而不是一时地领先,大模型开源意义不大,闭源才能走通商业模式,闭源是能够赚到钱的,能够赚到钱才...……更多
智驭未来,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0
...能体工具,专注提升数据质量和标注效率,支持超过6种模态数据可视化智能标注,极大满足基于大模型的复杂应用场景需求。此外,在技术创新方面“焱宇”行业大模型服务平台取得显著成果。平台引入算法对模型进行智能化...……更多
“大模型”时代 路凯智行如何Rock AI
...型,随着近几个月SORA的横空出世,融合语言与视觉的多模态模型也已初露峥嵘,但目前市面上的通用大模型并非“万金油”,面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多
vivo自研蓝河操作系统发布:支持大模型、多模态交互
...号称一款面向未来的自研智慧操作系统,支持大模型、多模态交互,还号称是全球首款用Rust语言来编写系统框架的操作系统。近年来,Rust重构的热潮席卷整个开发圈,Rust在安全性、高效性和可维护性等方面都有一定优势,包括...……更多
数据驱动未来:AI大模型在多场景应用中的挑战与机遇
...。随着人工智能的应用场景越来越多元化,需要处理多种模态的数据,例如文本、图像、语音等。未来,大模型将更加注重多模态的融合,以处理更加复杂的应用场景。返回搜狐,查看更多责任编辑: ……更多
更多关于科技的资讯:
三位核心人物的真诚分享,道尽燕教授 13 年健康深耕的温度与底气
10月20日19:30,燕教授《一“张”邀请函》第六季天津蓟州站在官方视频号如期开播,一场以“一“张”邀请函”为主题的深度访谈
2025-10-23 08:15:00
Soul App Q3生态安全报告:AI筑防线,共建安全可靠连接空间
随着移动互联网的普及与社交应用深度融入日常生活,社交平台已成为公众表达观点、建立连接的重要渠道。然而,随之而来的虚假信息传播
2025-10-23 08:15:00
厦门网讯(厦门日报记者 李晓平)近日,省工信厅公布第九批省级制造业单项冠军企业名单,15家厦企上榜,占全省31.2%。包括此次公布的名单
2025-10-23 08:43:00
深耕SUV越野赛道,山东新大陆跻身全球轮胎影响力品牌
齐鲁晚报·齐鲁壹点 高松山东新大陆橡胶科技有限公司成立于2012年,位于临沂市沂水县庐山工业园,是一家以研发、生产、销售高性能半钢子午胎为主的高新技术企业
2025-10-23 11:37:00
小米汽车SOS 1秒接通?高管辟谣:该内容完全失实
10月22日,小米汽车副总裁李肖爽发文:针对近期网传 “小米汽车SOS 1秒接通 不含排队时间”等相关内容,为了避免误传
2025-10-23 11:38:00
天猫双11闪购服务再升级:上线“爆火好店”超时20分钟享免单
2025天猫双11已于10月20日晚正式开售,首次参与双11大促的淘宝闪购今日官宣再加码:全面上线“爆火好店”频道,并推出“超时20分钟免单”服务
2025-10-23 11:38:00
京东001号“国民好车”最高出价超7800万元 京东回应此次异常高价成交事件
10月22日14时,京东001号“国民好车”在京东拍卖平台正式开拍,至18时结束时,最终价格为7819.3399万元,京东用户@j*p竞拍成功
2025-10-23 11:38:00
参小妹海参官宣倪萍为品牌代言人,新工厂同步剪彩开启秋冬滋补新篇
金秋十月,正值秋冬滋补季启动节点,生鲜电商领域知名海参品牌 “参小妹海参”于大连保税区工厂,正式官宣国民级主持人倪萍出任品牌代言人
2025-10-23 11:47:00
苹果入局F1直播:生态渗透与体育转播的范式革命
当苹果与F1的红色标识在屏幕上并置,一场关于体育转播、数字生态与用户体验的深层变革已然开启。2026年起,苹果将以7.5亿美元的价格拿下F1美国地区独家转播权
2025-10-23 12:17:00
科技有温度!及象教育以数字方案弥合银发群体艺术学习的“数字鸿沟”
在人口老龄化与数字科技浪潮交织的今天,如何满足日益庞大的银发群体对精神文化生活的更高追求,已成为社会各界广泛关注的重要议题
2025-10-23 11:47:00
画里有话|充电宝容量岂能“充水”
今年8月,消费者王先生在淘宝某品牌官方旗舰店购买了一款电芯容量为10000毫安的充电宝,背面小字标示的额定容量仅有6000毫安
2025-10-23 08:37:00
厦门网讯(厦门日报记者 杨霞瑜)“AI凑单比价”“AI万能搜”“AI帮我挑”……今年“双11”大促已经开始,AI在电商平台中被广泛使用
2025-10-23 08:42:00
荣耀与比亚迪达成深度战略合作 共绘智慧出行\
10月21日,荣耀与比亚迪在深圳签署战略合作协议。双方将依托荣耀车联解决方案与比亚迪 DiLink的全新一代智慧生态,以"人"为核心
2025-10-23 08:46:00
Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴,以创新和品质突破行业边界
10月16日,创新工具品牌Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴。此次合作基于双方理念的高度契合,Fanttik以“高性能
2025-10-23 09:16:00
宁波银行南京分行携手高德地图共筑南京餐饮数字化增长新生态
10月22日,高德到店助力餐饮行业经营发展(南京专场)活动在南京圆满落幕。该活动由宁波银行南京分行与高德地图联合主办,吸引众多餐饮企业家代表参与
2025-10-23 09:44:00