• 我的订阅
  • 头条热搜
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
打造全球智能消费决策社区,「阿尔特科技」希望提供“像闺蜜一样”有针对性的消费决策辅助 | 早期项目
...评测和信息验证;在需求端,这款App以团队内部开发的多模态模型为支撑,能捕捉细微的用户行为,进而根据用户的实际需求和消费习惯精准推送用户可能感兴趣的产品,帮助用户挑选更合适的、更高性价比的产品,降低客户遇...……更多
刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI
(图片来源:林志佳拍摄)国内活跃度最高的AI大模型应用正走向“多元化”。12月3日消息,钛媒体AGI获悉,字节跳动豆包日前上线了一项实用功能——图片理解。目前,豆包APP及豆包PC新增照片及相机按钮,上传图片后可识别...……更多
Sora出现,手机行业将出现大洗牌?
...效率的储备,包括文本摘要等;“创作”包括文生图等多模态创作;“专属”是培养为用户超级助理,在适当时主动提供信息和服务推荐,因此要有储备用户画像的能力、智能体记忆能力等,帮助AI体验更加专属化。这也要基于...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
...为,从Pika、Gemini1.0到Sora和Gemini1.5,支持AI视频生成的AI多模态模型不断突破,特别是Sora能够理解和模拟现实世界的模型基础,有望成为实现AGI(通用人工智能)的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏...……更多
夸克AI超级框上新“拍照问夸克” 加码多模态能力
...应用,夸克AI超级框持续快速迭代,提升超级智能体的多模态能力,打造用户生活、工作、学习的AI超级入口。视觉交互创新,智能分析万物在工作、学习、生活各类场景中,面对复杂物体、表格和图形时,用户往往难以准确描...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...导读】面壁小钢炮MiniCPM-V 2.6重磅出击,再次刷新端侧多模态天花板!凭借8B参数,已经取得单图、多图、视频理解三项SOTA ,性能全面对标GPT-4V。再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数...……更多
...,但GPT-4o也有一定的能力提升。发布会上,GPT-4o表现出多模态理解和输出能力,它能够跨声音、文本和视觉进行智能推理,可以就用户给出的截图、照片,或含有文本和图像的文件展开对话。项立刚表示,此前ChatGPT主要是通过...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...时间,苹果低调的在arxiv.org网站上发布论文,官宣了在多模态大模型领域的最新成果。在论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以……更多
...品数量更是激增191.89%。报告预测2025年AI陪伴产品将在多模态交互和智能化个性化服务方面实现重大突破。2024年,AI陪伴产品已经开始从纯文本对话扩展到语音通话、视频通话和AR互动等多元化交互方式。展望2025年,这些多模态...……更多
智象多模态生成大模型3.0版发布
...合肥举行。现场,智象未来科技有限公司正式发布智象多模态生成大模型3.0版。智象未来创始人兼CEO梅涛发布智象多模态生成大模型3.0版。主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创...……更多
...显红色文化的意象构境,从而调动多维感官体验,打造多模态话语模式下的红色文化感知场域,唤醒文化自觉;而多种穿戴式设备也可拓展红色文化传播的元信息收集渠道,扩大红色文化传播范围,优化传播效果。一、多方主体...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
...机、PC等,张雪薇看好相关产业链机遇。 大模型正在向多模态发展,由之前的文本、语音到现在的图片,包括未来视频,不同的媒介会诞生出新的应用,会把模型通用化能力提升,未来比如广告推荐、用户画像都会像大模型靠拢...……更多
海信星海大模型接入DeepSeek
...自研星海大模型,覆盖语言大模型、视觉生成大模型、多模态理解大模型三大系列,在语言理解、文本创作、自然对话、图像创作、万物识别、场景画质等能力上行业领先。基于星海基座大模型,海信积极发展垂直领域大模型,...……更多
Sora概念引爆A股!谁在布局AI视频
...技、会畅通讯、博汇科技等个股均涨停收盘。盘面上,多模态AI板块领涨A股,板块涨幅高达11.11%,板块内32只个股全部飘红,其中14只个股涨停;此外AIGC概念、Web3.0等板块同样涨幅居前。消息面上,近日,OpenAI推出了新的文生视...……更多
...全球多家科技公司发布新的大模型,它们在语义理解、多模态等方面进一步提升,人工智能(AI)的能力边界在不断扩大。随着无人驾驶、机器人等技术借助AI快速进化并逐步投入市场,不少国家通过推进法规建设、开展国际合...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
“唤醒”甲骨文 厦大团队尝试用AI破译古老文字
...跨字体IDS解码和甲骨文现代字对译关系等,以有效训练多模态大模型运用AI未来设想是上传甲骨文图像,让AI告诉你这个图像可能对应的现代汉字候选,以及每个候选字的概率厦门网讯(本版文/厦门日报 佘峥 通讯员 戴佩琪 本版...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
2024年投资展望丨AI、MR、短剧等概念爆发,传媒板块去年逆市涨近17%
...的发展,带来结构化的成长趋势。一、AI应用拓展 1、多模态加速应用端落地 目前,多家厂商快速布局卡位多模态大模型,AI文生图、文生视频等多模态能力持续提升带动AI应用持续迭代升级。海内外爆款AI应用频现,如Pika 1.0、R...……更多
Brilliant Labs发布全球首款集成多模态AI眼镜
...眼镜开发商BrilliantLabs宣布推出Frame,这是全球首款集成多模态AI助手的眼镜。Frame不仅重新定义了视觉方式,还重新定义了用户与物理世界的交互方式,而它的外观设计与真实眼镜无差别。此次BrilliantLabs还获得最新一轮融资,其...……更多
标贝科技亮相全国人机语音通讯学术会议NCMMSC2023并发表主题演讲
...形式为与会代表展示了全栈AI数据服务方案以及丰富的多模态数据库。并以市场需求为导向,分享了标贝科技在数据处理方向的实践成果,吸引了众多客户关注。大会首日,标贝科技COO助理周彤在工业论坛上分享了《基于数据大模型...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
更多关于科技的资讯:
“数字之城”杭州如何驶入文旅发展新赛道?
中新网杭州12月18日电(曹丹)近日,《AI涌现——2025杭州数字文旅产业发展年度报告》在浙江杭州发布。报告显示,该市数字文旅骨干企业2025年前三季度营收同比增长10
2025-12-19 08:24:00
天立教育与腾讯教育达成战略合作,携手推动K12教育智能化升级
2025年12月16日,天立教育与腾讯教育达成战略合作。双方将深度融合腾讯的前沿AI技术能力,与天立启鸣在K12教育领域积累的教学经验与实践场景
2025-12-19 08:26:00
特步签约全运会冠军刘景扬,从耐力赛道到速度赛场的战略延伸
12月18日,中国领先体育用品品牌特步正式宣布第十五届全运会女子100米栏冠军刘景扬成为特步体育代言人。此次合作不仅是特步运动资源矩阵的拓展
2025-12-19 08:26:00
西交利物浦大学启用沉浸式球幕影院,MEGA创意媒体盛典与国际沉浸媒体联盟同步亮相
12月18日,西交利物浦大学影视与创意科技学院揭幕沉浸式球幕影院,并举办第五届MEGA国际创意媒体盛典,同时宣布国际沉浸媒体联盟正式成立
2025-12-19 08:26:00
协同作战、共创大美食材节,良之隆集团328百天倒计时动员会举行
12月18日,是良之隆・2026第十四届中国食材电商节的倒计时100天。在此之际,良之隆集团举办了3·28百天倒计时动员会
2025-12-19 08:26:00
马克思曾指出:“生产力是社会发展的最终决定力量。”AI作为第四次工业革命的重要推动力量,正用数据、算法和算力重构生产力的模样
2025-12-19 10:56:00
我国虚拟数字人领域首个国家标准《信息技术客服型虚拟数字人通用技术要求》近日正式发布。该标准的出台填补了行业技术规范的空白
2025-12-19 12:14:00
“有烟草证就能办纯信用贷款,50万元额度随借随还,这下旺季订烟的资金缺口彻底补上了!”上饶市余干县一家超市负责人李先生
2025-12-19 12:14:00
在数字经济与日常生活深度融合的今天,优质的服务体验已成为衡量企业核心竞争力的重要标尺。中国移动通信集团江苏有限公司无锡分公司(下称“无锡移动”)再次荣获国家级“用户满意服务”认证
2025-12-19 13:15:00
米连科技布局多元社交矩阵,满足不同情感连接场景
当提及线上社交平台时,许多人脑海中首先浮现的仍是“婚恋”或“约会”的单一标签。然而,米连科技通过其创新实践,正在系统性地打破这一固有印象
2025-12-19 13:58:00
浙江日报杭州12月18日讯 (记者 何冬健 通讯员 肖乐) 记者18日从之江实验室举办的021科学基础模型创新合作大会上获悉
2025-12-19 08:54:00
在共享经济与人工智能技术加速融合、新就业形态不断涌现的当下,如何规范发展、保障权益、激发创新活力成为关键。近日,由杭州高新区(滨江)市场监督管理局牵头起草的两项团体标准——《共享
2025-12-19 06:51:00
本报记者 程宬3000元本金、一张百货柜台、十来个工人,这是彭广杰2020年春天的全部家底;三年半后,他的PAOFU宠物用品旗舰店在拼多多日出5000单
2025-12-19 07:18:00
在工厂轻松搬运物料、在医院为患者做预诊、在赛场上竞速奔跑……2025年即将收官,“具身智能”以高票入选年度十大流行语榜单第二名
2025-12-19 07:18:00
出门问问打造的AIGC产品服务用户数已超1500万、江苏奥赛康研制的新型抗感染药物加速攻关……时至今日,在南京,一个个令人瞩目的成果背后
2025-12-19 07:18:00