• 我的订阅
  • 头条热搜
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
...国内领先星辰系列大模型,构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。视觉大模型赋能100+城市治理下...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...AI搜索,相比New Bing搜索和谷歌AI搜索,它的最大特色是多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转...……更多
多模态AI概念持续活跃 苏州科达4连板 【多模态AI概念持续活跃 苏州科达4连板】财联社12月12日电,多模态AI概念持续活跃,苏州科达4连板,云鼎科技2连板,因赛集团、万兴科技、昆仑万维、当虹科技等跟涨。消息面上,据媒体...……更多
广东“大模型”赋能文化产业落地发展
...型“大瓦特”是电力行业首个基于自主可控算力研发的跨模态大模型,也是首个在电力行业应用最广的大模型。南方电网人工智能公司技术经理林全郴告诉记者,目前,该模型以通用训练语料和电力行业专业知识数据为基础,覆...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...达到 750 亿参数,性能获得了大幅升级。AInno-75B 增加了多模态处理能力,支持输入文本、图像、视频以及工业场景中的行为(Action)模态,如 CAD 等。通过引入高参数量大模型 AInno-75B, 创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多
...产算力平台或具有十亿参数以上等方向的视觉、语言、多模态等大模型作品;瞄准国家重大战略、社会民生关切和垂直行业场景需求,基于国产化人工智能软硬件平台,聚焦工业、金融、医疗、交通、能源、教育、政务、智慧城...……更多
科学家研发AI睡眠模型,捕捉多导睡眠图数据特征,提升睡眠障碍
...出一款名为 MSSC-BiMamba 的 AI 模型,能够捕捉多导睡眠图多模态数据特征,提升睡眠分期与睡眠障碍的诊断效率。图 | 郭晶晶(来源:郭晶晶)据介绍,考虑到多导睡眠监测的特点,该团队设计了这款多模态睡眠状态分类模型。该...……更多
多模态AI概念股快速反弹 国新文化涨停 【多模态AI概念股快速反弹 国新文化涨停】财联社2月29日电,国新文化涨停,开普云、宣亚国际、因赛集团涨超5%,天娱数科、竞业达、汉王科技等跟涨。消息面上,字节跳动正在AI大模型...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
华为余承东表示,MateBookX Pro将采用盘古AI模型
...基于知识的问答、文案和盘古NLP模型的代码生成;盘古多模态模型的图像生成与理解。想象一下,无论是在办公室还是在家中,MateBookXPro都能与你的华为手机、平板等设备无缝连接,让你在多任务处理中游刃有余。加上其创新的AI...……更多
微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V秒懂屏幕截图
...ace 上发布 OmniParser,普及这一前沿技术,将进一步推动多模态 AI 的发展,特别是在无障碍、自动化和智能用户辅助等领域。 ……更多
...令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。 Tims天好咖啡与申通地铁达成合作36氪获悉,连锁咖啡品牌Tim Hortons中国业务及炸鸡汉堡品牌Popeyes中国业务宣布,在上海地铁14号沿线站...……更多
苹果展示ferret-uiai系统可理解应用程序
...够让AI模型能够理解图像、视频和音频等非文本内容,多模态大语言模型(MLLMs)因此孕育而生。只是现阶段MLLMs还无法有效理解移动应用程序,这主要有以下几个原因:1.手机屏幕的宽高比,和大多数训练图像使用的屏幕宽高比...……更多
手机 AI 2.0 时代,OriginOS 5 找到了哪些「成功密码」?
...现。 除了读屏之外,OriginOS 5 还加强了各种场景下,多模态数据的「自动处理转换」能力。 新的小 V 电话助手、小 V 帮记可以将电话、线上会议的音频实时转成文字,显示字幕,并进一步实现「智能生成摘要」、「同声传译」...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...低了82%。最新发布的GPT-4o更是被称为现实版的斯嘉丽,多模态的输入输出能力和类人化的情感表达让网友直呼,“她来了!”。不仅支持文、图、音频三种信息形态的输入,并且可以做超过50种语言的同声传译。甚而有网友给GPT-...……更多
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
...已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、...……更多
被认可的大模型价格战
...个变化是大模型开始具有思考、学习、沟通、共情甚至多模态处理能力,就像是医生,既需要多模态,也需要减少幻觉,同时需要有强大的记忆能力、查文献能力、推理能力,如果把行业上能共识的能力都投射到做医生的标准中...……更多
多模态概念股反复活跃 汉王科技2连板 【多模态概念股反复活跃 汉王科技2连板】财联社12月13日电,汉王科技2连板,苏州科达5连板,云鼎科技、当虹科技涨超5%,拓尔思、因赛集团等跟涨。消息面上,据媒体报道,谷歌的一个...……更多
广东:着力构建高质量多模态中文数据集 【广东:着力构建高质量多模态中文数据集】财联社11月13日电,广东省人民政府发布关于加快建设通用人工智能产业创新引领地的实施意见。其中提到,深入实施广东第二轮公共数据资...……更多
工业元宇宙AI超级终端“派中心一体机”问世
...宇宙平台和应用的服务商。以领域大模型、空间计算、多模态仿真和智能控制技术为核心,构建虚实映射、虚实共生和以虚控实的持续改进体系,形成产业数字化新范式,赋能传统产业实现数字化跨越式发展。 ……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
...制,结合行业专业知识,经过不断训练和优化构建出的多模态自研行业大模型,具备在船舶设计、性能预测、航运气象服务等特定领域任务处理能力,可以助力船舶与海洋工程行业提高工作效率。船舶与海洋工程行业作为典型的...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...的。现在试想,如果上传的商品信息既能在文字、图像等模态上保持不变,又能够与文字、图片、视频等模态模型实现很好的融合,从而为商家产出AI商品图、海报、短视频,甚至是3D交互内容,这个市场需求是很大的。今年,...……更多
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
...。至于Google,最新的情况是推出了AI模型Gemini,特点是多模态处理和对复杂逻辑的理解能力。在行业标准MMLU(多任务语言理解)基准测试中,Gemini是唯一一个成绩超越人类专家测试结果的AI模型。图片来源:微博截图北京市社会...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
更多关于科技的资讯:
CBD 新地标:Z3,未来办公引擎登场
北京,2025年9月24日——北京 CBD 核心区再添重磅力作!今日,备受瞩目的 Z3 超甲级写字楼项目正式揭开神秘面纱
2025-09-25 13:43:00
中国电信-海信日立联合实验室揭牌,共筑智慧家电产业新高地
9月19日,中国电信山东公司、天翼物联科技公司与青岛海信日立在青岛举行联合实验室揭牌仪式,标志着三方战略合作迈入全方位深度融合的新阶段
2025-09-25 13:43:00
2025云栖大会直击:云深处科技机器人矩阵亮相,多场景展示行业引领性!
9月24日至26日,全球云计算与 AI 领域年度旗舰盛会 ——2025 云栖大会在杭州云栖小镇盛大启幕。本届大会以“云智一体・碳硅共生”为核心主题
2025-09-25 13:44:00
为落实《个人征信电子授权安全技术指南》(JR/T 0299—2024)金融行业标准,规范金融机构在个人征信电子授权中的技术操作
2025-09-25 13:44:00
文玩新经济浪潮奔涌,2025全国文玩大会重塑行业生态与消费图景
秋意渐浓,北京迎来一场文玩行业盛会。9月24日至28日,以“国潮觉醒 文玩新生”为主题的2025全国文玩大会于潘家园市场(西区)盛大举行
2025-09-25 13:46:00
如今,微短剧已然从“内容新贵”成长为拉动数字经济的重要力量。因为“轻、快、密”的内容节奏,短剧得以迅速占领用户的碎片时间
2025-09-25 13:46:00
三榜齐登、实力认证!网易有道连续五年入选“北京民营企业百强”
日前,北京市工商联、通州区人民政府联合召开2025北京民营企业百强发布会。会上,网易有道凭借持续的创新能力和稳健的业绩表现
2025-09-25 10:06:00
济南爱尔眼科实施全国首批龙晶PR型有晶体眼人工晶状体植入术
近日,首批龙晶PR型有晶体眼人工晶状体植入手术在济南爱尔眼科医院完成,作为“尝鲜吃螃蟹”的人,患者脸上洋溢着发自内心满意的微笑
2025-09-25 11:20:00
观赛有了更佳的趣味性与沉浸感金科院数字科技赋能国际赛艇大赛南报网讯(通讯员陆慧记者姜静实习生黄佳琪)2025南京·大学生国际赛艇公开赛近日在外秦淮河畔举行
2025-09-25 07:38:00
提升“双盲”模式下的评标质效雄安新区面向评标专家智能问答系统正式上线河北日报讯(见习记者康晓博)只需轻点鼠标,远在外地的评标专家就能获得精准指引
2025-09-25 07:58:00
大模型算出爆款,红枣变致富“金枣”
大模型算出爆款,红枣变致富“金枣”——看沧县红枣及干坚果食品加工产业如何实现数字化转型9月18日,河北华聚食品有限公司的工人忙着打包红枣产品
2025-09-25 07:59:00
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00
5项科技创新成果案例发布芯片设计迎“超强大脑”多癌早筛一管血“搞定”南报网讯(记者张安琪)9月23日,2025南京金洽会开幕式重点发布环节
2025-09-24 08:12:00
在今年国庆、中秋双节消费旺季来临之际,济南122站以“客户体验感”为核心,从“环境优化、商品管理、客户拓展”三大维度精准发力
2025-09-24 08:50:00