• 我的订阅
  • 头条热搜
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...源研究院院长王仲远介绍了智源研究院在语言大模型、多模态大模型、具身大模型和生物计算大模型的前沿探索和研究进展,以及大模型全栈开源技术基座的迭代升级与版图布局。王仲远表示,未来,大模型将以数字智能体的形...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联
...称只要500美元(约合人民币3622元)就能训练出一个SOTA多模态模型,且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。由于该团队的三位作者都来自斯坦福大学,又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历,发布该...……更多
又有厂商加入“百镜大战”,学雷军首款AI眼镜定价999元
...闪极等丰富服务,可实现对用户的录音、文字和图像等多模态数据的高效记录、快速存储和多端同步;同时通过内置的AI应用商店,实现对于各种AI能力的灵活调用。现场演示中,眼镜实现帮忙随时记下行李箱密码、分析冰箱中...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
趣丸科技荣膺2024福布斯中国年度最佳数智化雇主
...业高质量发展。在数智人领域,趣丸智能打造的沉浸式多模态交互数字人平台,可以分钟级生成高逼真的数智人,实现智能对话交互,并将数智人制作成本从万元级下降至百元级,极大解决了传统数字人制作周期长、成本高、交...……更多
周睿:起跑要趁早
...自动驾驶、机器人等领域。迄今,周睿已经发表了多篇多模态AI研究和机器人领域的论文。读大一期间,周睿还到苹果公司实习。在那里,他见识到了硅谷顶尖的公司团队之间是怎么合作的,包括他们的工作方式——怎么创造产...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
生成模型真实物理引擎Genesis来了!由全球AI顶尖高校团队开发
...并实现从中性到愤怒再到快乐等情绪的自然过渡。这种多模态生成能力为虚拟人物的创建提供了新的可能性。目前,研究团队已经开源了底层物理引擎和模拟平台的代码(项目地址:https://genesis-embodied-ai.github.io/),生成框架部...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...言,这又是波澜壮阔的一年。Sora掀起视频生成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。大语言模型仍在狂飙,但价格战、...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
“唤醒”甲骨文 厦大团队尝试用AI破译古老文字
...跨字体IDS解码和甲骨文现代字对译关系等,以有效训练多模态大模型运用AI未来设想是上传甲骨文图像,让AI告诉你这个图像可能对应的现代汉字候选,以及每个候选字的概率厦门网讯(本版文/厦门日报 佘峥 通讯员 戴佩琪 本版...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...在走。机器之心:这种「大统一」模型与大语言模型、多模态大模型以及之前的机器人模型的关系是?统一具身模型的技术方向,既完全不同于传统机器人学习的小模型技术,也完全不同于以往语言、多模态大模型的技术。首先...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
“黄埔星”大模型发布!第三届粤港澳大湾区(黄埔)国际算法算例大赛启动
...创新,聚集力量推进“黄埔星”大模型成为国内领先的多模态基础大模型,在全国范围内征集选拔优秀单点技术,实现大模型在领域赋能上快速突破。广州市黄埔区政府一级调研员杨家伟表示,大赛在聚集人才、攻关科研及产业...……更多
AI卷翻科研!DeepMind 36页报告:全球实验室被「AI科学家」指数级接管
...发生的噪声和错误。科学家们还可以利用LLM越来越强的多模态能力,从科学出版物、档案文件以及视频图像等资源中提取非结构化的科学数据,并将其转化为结构化数据集,以做后续研究。AI还可以帮助为科学数据添加科学家所...……更多
更多关于科技的资讯:
榴莲不让带进火车站 4人光速炫完:差点吃吐
5月29日消息,据媒体报道,因榴莲不让带进火车站,4个人在安检处光速炫完3个榴莲。拍摄者张女士称,同伴们买了三个榴莲准备带回老家
2025-05-29 00:28:00
荣耀回应何时上市:会找个合适时机 让大家都满意
快科技5月29日消息,日前,荣誉400系列发布,荣耀CEO李健等高管参加会后媒体采访环节。据媒体报道,在谈及荣耀上市进度时
2025-05-29 00:28:00
沈阳一万兆小区入围工信部试点项目名单:实测下载速率9446Mbps
快科技5月29日消息,近日,沈阳移动基于华为50G PON解决方案打造的沈阳月星环球港一期万兆小区项目,成功入围工信部发布的万兆光网试点名单
2025-05-29 06:58:00
5月25日,记者从山西风行测控股份有限公司获悉,截至目前,风行虚拟电厂聚合负荷容量达32家,聚合容量1500MW,最大运行负荷480MW
2025-05-29 07:11:00
新华社杭州5月28日电当人们与DeepSeek等大模型深度对话、当宇树人形机器人在春晚舞台上扭起秧歌……今年以来,浙江的人工智能软硬件应用
2025-05-29 07:12:00
19800元!索尼发布FX2电影机 支持7K超采样4K
快科技5月29日消息,索尼(中国)发布了紧凑型4K全画幅电影摄影机ILME-FX2,将于7月上市,单机身建议零售价19800元
2025-05-29 07:28:00
美国小伙“娶”5个老婆、生11个孩子 理由竟是为了不再出轨
我知道我是个科普博主,但看到这个故事,实在是忍不住,得和你们分享。这个美国小伙有5个稳定的“老婆”,还生了11个孩子,一大家子住一起还异常和谐
2025-05-29 07:28:00
小米:SU7卖爆击垮友商 不靠降价靠实力 YU7有望再创辉煌
快科技5月29日消息,本周小米发布了财报,而会后高管也是接受了采访,其中他们还谈到了YU7。当被问及小米YU7上市后会对小米SU7带来怎样的影响
2025-05-29 07:28:00
苹果系统将全线重命名!用年份代替版本号:iOS 19改名iOS 26
快科技5月29日消息,苹果公司的各设备操作系统一直十分稳定的迭代,每年6月发布开发者预览版,9月之后陆续发布正式版。目前已经延续到iOS 18
2025-05-29 07:28:00
悦康药业:以“百分质量”铸就创新护城河
原标题:悦康药业:以“百分质量”铸就创新护城河撰文丨九裘小妹编辑|塔尔·小康A在生物医药产业加速变革的当下,一家成立24年的民族药企正以硬核创新重塑行业格局
2025-05-28 20:08:00
网易云音乐继续“听劝”:iPad端全新升级无广告纯净版
快科技5月28日消息,今日,网易云音乐宣布iPad端产品新版(beta)正式上线。在产品功能、界面设计、iPad系统适配等方面
2025-05-28 20:27:00
荣耀CEO李健官宣百万雄鹰计划:全球招募10位技术领军人才 上千名优秀毕业生
快科技5月28日消息,今晚,荣耀举办荣耀400系列发布会,荣耀新任CEO李健在发布会上完成国内首秀。李健在发布会上正式宣布全球百万雄鹰计划
2025-05-28 20:27:00
酷凛新款下压式风冷首发139元:一体式超薄设计
快科技5月28日消息,据媒体报道,酷凛新款下压式风冷IS-53-XT BLACK目前已经上市,首发139元。IS-53-XT BLACK采用了全新的黑色外观
2025-05-28 20:27:00
荣耀确认进军机器人业务:跑步速度4m/s 打破行业记录
快科技5月28日消息,今晚,荣耀新CEO李健在国内首秀,主讲荣耀400系列新品发布会。在发布会开场,李健先是展示了其员工与机器人研发的故事
2025-05-28 20:27:00
大众网记者 王帅 潍坊报道在当前复杂多变的经济形势下,房地产行业的波动如同多米诺骨牌,对众多上下游产业产生了连锁反应。作为江北最大的铝型材市场——潍坊临朐铝型材市场
2025-05-28 20:30:00