• 我的订阅
  • 头条热搜
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...源研究院院长王仲远介绍了智源研究院在语言大模型、多模态大模型、具身大模型和生物计算大模型的前沿探索和研究进展,以及大模型全栈开源技术基座的迭代升级与版图布局。王仲远表示,未来,大模型将以数字智能体的形...……更多
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”
...潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密...……更多
创新工场李开复:AI 2.0已至,将诞生新平台并重写所有应用
...的重大突破之后,AI 已经来到从 1.0 迈入 2.0 的拐点。多模态、巨型数据集的飞速发展,AI 优化目标函数及训练模型的技术方法将大幅精进,能更好地模拟人类的认知智能。此外,AI 2.0 将会带来平台式的变革,改写用户的入口和...……更多
...1亿美金。资金主要将用于核心研发团队的建设,加速多模态大模型和应用产品的研发。成立于2023年3月,生数科技由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化,聚焦于多模态生成式大模型与应...……更多
Tech100 | 哈工大深圳团队入局多模态大模型,自研「若愚-九天」荣登OpenCompass榜首
...托学校的哈深资产经营有限公司进行成果转化,成立了多模态大模型研发企业--深圳若愚科技有限公司(以下简称“若愚科技”)。若愚科技旗下首款多模态大模型“若愚-九天”首次参评即登顶OpenCompass多模态大模型榜单。多模...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联
...称只要500美元(约合人民币3622元)就能训练出一个SOTA多模态模型,且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。由于该团队的三位作者都来自斯坦福大学,又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历,发布该...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
奇绩创坛2023春季路演日:60个项目,超一半与大模型相关,企服项目占比第二
...轮智能开创性的将生成式AI与仿真技术深度融合,提供多模态、高质量、大规模、低成本的合成数据,弥补AI时代的数据缺口。 团队介绍:团队成员在合成数据、生成式AI、仿真等领域均有丰富经验。创始人兼 CEO谢晨博士是将生...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
「虎博科技」发布自研多模态大模型TigerBot,开源模型、代码及数据 | 36氪首发
作者 | 邓咏仪编辑 | 苏建勋36氪获悉,6月7日,虎博科技正式发布并开源其自研大模型TigerBot。同时,虎博科技还发布了大模型应用开发所需的全套API,以及多领域专业数据。虎博科技成立于2017年,是一家专注于深度学习及NLP(...……更多
中国最接近GPT3.5的团队 默默无闻的驻扎在西湖边
...情感感知和主动聊天的特色。凭借着顶流的技术团队、多模态的技术优势,这个默默无闻的低调企业,不仅打造了国内极少数能与GPT-3.5一较高下的大模型,还多次赢得了360周鸿祎、美团王慧文的青睐。如今,汤姆猫将成为西湖...……更多
趣丸科技荣膺2024福布斯中国年度最佳数智化雇主
...业高质量发展。在数智人领域,趣丸智能打造的沉浸式多模态交互数字人平台,可以分钟级生成高逼真的数智人,实现智能对话交互,并将数智人制作成本从万元级下降至百元级,极大解决了传统数字人制作周期长、成本高、交...……更多
周睿:起跑要趁早
...自动驾驶、机器人等领域。迄今,周睿已经发表了多篇多模态AI研究和机器人领域的论文。读大一期间,周睿还到苹果公司实习。在那里,他见识到了硅谷顶尖的公司团队之间是怎么合作的,包括他们的工作方式——怎么创造产...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
京东要给实体产业做个GPT
...测试,都会为AI带来点滴新的进步。决战大模型:走向多模态与实体京东云今年将发布的新一代产业大模型 ——言犀大规模预训练语言模型,被视为是AI角逐产业场景的开端。京东云言犀团队前后耗费多年时间,持续深耕对话式A...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...在走。机器之心:这种「大统一」模型与大语言模型、多模态大模型以及之前的机器人模型的关系是?统一具身模型的技术方向,既完全不同于传统机器人学习的小模型技术,也完全不同于以往语言、多模态大模型的技术。首先...……更多
更多关于科技的资讯:
华为 WATCH D2 揽获七大医疗器械认证
创新技术重新定义血压健康管理方式。11月19日,华为终端官方宣布,新一代智能血压表华为WATCHD2即将在11月26日与大众见面
2024-11-22 14:04:00
X200 Pro炫光问题被vivo用AI修好了?
最近这半个月时间里,vivoX200Pro的炫光问题成为数码圈最热门的话题之一。10月19日,vivoX200系列正式开售
2024-11-22 14:04:00
AI重点通知火了!苹果三星领衔,AIOS的下一个爆点?
今年的AIOS们都在卷些什么?答案是智能助手。更聪明的智能助手,在大模型的加持下有了更强的任务执行能力,比如荣耀的YOYO智能体
2024-11-22 14:04:00
必胜客PS5官方配件好蠢,但我真的想要一个
上一个将餐饮与数码结合起来的品牌是Kindle泡面盖,这一次是必胜客。你能把披萨和游戏机联系在一起吗?事情是这样的:近日
2024-11-22 14:04:00
小白相机爆火!人人都是摄影师,相机市场的悲哀还是福音?
都说手机将消灭相机,结果这几年相机卖得越来越火爆了。以往摄影师在很多人心中还是一个代表着专业和高级的名词,毕竟早期的一套相机怎么也要个两三万块钱
2024-11-22 14:04:00
同方笔记本显卡可拆可升级?游戏本市场要变天了!
前段时间,准系统笔记本电脑刚宣告没落,没想到转头国产厂商就给我们带来了新的惊喜:一款模块化设计的笔记本电脑。熟悉笔记本电脑产品的朋友
2024-11-22 14:04:00
史上最强折叠屏旗舰来了!华为Mate X6将至
继三折叠手机华为MateXT非凡大师引爆市场后,华为又一款折叠屏手机带着全新分布式玄武架构来了!11月20日上午,华为终端官微上线折叠屏五年回顾视频
2024-11-22 14:05:00
华为Mate 70「金丝银锦」火了!手机厂商开卷后盖材质
在今天的话题开始之前,我想问大家一个简单的问题。你会介意手机的机身材质吗?或许大多数用户面临这个问题答案可能是:不知道
2024-11-22 14:05:00
Pokémon Go开发地理空间大模型,AR眼镜的高精地图?
两天前,知名AR厂商Rokid发布了新一代AR眼镜——RokidGlasses,通过摄像头、多模态大模型以及(玻璃衍射)光波导等技术
2024-11-22 14:05:00
努比亚Z70 Ultra评测:影像实力超群,最激进的AI手机
2017年,苹果发布iPhoneX,其关于前置摄像头模组(FaceID)的设计也掀起了手机行业对“额头”的讨论。当时业内对手机额头的处理方式可以分为三类
2024-11-22 14:06:00
苹果首款AI电视曝光!灵感竟然来自中国的“闺蜜机”?
现在市面上名为AppleTV的产品,本质是电视盒子而不是电视。最新消息称,苹果居然要推出真正的智能电视了?彭博社科技记者MarkGurman在最新的通讯栏目里透露
2024-11-22 14:06:00
Wi-Fi 8标准曝光!“人多没网”成历史,XR设备春天到了
Wi-Fi7都还没捂热,Wi-Fi8就有消息了,不少人都说无线通信技术更新缓慢,但是在Wi-Fi技术上,怎么好像有点不一样
2024-11-22 14:06:00
追觅云鲸领衔!双十一智能清洁大爆发,美的们如何狙击新势力?
一年一度的双十一已经落幕,相比前几年,今年双十一的优惠力度堪称史上之最,各种平台优惠劵加上相关补贴,让原本不少价格高高在上的产品降到了一个亲民的价格
2024-11-22 14:06:00
ROG 9 Pro上手:游戏性能拉满,综合体验更全能了
没想到吧?继前段时间发布的红魔10Pro系列后......又一款「真·游戏手机」,来了!那就是ROG玩家国度刚刚正式发布的迭代游戏旗舰——ROG9系列
2024-11-22 14:06:00
2024年11月22日,调研咨询机构环洋市场咨询出版的《全球客户洞察营销平台行业总体规模、主要厂商及IPO上市调研报告
2024-11-22 14:19:00