• 我的订阅
  • 头条热搜
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...源研究院院长王仲远介绍了智源研究院在语言大模型、多模态大模型、具身大模型和生物计算大模型的前沿探索和研究进展,以及大模型全栈开源技术基座的迭代升级与版图布局。王仲远表示,未来,大模型将以数字智能体的形...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联
...称只要500美元(约合人民币3622元)就能训练出一个SOTA多模态模型,且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。由于该团队的三位作者都来自斯坦福大学,又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历,发布该...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
趣丸科技荣膺2024福布斯中国年度最佳数智化雇主
...业高质量发展。在数智人领域,趣丸智能打造的沉浸式多模态交互数字人平台,可以分钟级生成高逼真的数智人,实现智能对话交互,并将数智人制作成本从万元级下降至百元级,极大解决了传统数字人制作周期长、成本高、交...……更多
周睿:起跑要趁早
...自动驾驶、机器人等领域。迄今,周睿已经发表了多篇多模态AI研究和机器人领域的论文。读大一期间,周睿还到苹果公司实习。在那里,他见识到了硅谷顶尖的公司团队之间是怎么合作的,包括他们的工作方式——怎么创造产...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
支付宝多模态医疗大模型正式亮相
...2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介绍...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...言,这又是波澜壮阔的一年。Sora掀起视频生成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。大语言模型仍在狂飙,但价格战、...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...在走。机器之心:这种「大统一」模型与大语言模型、多模态大模型以及之前的机器人模型的关系是?统一具身模型的技术方向,既完全不同于传统机器人学习的小模型技术,也完全不同于以往语言、多模态大模型的技术。首先...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
“黄埔星”大模型发布!第三届粤港澳大湾区(黄埔)国际算法算例大赛启动
...创新,聚集力量推进“黄埔星”大模型成为国内领先的多模态基础大模型,在全国范围内征集选拔优秀单点技术,实现大模型在领域赋能上快速突破。广州市黄埔区政府一级调研员杨家伟表示,大赛在聚集人才、攻关科研及产业...……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...型等。除大模型外,算法团队正深入研究小样本学习、多模态机器学习、鲁棒学习和知识推理等核心技术,力求在认知智能领域实现重大突破。论坛上,牛津大学DeepMind人工智能教授Michael Bronstein带来了关于“几何深度学习—从...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
李开复:中国大模型与美国顶尖差距从7年缩短至6个月
...赢”的程度,零一万物就会转向国外市场。中国大模型与美国顶尖差距从7年缩短至6个月?自ChatGPT横空出世引发国内外的大模型创业浪潮以来,有不少创业者通过各种大模型榜单来证明自己大模型产品的能力,但是各类榜单鱼龙...……更多
更多关于科技的资讯:
涉及两起命案:福特被深度调查!
快科技1月23日消息,近日,美国家公路交通安全管理局(NHTSA)宣称,已对福特BlueCruise驾驶辅助系统展开工程分析(EA)
2025-01-23 18:33:00
当前设计塞不进电池:纯电版路虎卫士将推迟至2030年
快科技1月23日消息,捷豹路虎首席商务官Lennard Hoornik在接受采访时透露,电动版路虎卫士预计要到2030年前后才会问世
2025-01-23 18:33:00
国人骄傲!阿里云、华为首席技术官双双入选美国计算机协会
快科技1月23日消息,据媒体综合报道,今日凌晨,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届会士名单
2025-01-23 18:33:00
中韩独享!三星Galaxy S25 Ultra 16GB版本无缘欧美市场
快科技1月23日消息,三星Galaxy 25系列已面向全球发布,所有型号其实内存均为12GB。其中,三星Galaxy S25 Ultra独享16GB大内存
2025-01-23 18:33:00
奇瑞2025王炸开局!要做中国大G 新车秒变船 排水量4吨
中国的豪华越野市场,又闯进一位新选手。昨晚,奇瑞正式发布全新产品序列——捷途纵横,这是奇瑞品牌向上战略的关键一步,起点很高
2025-01-23 18:33:00
599元起!玄派玄熊猫PD75M V2机械键盘开售:彩屏+旋钮、索尼克轴
快科技1月23日消息,玄派科技正式上架了玄熊猫PD75M V2机械键盘,其特点是内置彩屏和金属旋转按钮,首发价格分别为599元和629元
2025-01-23 18:33:00
小米SU7最贵配色!雷军晒璀璨洋红实车:明天开始陆续进店
快科技1月23日消息,雷军最新发文称,小米SU7璀璨洋红明天开始陆续进店,届时大家就能去店里看到实车了。他还晒出了几张在小米汽车工厂拍摄的实车照片
2025-01-23 18:33:00
Intel前CEO基辛格新动向公布!成初创AI芯片公司种子投资人
快科技1月23日消息,在离开英特尔后,前CEO帕特·基辛格(Pat Gelsinger)在社交媒体上公布了新动向,成为英国AI芯片初创公司Fractile
2025-01-23 18:33:00
RTX 5090缺货不可思议!英国顶级零售商只有几块
快科技1月23日消息,由于AIC沟通问题、中国春节放假、BIOS调试等种种原因,RTX 5090/5090D、RTX 5080上市初期的供货将非常紧张
2025-01-23 18:33:00
上半年最值得关注的5款新车盘点:看完你会买吗
说实话,25年上半年并不是购车的较好时机,因为英伟达下一代最强算力平台Thor有望会从6月开始上市,部分车企的明星产品也推迟到了对应时间点
2025-01-23 18:33:00
3C数码国家补贴至高省2000元 手机补贴15%
京东货节大促将在今晚 24 点正式结束,年前最后一波福利不要错过。京东红包每天抽 3 次 面额至高 9999 元:点此抽红包(1 月 23 日 24 点结束)手机
2025-01-23 18:33:00
被五步蛇咬了 只走四步还会死吗
提示:本集内容涉及大量蛇,对蛇敏感人士建议不要打开,想“知己知彼”对付毒蛇的建议收看,怕被毒蛇咬的建议收藏。责任编辑:上方文Q文章内容举报
2025-01-23 18:33:00
又一家国产新势力爆雷!员工工资数月未发 强制放假
快科技1月23日消息,据博主爆料称,又一家国产造车新势力爆雷,员工已被拖欠数月工资,且被安排强制放假。被传爆雷的新势力是智行盒子
2025-01-23 18:33:00
“天关”卫星探测到宇宙早期爆发的软X射线信号
本文转自:人民日报客户端基于天关卫星的观测数据,中国科学院国家天文台等单位的科研人员,发现1例来自宇宙早期的伽马射线暴
2025-01-23 18:35:00
“我们食品厂生产的银丝面久煮不烂、晶莹剔透,入口香软滑嫩,在市场上的销售一直很好。感谢咱农商银行提供的50万元的信贷资金
2025-01-23 19:03:00