• 我的订阅
  • 头条热搜
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
...国AI产业规划的路线图,就是通过大量堆砌算力,建立多模态通用大模型。同时,其压制中国AI发展的思路,也是通过限制芯片这一算力的核心而来。 但经过两年发展,美国限制措施并没有取得预想中“拦腰斩断”的效果。据《...……更多
全球顶尖人工智能科学家加盟 阿里AI To C业务布局再提速
...出任阿里集团副总裁,向吴嘉汇报,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。近期,阿里AI To C业务大动作频频,引入世界级顶尖人才,组建顶级AI算法研究和工程团队,将进一步刷新国内AI应用赛道...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”
...潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密...……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...源研究院院长王仲远介绍了智源研究院在语言大模型、多模态大模型、具身大模型和生物计算大模型的前沿探索和研究进展,以及大模型全栈开源技术基座的迭代升级与版图布局。王仲远表示,未来,大模型将以数字智能体的形...……更多
创新工场李开复:AI 2.0已至,将诞生新平台并重写所有应用
...的重大突破之后,AI 已经来到从 1.0 迈入 2.0 的拐点。多模态、巨型数据集的飞速发展,AI 优化目标函数及训练模型的技术方法将大幅精进,能更好地模拟人类的认知智能。此外,AI 2.0 将会带来平台式的变革,改写用户的入口和...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
...器感知和学习方向的研究,致力于研发对虚实场景进行多模态感知、生成与交互的人工智能系统,并应用于多媒体计算、基于AIGC的智慧创作等领域。他在人工智能多模态算法与模型、智慧创作与虚拟现实等多个领域取得了多项...……更多
错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联
...称只要500美元(约合人民币3622元)就能训练出一个SOTA多模态模型,且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。由于该团队的三位作者都来自斯坦福大学,又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历,发布该...……更多
又有厂商加入“百镜大战”,学雷军首款AI眼镜定价999元
...闪极等丰富服务,可实现对用户的录音、文字和图像等多模态数据的高效记录、快速存储和多端同步;同时通过内置的AI应用商店,实现对于各种AI能力的灵活调用。现场演示中,眼镜实现帮忙随时记下行李箱密码、分析冰箱中...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
趣丸科技荣膺2024福布斯中国年度最佳数智化雇主
...业高质量发展。在数智人领域,趣丸智能打造的沉浸式多模态交互数字人平台,可以分钟级生成高逼真的数智人,实现智能对话交互,并将数智人制作成本从万元级下降至百元级,极大解决了传统数字人制作周期长、成本高、交...……更多
周睿:起跑要趁早
...自动驾驶、机器人等领域。迄今,周睿已经发表了多篇多模态AI研究和机器人领域的论文。读大一期间,周睿还到苹果公司实习。在那里,他见识到了硅谷顶尖的公司团队之间是怎么合作的,包括他们的工作方式——怎么创造产...……更多
中国最接近GPT3.5的团队 默默无闻的驻扎在西湖边
...情感感知和主动聊天的特色。凭借着顶流的技术团队、多模态的技术优势,这个默默无闻的低调企业,不仅打造了国内极少数能与GPT-3.5一较高下的大模型,还多次赢得了360周鸿祎、美团王慧文的青睐。如今,汤姆猫将成为西湖...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
...模型团队名称,Edge代表最前沿的AGI探索。Seed Edge鼓励跨模态、跨团队合作,为项目成员提供宽松的研究环境,实行采用更长周期的考核方式,以保障挑战真正颠覆性的AGI课题。同时,Seed Edge也将得到单独的算力资源保障。根据...……更多
功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
...京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。通过将计算和存储...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
京东要给实体产业做个GPT
...测试,都会为AI带来点滴新的进步。决战大模型:走向多模态与实体京东云今年将发布的新一代产业大模型 ——言犀大规模预训练语言模型,被视为是AI角逐产业场景的开端。京东云言犀团队前后耗费多年时间,持续深耕对话式A...……更多
生成模型真实物理引擎Genesis来了!由全球AI顶尖高校团队开发
...并实现从中性到愤怒再到快乐等情绪的自然过渡。这种多模态生成能力为虚拟人物的创建提供了新的可能性。目前,研究团队已经开源了底层物理引擎和模拟平台的代码(项目地址:https://genesis-embodied-ai.github.io/),生成框架部...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...言,这又是波澜壮阔的一年。Sora掀起视频生成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。大语言模型仍在狂飙,但价格战、...……更多
更多关于科技的资讯:
主播走进保税仓 “618大促”跨境电商进口增长强劲
一年一度的“618”电商大促正在进行。今年,跨境电商直播走进了各地保税仓,成为拉动消费的新增长点。走进义乌综合保税区进口商品仓库
2025-06-07 20:23:00
政策市场双轮驱动,十堰消费市场活力迸发
十堰广电讯(全媒体记者 陈伟 通讯员 郭华) 消费,一头连着经济发展的宏观大局,一头连着千家万户的幸福生活。今年以来,十堰持续激发消费活力
2025-06-07 20:20:00
95后清华博士,辍学,造出逆天机器人
3.99万,这是一款N2人形机器人的价格。这个价格,可以称之为“相当划算”,因为N2是全球第一个实现多场景连续空翻的机器人
2025-06-07 16:04:00
锂电池出口检验启动“快进模式” 厦门海关试点“出口锂电包装智慧监管”
厦门海关关员监管一批即将出口的锂电池。(童婕 摄)厦门网讯(厦门日报记者 吴晓菁 通讯员 陈志旭)昨日,厦门时代新能源科技有限公司(以下简称“厦门时代公司”)通过“出口锂电包装智慧监管”系统
2025-06-07 08:22:00
浙江日报讯 (记者 姜晓蓉 通讯员 柯溢能 查蒙) “学校AI模拟面试总结和分析能力非常强,其中追问模式特别有用,让我提前适应面试节奏
2025-06-07 09:08:00
干货多,收获丰!“艺术为广告赋能”南京研讨会圆满落幕
夏日葳蕤精英汇,艺术赋能起风云。6月4日,由南京市广告协会主办、大贺艺术空间承办的“艺术为广告赋能”南京研讨会圆满落幕
2025-06-07 09:33:00
编者按:2025年,东营市以“提振消费”为核心引擎,打出一套政策组合拳,通过惠民让利、场景创新、环境优化等多维举措,激发市场活力
2025-06-07 09:47:00
长春光谷·光博盛会|长光卫星:逐光苍穹 星耀光博
随着2025长春国际光电博览会•light国际会议(以下简称“2025长春光博会”)日益临近,聚焦吉林这片“中国光学摇篮”的创新沃土
2025-06-07 09:37:00
栖霞板块:创新生态聚势,一路与“智”同行
扫一扫,了解更多内容。□南京日报/紫金山新闻记者朱旖旎南京经开区,空气中弥漫着奋斗的气息。在兴智科技园C栋云蝠智能的办公区
2025-06-07 08:00:00
在“歌声唱给党 跟着总书记的足迹看贵州”网络主题宣传中,财经博主徐梦婧(@财经麦麦吉)聊起了贵州“村超”“村BA”的流量转化话题
2025-06-07 05:34:00
以“数”为脉重塑产业生态网|做强做优贵州数字经济(1)
在占据贵阳大数据交易所一面面墙的LED屏幕上,一串串数字滚动更新。在“银发经济”数据交易板块的首次亮灯,让这所中国首家数据交易枢纽再次成为行业焦点——贵州益智慧科技开发有限公司(
2025-06-07 00:53:00
数据“想象力”变产业新动力|做强做优贵州数字经济(2)
作为一家去年12月中旬才在毕节注册成立的新公司——贵州灵动大数据有限公司一季度数据交易额达到103.9万元,实现了毕节市数据产品在贵阳大数据交易所全流程场内交易零的突破
2025-06-07 00:53:00
3砺生辉&618大促丨开启甄选礼遇
烟台中泽华羿铂尔曼酒店2022.6.6-2025.6.6三载春华秋实烟台中泽华羿铂尔曼酒店迎来了三岁生辰岁月匆匆 宛如白驹过隙一千零九十五个日夜更迭见证了我们从青涩到坚韧的蜕变我
2025-06-07 03:03:00
戏剧艺术的创新发展路径
摘要:在数字化与全球化冲击下,戏剧艺术面临着传统模式与时代需求的结构性矛盾。本文以创新为核心,从技术融合、文化根植、市场下沉及社会应用四个维度
2025-06-06 09:00:00
乐其创新SmallRig助力全球公益影像创作者记录湾区活力,深化国际文化交流实践
2025年5月23日,以“影像浪潮・时代进程”为主题的2025国际影像文化周(中国·深圳)正式开幕,本届国际影像文化周涵盖全球影像场景产业论坛
2025-06-06 10:35:00