• 我的订阅
  • 头条热搜
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
荣耀MagicOS 8.0发布,定义新一代人机交互
...法OS8.0的IUI支持自然语言、语音、图片、手势、眼动等多模态的交互方式,可智能识别用户意图,进行快速推理决策,主动提供个人化服务,高效完成复杂场景任务闭环,大大降低OS的使用门槛,带来了交互效率的提升。IUI这一...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
...内瓦1月18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现智能涌现。”刘庆峰表...……更多
最快六月露面!GPT-5七大震撼能力首次揭秘
...GPT-5最具变革性的能力。1音频和视频处理——更强大的多模态处理能力GPT-5比GPT-4更加强大的数据理解能力,可以在多模态理解方面表现更出色。它将延续GPT-4的文本和图像处理功能,同时加入音频和视频的处理服务,从而能够准...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
科大讯飞携手EX机器人,重塑人机交互新未来
...,面向物理世界、虚拟世界和元宇宙,以AI能力星云、多模态交互、大模型、模型训练、资产生成和软硬件接入为核心的机器人开发平台,帮助开发者快速搭建多场景适配、具有深厚知识底蕴以及擅长自我进化的实体机器人和虚...……更多
春节档票房创新高+AI视频模型Sora来袭,影视ETF涨1%
...I视频模型Sora。Sora能够根据文字指令创造出既逼真又充满想象力的场景,还可生成长达1分钟的超长视频,RunwayGen2、Pika等AI视频工具都还在突破几秒内的连贯性。东吴证券表示,观影需求持续释放,行业有望延续强复苏趋势,同...……更多
打破波士顿动力空翻专利后 国产人形机器人左手拧螺丝 右手咖啡拉花
...的放大。并且,因为MagicLab觉得单纯做机器人设备公司,想象力过于有限,所以他们用“机器人+”来对自己定位。就像当年的互联网+一样,把技术带到千行百业,解决实际问题。责任编辑:若风文章内容举报 ……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
文心大模型4.0发布!李彦宏:相比GPT-4毫不逊色
...图、网盘、文库等十余款AI原生应用,希望能拓展大家的想象力,“激发大家一起来做出更惊艳的AI原生应用来”。最强文心大模型4.0发布 综合能力比GPT-4毫不逊色在李彦宏看来,AI原生应用的诞生,得益于大模型的理解、生成、...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
小模型正在成为AI界的新宠
...月,OpenAI 的联合创始人兼 CEO Sam Altman 在麻省理工学院 “想象力行动” 活动上接受采访时表示。他将 LLM 的规模与过去芯片速度的竞赛进行了类比,指出今天我们更关注芯片能否完成任务,而不是它们有多快。“规模不再是衡量...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
本文转自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家族,企业可根据自身业务场景需求灵活选择,实现模型使用及成本控制的正循环。人人用得起 才是好模型谭待认为,降低成本是推动大模型快进到“价值创造...……更多
AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力 | Long China 50独家
...入字节的消息。此前,杨红霞担任阿里达摩院超大规模多模态预训练模型M6的技术负责人,是M6大模型从百亿、千亿参数量进化到万亿规模的主要功臣。2022年9月,杨红霞因个人家庭原因离开了达摩院。2023年初,ChatGPT在国内卷起...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
更多关于科技的资讯:
小米redmiwatch5lite印度发布:支持蓝牙通话
9月25日,小米RedmiWatch5Lite智能手表正式在印度发布。这款手表配备1.96英寸AMOLED显示屏,支持蓝牙通话
2024-09-26 00:59:00
小米推出全新x1鼠标,支持有线和无线双模连接
近日,小米正式推出了全新X1鼠标,以仅279元的众筹价和299元的建议零售价,迅速吸引了市场的广泛关注。小米X1鼠标在外观设计上采用了轻量化机身设计
2024-09-26 01:01:00
华为V5 Max 110智慧屏将正式发售,售价69999元
如今,智能电视已经成为了家庭娱乐不可或缺的一部分。在追求高品质家庭娱乐的情况下,选择一款超大尺寸观影巨幕成为了许多家庭的共同追求
2024-09-26 01:05:00
魅族lucky08带来专属设计语言“星轨科技美学”
设计方面,魅族Lucky08的设计经过39次设计图修改,87次打样和工艺调整。有别于市面上主流的旗舰机型,魅族Lucky08致力于打破常规
2024-09-26 01:11:00
外媒体验华为首款三折叠屏手机:像科幻小说中的东西
据CNMO观察,虽然还未在海外发售,但近日有多家外媒体验到了华为首款三折叠屏手机——MateXT非凡大师。其中一家外媒发表题为《我们测试了世界上第一款三折叠屏手机
2024-09-26 01:25:00
oppo全国首家游戏主题旗舰店开幕
日前,OPPO官宣:第二家OPPO一加旗舰店落户贵阳万象城。全国首家游戏主题旗舰店,10月1日11:08开幕仪式,不见不散
2024-09-26 01:26:00
郑钦文代言vivox200promini
此前就有传言称,vivo将在今年年底推出一款小屏安卓旗舰手机,或隶属于vivoX200系列。9月25日,CNMO注意到
2024-09-26 01:27:00
阳澄湖大闸蟹开捕 顺丰投入30+架飞机、200+城次日达
快科技9月26日消息,2024苏州阳澄湖大闸蟹开捕节昨日隆重召开,顺丰作为合作物流服务商参加。阳澄湖开捕现场,顺丰无人机在湖区装载大闸蟹之后
2024-09-26 01:29:00
酷态科30w氮化镓闪充块探索版开售,采用半透设计
9月25日消息,酷态科30W氮化镓“闪充块”探索版今日正式开售,该款充电器采用半透设计,配备Type-C接口,售价45元
2024-09-26 01:33:00
9月25日消息,在今日下午的星纪魅族AI生态发布会上,星纪魅族x领克打造的“全球首款高能电竞娱乐座舱”Z10STARBUFF正式发布
2024-09-26 01:42:00
几项新的Edge Lighting商标申请曝光
许多三星Galaxy手机用户都知道EdgeLighting功能,当收到新通知时,手机屏幕边缘会亮起。最近的迹象表明,三星可能打算将类似的设计应用到即将推出的Odyssey游戏显示器上
2024-09-26 01:49:00
《最后生还者:part1》将加入ps+二三档会员
9月25日消息,在今日的StateofPlay发布会上,索尼宣布《最后生还者:Part1》将于9月26日起加入PS+二三档会员
2024-09-26 01:52:00
hyperxcloudmix2发布:电池续航能力更强
HyperX最近推出了CloudMix2,这是其无线游戏耳机的升级版。新版本在电池续航、降噪效果、连接方式和音质方面都有所提升
2024-09-26 01:53:00
iphone15promax在80%电量限制下的电池表现
自去年Apple在iPhone15系列中引入可选的电池电量80%限制功能以来,外媒测试并分享了Phone15ProMax在保持80%电量限制下的电池表现
2024-09-26 01:54:00
galaxyring固件版更新:提升蓝牙连接稳定性
三星几个月前推出了其首款智能戒指GalaxyRing,现在这款设备迎来了首次软件更新。在美国,GalaxyRing已经收到了固件版本为Q50XWWU2AXH1的更新
2024-09-26 01:57:00