• 我的订阅
  • 头条热搜
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...Anthropic合作的最新进展,并现场演示了Claude 3大模型的多模态、长文本、语境理解等能力。AWS近日宣布向Anthropic追加投资27.5亿美元,截至目前已经向这家OpenAI强力竞对累计注资40亿美元。此外,双方的合作关系也再次加深,Amazon ...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
毫末智行与火山引擎联手,建设自动驾驶智算中心MANA OASIS|最前线
...中,视觉自监督大模型,可以实现4D Clip的自动标注;多模态互监督大模型,则可以完成通用障碍物的识别;3D重建大模型助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果;动态环境大模型则进一步使用重感知...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命的成果能够平等地惠及...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
本文转自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
机器人成了我的遛弯搭子!室外复杂地形难不住,还能上“健身房”
...。除此外,天工的另一大升级是搭载了大模型,具备了多模态操作能力。现在能开口说话和人类交互,支持中英文。还能听从人类指令抓取物品:【此处无法插入视频,遗憾……可到量子位公众号查看~】而这些只是其中的一部...……更多
...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地...……更多
“试用完谷歌的新AI模型,再也不爱GPT”
...越 GPT-4 , Gemini 最特殊的一点是,它是谷歌带来的首个多模态大模型,也就是能不光能打字互动,也能进行语音、视频、图片的互动。按照谷歌的说法,现有的所谓多模态大模型,都是单独训练了文本、视觉和音频等模型,再把...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
openai发布gpt-4o多模态大模型
...5月14日凌晨1点,OpenAI举行春季发布会,发布最新GPT-4o多模态大模型,GPT-4o能读取人类情绪,另外,相较于GPT-4Trubo速度更快、价格也更便宜。OpenAI称,GPT-4o可以检测人的情绪。在演示中,Zoph将手机举到自己面前正对着脸,要求Cha...……更多
打开大模型的无限可能,云栖通道看AI产业应用
...:元神AI,同时展示了基于英伟达OrinX平台、通义端侧多模态大模型的智舱AI技术能力。元神AI旨在推动解决触控交互/命令式语音交互和APP服务带来的座舱体验不佳、服务使用低频问题,通过交互变革和服务重塑,加速智能座舱“...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
多模态AI概念股震荡走高 因赛集团涨超10% 【多模态AI概念股震荡走高 因赛集团涨超10%】财联社12月19日电,因赛集团涨超10%,天娱数科涨停,思特奇、软通动力涨超5%,润和软件、宣亚国际、开普云、万兴科技等跟涨。中信证券...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。此外,讯飞星火V3.5对年终总结计划、述职PPT...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
更多关于科技的资讯:
身上最硬的地方 一旦受伤就无法自愈!越早重视越省钱
人体最硬的地方在哪里?不是沙包大的拳头,不是你逞强的嘴。其实是……牙齿中的牙釉质。牙釉质是什么?牙釉质是构成牙齿最外层的物质
2025-01-19 22:28:00
一到冬天 电车续航就砍半!工信部终于动手了
先问各位电车车主一个问题:这个冬天你们的续航都掉了多少?还够使吗?一直以来,冬季开电车最头疼的就是续航太拉垮。买车时告诉我续航 600km
2025-01-20 00:28:00
神奇的物种生殖隔离 正在发生!
下面两只鸟现在是同一物种——Pseudeos fuscata,它们是一种生活在新几内亚的烟色吸蜜鹦鹉属鹦鹉。但是,用不了多少年
2025-01-20 00:58:00
SpaceX星舰第七飞官方美图:真暴力美学
1月17日,SpaceX的星舰组合体进行了第七次试飞,其中超重型火箭再次以“筷子夹火箭”的方式成功回收,但是星舰飞船意外解体爆炸
2025-01-20 00:28:00
多人感染甲流后出现面瘫!病毒竟会影响神经
快科技1月19日消息,据中国疾控中心,目前流感病毒阳性率持续上升,其中99%以上为甲流,典型症状包括发热、咳嗽、全身酸痛
2025-01-20 00:28:00
黄仁勋今日中午宴请35位芯片大佬:摆五桌每桌8000元
快科技1月19日消息,据媒体报道,今日中午,英伟达创始人兼CEO黄仁勋在台湾的“砖窑古早味怀旧餐厅”宴请了超过35位来自芯片企业的合作伙伴
2025-01-19 14:58:00
本文转自:人民网聚焦2025新疆两会划重点丨新疆:开展“人工智能+”行动 加快培育发展6G等产业人民网乌鲁木齐1月19日电 (韩婷
2025-01-19 15:16:00
廿载风华,临沂银座商城20周年庆典举行
齐鲁晚报·齐鲁壹点 赵彦辰1月18日,临沂银座商城迎来了20周年的盛大庆典,现场嘉宾云集,共同见证这一具有里程碑意义的时刻
2025-01-19 21:22:00
“AI之夜 星空梦想”活动精彩掠影
本文转自:人民雄安网“AI之夜 星空梦想”活动AI展演。人民网记者 周博摄人民网雄安1月19日电 (商帆)灵活智能的机器人现场讲述“自己的故事”
2025-01-19 21:29:00
本文转自:人民网-江苏频道1月18日,脑机接口产业发展国际交流大会暨江苏(南京)脑机智能科技创新园启动仪式在南京鼓楼举行
2025-01-19 21:43:00
谷歌宣布重大调整!没JavaScript用不了搜索
快科技1月19日消息,谷歌近日进行了一项重大调整,要求所有用户(包括机器人)在使用Google搜索时必须启用JavaScript
2025-01-19 15:28:00
17.4万立方米!大型LNG船“丽梅尔”号在沪交付
快科技1月19日消息,据报道,17.4万立方米大型液化天然气(LNG)运输船“丽梅尔”号17日在上海长兴岛交付。“丽梅尔”号作为沪东中华自主研发的第五代“长恒系列”LNG运输船
2025-01-19 15:28:00
“结婚登报”成新潮流 网友爆料520元即可实现
快科技1月19日消息,据媒体报道,最近,结婚登报这一传统习俗在年轻人中悄然复兴,成为一股独特的“复古纸质浪漫”风潮。网友们纷纷晒出自己的结婚启事
2025-01-19 15:28:00
乐道汽车春节服务:将有1200座换电站投入运营
快科技1月19日消息,乐道汽车近日发布公告,将在1月23日之前建设超过1200座换电站以支持乐道换电服务。这些站点将覆盖5纵8横13条热门高速线路以及10大城市群
2025-01-19 16:28:00
初中生花70元自制牛顿反射式望远镜可观测月球:陨石坑清晰可见
快科技1月19日消息,河南郑州年仅14岁的初中生马俊鹤,凭借对天文的无限热爱和不懈追求,花费70元成功自制了一台能够清晰观测月球表面的天文望远镜
2025-01-19 16:28:00