• 我的订阅
  • 头条热搜
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
大江东丨走近科学大咖⑤迈克尔·I·乔丹:我一直在追随“下一步是什么”
...AI进化的速度,远远超越了任何其他现存的技术。”这是马斯克在ALL-IN峰会上说的一句话,当我们问及乔丹对这句话的看法,他笑着回应:的确如此。迈克尔·I·乔丹。刘唱摄在乔丹看来,AI领域如今就像一台高速运转的引擎,装...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...说要做端到端,大家还是以不信为主,说实话我们得谢谢马斯克,特斯拉 FSDv12 给了大家很大的冲击。到了今年年中,端到端就已经「泛滥」了,大家都争相恐后挤到这条赛道上。至于统一模型,端到端的共识形成尚且如此困难...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
周鸿祎:发展大模型要有AI信仰
...驶会让人类自动驾驶真正实现突破,这也是为什么埃隆·马斯克一方面说大家不要干人工智能了,一方面买了1万块卡做了一个人工智能公司。 第三,最终大模型的重要发展方向是成为科学研究的工具,无论在生物、化学、新物...……更多
一大批人形机器人正被装上“最强大脑”,准备送进车厂打工!
...片等限制,可以预见,人形机器人的赛道仍然道阻且长。马斯克认为,将来人形机器人将成为工业主力,数量有望超越人类,预计达到100亿—200亿台。人形机器人发展到什么地步了?是否能真正替代人类完成复杂的任务?技术瓶...……更多
本文转自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...变小,成为具身智能的「大脑」。解法:垂域大模型、多模态技术与 AI 智能体论坛中,关于可信大模型如何在应用具体落地,呈现出了多种解法,大家不约而同地开展了对垂域大模型、多模态技术与 AI 智能体的探索。在专业领...……更多
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
...上也不乏有惊喜的欢呼声。Grok API开启公测如前所述,由马斯克xAI推出的大模型Grok,也正式开启API的公测了。到2024年底,每月有25美金免费额度,人人均可参与。如果你之前已经购买了预付费额度,比如50美元,那么在11月和12月...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...论坛中,李未可科技创始人兼CEO茹忆发表了《WAKE-AI:多模态大模型带来的智慧文旅变革》的主题演讲,分享了自己关于人工智能和AI硬件的看法。茹忆指出,随着大模型的不断发展,基于人工智能的交互方式正从单一的语音和视...……更多
“整车智能”AI战略官宣!比亚迪王传福与马斯克有何不同?
...牌汽车科技化和智能化创新的期待。不过对此,特斯拉CEO马斯克的回复是特斯拉是一家AI(人工智能)企业,外界以此认为是内涵比亚迪缺少智能属性,是以传统汽车企业模式制造新能源汽车。那么事实真的如此吗?的确,这两...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
openai发布gpt-4o多模态大模型
...5月14日凌晨1点,OpenAI举行春季发布会,发布最新GPT-4o多模态大模型,GPT-4o能读取人类情绪,另外,相较于GPT-4Trubo速度更快、价格也更便宜。OpenAI称,GPT-4o可以检测人的情绪。在演示中,Zoph将手机举到自己面前正对着脸,要求Cha...……更多
更多关于科技的资讯:
2024年12月12日环洋市场咨询机构出版了一份详细的、综合性的调研分析报告【全球医美术后修复类面膜行业总体规模、主要厂商及IPO上市调研报告
2024-12-12 13:55:00
济宁龙贵“12·10”以时光为由,赴一场情怀之约
(齐鲁晚报·齐鲁壹点 孔茜 王浩然)一天营收可抵半月业绩,是济宁龙贵集团12·10超级会员日交出的“成绩单”。而一家实体经济企业如何能在线上零售“围城”下
2024-12-12 13:56:00
在数字经济快速发展的背景下,生成式人工智能(AI)正以前所未有的速度重塑各产业的商业版图。其中,电商产业与生成式AI的深度融合
2024-12-12 13:58:00
firecore发布8.0.5新版infuse视频播放器
12月11日消息,Firecore团队于12月3日发布公告,发布8.0.5新版Infuse视频播放器,主要为苹果的iPhone和iPad设备
2024-12-12 13:59:00
苏州移动为天平山红枫节提供网络保障服务
天平山红枫最佳观赏季来临,无数游客前往游玩打卡。为了让游客观赏美景的同时拥有畅快的网络体验,苏州移动吴中区分公司对天平山景区进行深度网络覆盖建设
2024-12-12 14:08:00
amd推出全新versalrf系列芯片产品
12月11日消息,AMD昨日(12月10日)发布公告,宣布扩展Versal自适应片上系统(SoC)产品组合,推出全新VersalRF系列
2024-12-12 14:10:00
掌阅科技独家上线《红胡子诊疗谭》,江户时代医者仁心的温情篇章
近日,掌阅科技独家首发上线黑泽明电影《红胡子》原著《红胡子诊疗谭》。在江户时代的背景下,日本著名作家山本周五郎以其独特的人情笔触
2024-12-12 14:11:00
799元!理想上线车载智控平板:一键操控全车开关
快科技12月12日消息,理想汽车今日在商城上线了智控平板,可操控软硬件开关,适配理想MEGA和L系车型,原价999元,限时优惠799元
2024-12-12 14:15:00
中国移动动感地带原神包上线:每月15GB流量、赠送200原石
快科技12月12日消息,今日,《原神》宣布,中国移动动感地带原神包正式上线。据了解,动感地带原神包拥有三大权益,包括专属游戏礼包
2024-12-12 14:15:00
曝iPhone 17改用条形横置摄像头设计:梦回魅族17
快科技12月12日消息,微博话题“iPhone17或改用条形横置摄像”冲上热搜榜,引发热议。据博主数码闲聊站爆料,从供应链物料看
2024-12-12 14:15:00
marvell推出“定制hbm计算架构”,可提升性能、能效
12月11日消息,Marvell美满电子美国加州当地时间10日宣布推出“定制HBM计算架构”(CustomHBMComputeArchitecture)
2024-12-12 14:18:00
雷军亲穿“雷军班”班服,武大学子受瞩目,顶尖人才培养计划受热捧
近期,一段由小米集团创始人雷军亲自发布的视频在网络上迅速走红。视频中,雷军身着一件特别的班服,上面赫然印着“雷军班”的字样
2024-12-12 14:22:00
抖音视频黑色效果的成因与年轻人审美探讨
《抖音拍摄为什么是黑色的》在如今这个信息爆炸的时代,短视频平台如雨后春笋般涌现,其中抖音无疑是最为人熟知的一个。许多人都喜欢在抖音上分享自己的生活
2024-12-12 14:22:00
消息称谷歌正酝酿新一轮裁员风暴,低绩效员工比例提至 10%
IT之家 12 月 12 日消息,根据职场匿名论坛 Team Blind 上最新流传的热议帖子,谷歌员工担忧公司将于明年 1 月启动新一轮裁员
2024-12-12 14:22:00
小红书新成立应用算法部,各算法部门整合,夏侯担任部门负责人
小红书将商业化、社区、电商的算法部门整合到一起了据雷峰网消息称,近期小红书整合了商业化、社区、电商的算法部门,新成立了应用算法部
2024-12-12 14:22:00