• 我的订阅
  • 头条热搜
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...来,于今年3、4月陆续推出了Grok-1.5大语言模型和首个多模态模型Grok-1.5 Vision,整体迭代速度已足够惊人。但要超越当前所有AI大模型,Grok-2要面对的问题或许远没想象中简单。所有指标超越当前AI大模型,真的假的?2023年11月,x...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...主组装IKEA家具,或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令:说明书提供了任务的整体分解和关键步骤;视频展示了详细的组装过程;而3D模型则定义了部件之间的精确空间关系。I...……更多
...参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
...文集团涨幅达10.14%,金山软件涨7.84%,阿里影业涨6.98%,商汤涨6.25%,知乎涨5.87%,哔哩哔哩涨4.73%。龙年的首个A股交易日即将开启,节后AI行情如何演绎?国盛证券指出,AI算力有望继2023年后,继续成为新一年的热门投资方向。AI...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在视频生成这一个功能。而下半年,大语言模型公...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...网)包含三款能力逐级递增的模型,在自然语言处理、多模态整合等方面表现卓越如果讨论本世纪最激动人心且影响深远的科学技术领域,AI 必定榜上有名。以“确保变革性 AI 帮助人们和社会繁荣发展”为使命的 Anthropic,则是...……更多
...标GPT-4的国产大模型也在快速迭代升级,如4月23日发布的商汤日日新SenseNova 5.0,其综合性能全面对标GPT-4Turbo;又如5月9日发布的通义千问2.5,阿里云称性能得分追平GPT-4 Turbo。国联证券《AI大模型成果不断涌现,AGI或将到来》有...……更多
不要苛责中国大模型公司的盈利
...好的公司之一。对比国内上一波AI热潮中的头部AI公司,商汤科技在2017年的融资窗口期获得了超40亿元人民币的融资。从融资水平来看,今天的智谱AI明显不如当年的商汤科技。但从技术角度来看,智谱AI重点投资的AI大模型技术...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...积累的技术屡屡能取得佳绩。比如去年取得 MER23 第一的商汤和今年第一的 Soul,这些企业对 AIGC 技术和应用的重视和投入收到了显著成效。可以预见,未来像 Soul 这样坚持技术和产品创新的平台会在释放 AI 能力的过程中持续为...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型,是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...论文提名和最佳短论文奖等。其研究成果在生成模型和多模态学习领域受到了学术界和工业界的广泛认可。Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主...……更多
...民开放服务,至此,首批包括讯飞星火、百度文心一言、商汤SenseChat等在内共十余款人工智能大模型全部面向公众开放服务。另外包括腾讯在内的一些公司的大模型也通过备案,将择机面向公众开放。人工智能大模型是指使用大...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...大模型版“5年高考3年模拟”来了!6141道数学题,还是多模态的那种|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
商汤科技亮相第十五届海峡两岸文博会,“元萝卜”成焦点
...未来”的主题,旨在增进两岸文化及产业的交流与合作。商汤科技旗下的家用机器人品牌“元萝卜SenseRobot”携一系列令人瞩目的AI产品亮相本次文博会。作为家用下棋机器人的开创者,“元萝卜”自2022年成立以来,一直致力于...……更多
更多关于科技的资讯:
哪种悬架:才能像尊界S800“三过坑而不入”
昨天,脖子哥的手机被尊界 S800 “ 凌波微步 ” 刷屏了。什么过坑 “ 白沙不扬 ” 、 “ 玻璃不碎 ” 、 “ 踏水无痕 ”
2025-02-15 07:52:00
杭州新春首场高新技术企业招聘会今天继续
记者 韩晨柯 摄“有员工宿舍吗?”“能不能接受一次性出差2-3周的工作节奏?”“下个月可以入职吗?”2月14日,由杭州高新区(滨江)人力社保局主办的“起跑春天·相约高新”新春首场高新技术企业综合性招聘会在高新人才之家举行
2025-02-15 07:55:00
终于来了!小米澎湃OS超级小爱接入DeepSeek-R1大模型
快科技2月15日消息,近期,华为、荣耀、OPPO、vivo、联想、中兴等一众国产手机厂商都接入了DeepSeek-R1大模型
2025-02-15 08:22:00
回忆杀大揭秘!饺子导演和网友15年前私人邮件曝光
快科技2月15日消息,据猫眼专业版最新数据显示,饺子导演新作《哪吒之魔童闹海》正持续热映,其执导电影累计票房已跨越157亿大关
2025-02-15 08:22:00
德国媒体感慨中国科技发展太快:若只卖玩具、纺织品、手机电脑就好了
快科技2月15日消息,近日德国媒体发文,感慨中国科技发展速度实在是太快了。《商业内幕》德国版(businessinsider
2025-02-15 08:22:00
8只河狸2天建好捷克拖了7年的水坝:这合理吗
可爱的大型啮齿动物河狸,最近上了新闻。有多家媒体报道说,捷克一座 7 年还没动工的水坝,被一窝河狸在一天或者两天之内搞定了
2025-02-15 08:52:00
《哪吒2》、《美队4》同天上映:老外使坏 未来至少一周全美无《哪吒2》IMAX排片
2月15日消息,据国内媒体报道称, 2月14日《哪吒2》和《美队4》北美同日上映,不过两者的待遇却截然不同。报道中提到
2025-02-15 08:52:00
2月14日晚,记者从杭州群核信息技术有限公司获悉,旗下控股公司Manycore Tech Inc.(以下简称“群核科技”)已正式向港交所递交上市申请
2025-02-15 08:57:00
回归单身的日产:不靠本田 也能蹚出一条路
事实证明,企业“包办婚姻”往往没什么幸福结局。 2月13日下午,日产、本田正式宣布终止合并计划,双方撤回2024年12月23日签署的业务整合谅解备忘录
2025-02-15 00:22:00
顺丰接收全球第100架波音767-300BCF:3月正式投入航线
快科技2月15日消息,据顺丰航空官微介绍,顺丰航空作为767-300BCF的全球最大用户,日前在广州飞机维修工程有限公司(GAMECO)正式接收波音第100架767-300BCF
2025-02-15 00:22:00
全国首个“空地协同”智慧物流中心启用:跨城快递3小时送达
快科技2月14日消息,全国首个“空地协同”智慧物流运营中心-丰翼宝安低空智慧物流运营中心今天正式启用。据了解,该运营中心位于深圳市宝安区新安街道
2025-02-15 00:22:00
揭秘:苹果AI为何选阿里不选DeepSeek
快科技2月14日消息,在昨天阿联酋迪拜举办的World Governments Summit2025峰会上,阿里巴巴联合创始人
2025-02-15 00:22:00
比亚迪智驾价格战背后:一年招了几千人 过年还在赶工
作为全球新能源车保有量最大的车企,比亚迪又放大招了。昨晚,比亚迪开了一场声势浩大的发布会,一次性把王朝网、海洋网的 21 款车型全转换成 “ 智驾版 ”
2025-02-15 00:22:00
作为一名高中生,我深切地感受到人工智能时代的浪潮正深刻地改变着我们的学习方式,尤其是在数学学习上。数学,这门充满逻辑与美感的学科
2025-02-15 05:29:00
本文聚焦钟山县职业技术学校《旅游概论》课程,通过问卷与访谈收集师生反馈,剖析课程教学现存问题并提出针对性改进建议,为同类课程改革提供参考
2025-02-15 05:29:00