• 我的订阅
  • 头条热搜
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...力的建设。目前,小红书技术团队同时针对语言模型和多模态能力进行了综合研发,结合小红书自身的业务场景和需求,更早做了视觉理解大模型方向的技术攻关:在多模模型架构、多模态alignment和整个数据体系和视觉感知能力...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...,来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
联合实验室的科研将基于字节跳动豆包大模型展开
...AIInfra、AISafety等。该团队已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。今年5月,字节跳动在2024春季火山引擎Force原动力大会上宣布自家豆包大模型正式开启...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...龙8至尊版适配优化 GLM-4V端侧视觉大模型,支持丰富的多模态交互方式。GLM-4V端侧视觉大模型能够实现令人惊叹的处理能力,以超过 70tokens/秒的速度在终端侧高速运行。此外通过与骁龙8至尊版进行深度适配和推理优化,终端侧...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...以适应不同领域和多样化的数据特性,无法在多任务、多模态的环境中有效工作。4. 缺乏端到端的任务执行框架:由于在结构化推理和时间信号的数值计算交叉点上的研究较少,实现端到端的时间序列任务执行仍然面临挑战。现...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...超过90%。在启用视觉感知能力的情况下,o1模型在MMMU(多模态理解)测试中获得了78.2%的高分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...—亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐露一个小目标:将来我们不仅要Speech to Speech,更要Any-to-Any!整体而言,Am...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
人工智能应用场景不断拓展
...业大模型占比七成。大模型已具备文本、语言、视觉的多模态能力,成为推动产业发展与社会进步的重要变量。在阶跃星辰创始人兼首席执行官姜大昕看来,通用人工智能的实现路径可以划分为模拟世界、探索世界和归纳世界3...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
OpenAI没有放弃的机器人梦想
...捕捉到的语音转录文本,输入到一个由OpenAI训练的大型多模态模型中,然后由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。“同样的模型,也负责决定在机器人上运行哪些学习的...……更多
更多关于科技的资讯:
余承东用华为平板画了一个福字:巧妙融入“2025”
快科技1月24日消息,今晚,华为余承东在微博晒出了一张别具一格的“福”字,引发了广泛关注。这张福字之所以特殊,不仅因为它出自余承东之手
2025-01-24 23:04:00
上汽集团:2024年少卖100万辆车 净利润减少近90%
快科技1月24日消息,上汽集团今晚发布发布了2024年度业绩预告。经财务部门初步测算,预计2024年度实现归属于母公司所有者的净利润为15亿元到19亿元
2025-01-24 23:04:00
《封神第二部:战火西岐》新剧照 西岐战火将至
近日《封神第二部:战火西岐》电影官方发布新剧照,殷商大军盘弓错马,准备一举攻下西岐城。面对敌人的迅猛攻击,百余年未经战火的西岐百姓要如何应对
2025-01-24 23:34:00
起亚发布2024年业绩报告:销售额首破100万亿韩元
快科技1月24日消息,日前,起亚汽车发布2024年业绩报告,报告显示核实2024年营业利润为12.6671万亿韩元(约合人民币641
2025-01-24 23:34:00
这是有史以来最大的淡水龟:龟壳长达3米 是人类两倍
地纹骇龟,这是发现的最大的淡水龟物种,它们已灭绝,生活在距今约1300万至500万年前。目前发现的最大龟壳化石差不多有3米长
2025-01-24 23:34:00
江苏:邮政小包裹拉动“指尖”大市场
本文转自:人民网-江苏频道“这些颜色和款式都是专门为过年定制的,拍下当天即可发货……”1月23日,江苏省东海县的一家穿戴甲公司内
2025-01-24 23:51:00
超1/4打工人0点后才睡觉 熬夜最大原因找到了
快科技1月24日消息,2024年打工人,加最长的班,熬最深的夜。智联招聘最新数据显示,高达26%的职场人不得不在深夜12点之后才能入睡
2025-01-25 00:04:00
试驾新款Model Y 它凭啥10天能订10万台
全球最畅销的电车,也是特斯拉今年最为重要的一款车—— Model Y ,卖了 5 年终于改款了。要说这车也真是不缺热度
2025-01-25 00:34:00
小米YU7 Max高清实车曝光 质感不输50万豪车
快科技1月25日消息,小米YU7无疑是今年最受瞩目的一款车,它不仅是小米首款SUV,也将是纯电SUV神车——特斯拉Model Y的最大对手
2025-01-25 00:34:00
本文转自:人民日报《人民日报》(2025年01月25日第 06 版)据新华社电 美国华盛顿大学、丹麦技术大学等参与的研究团队日前在英国《自然》杂志上报告说
2025-01-25 05:45:00
“隐形”的暗物质  如何被“看见”(瞰前沿)
本文转自:人民日报李  然《人民日报》(2025年01月25日第 06 版)图①:“悟空”卫星在轨示意图。“悟空”卫星为暗物质直接和间接探测提供了大量线索
2025-01-25 05:48:00
海外文案将春节写成Lunar New Year!网红奶茶霸王茶姬深夜紧急道歉
快科技1月25日消息,日前,许多网友在社交平台发帖,称霸王茶姬在海外社交平台的宣传文案中,将春节翻译为“Lunar New Year”
2025-01-25 07:04:00
看了一眼手机:车子直接报废
快科技1月25日消息,开车上路,需心无旁骛,否则很容易酿成事故,严重情况下甚至车毁人亡。据“公安部交通管理局”最新披露的案例显示
2025-01-25 07:34:00
最高补贴2000元!一图看懂2025红魔国补领取指南
1月20日起,全国各地开始陆续实施手机等数码产品购新补贴。手机、平板、智能手表/手环类,单件价格低于6000元的,给予15%补贴
2025-01-25 07:34:00
美动保团体申请为5头大象提供人身保护 法院驳回:它们不是人
1月24日消息,此前美国动物保护团体为一家动物园的5头大象申请“人身保护令”,要求动物园将其“释放”,近日法院就此事做出裁定
2025-01-24 17:34:00