• 我的订阅
  • 头条热搜
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...力的建设。目前,小红书技术团队同时针对语言模型和多模态能力进行了综合研发,结合小红书自身的业务场景和需求,更早做了视觉理解大模型方向的技术攻关:在多模模型架构、多模态alignment和整个数据体系和视觉感知能力...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...,来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多
联合实验室的科研将基于字节跳动豆包大模型展开
...AIInfra、AISafety等。该团队已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。今年5月,字节跳动在2024春季火山引擎Force原动力大会上宣布自家豆包大模型正式开启...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...龙8至尊版适配优化 GLM-4V端侧视觉大模型,支持丰富的多模态交互方式。GLM-4V端侧视觉大模型能够实现令人惊叹的处理能力,以超过 70tokens/秒的速度在终端侧高速运行。此外通过与骁龙8至尊版进行深度适配和推理优化,终端侧...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...,公司的AI战略是以自主构建算力能力为底座,以开悟多模态大模型为支撑,通过中台体系的构建,实现了行业训练数据的有序治理、行业大模型的高效训练以及智能应用的敏捷开发。这一战略不仅催生了AIGC多模态内容生产平台...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。火山引擎总裁...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...以适应不同领域和多样化的数据特性,无法在多任务、多模态的环境中有效工作。4. 缺乏端到端的任务执行框架:由于在结构化推理和时间信号的数值计算交叉点上的研究较少,实现端到端的时间序列任务执行仍然面临挑战。现...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...超过90%。在启用视觉感知能力的情况下,o1模型在MMMU(多模态理解)测试中获得了78.2%的高分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...—亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐露一个小目标:将来我们不仅要Speech to Speech,更要Any-to-Any!整体而言,Am...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
人工智能应用场景不断拓展
...业大模型占比七成。大模型已具备文本、语言、视觉的多模态能力,成为推动产业发展与社会进步的重要变量。在阶跃星辰创始人兼首席执行官姜大昕看来,通用人工智能的实现路径可以划分为模拟世界、探索世界和归纳世界3...……更多
OpenAI没有放弃的机器人梦想
...捕捉到的语音转录文本,输入到一个由OpenAI训练的大型多模态模型中,然后由该模型处理对话的整个历史记录,得出语言响应,然后通过文本到语音的方式将其回复给人类。“同样的模型,也负责决定在机器人上运行哪些学习的...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
更多关于科技的资讯:
中国智造新名片!海信100吋大屏亮相大阪世博会中国馆
近日,大阪世博会"山东活动周·青岛日"活动在中国馆举行。海信100吋高端大屏电视作为中国智造的标杆性成果,在中国馆展区亮相
2025-08-01 18:38:00
生成式引擎优化(GEO)正重塑企业获客逻辑——据权威机构统计,2025年国内GEO市场规模突破800亿元,54%的用户决策依赖AI生成内容
2025-08-01 18:40:00
奥己Organic Garden闪耀2025 CBME国际孕婴童展 双奖加冕再创佳绩
2025年7月16-18日,第24届CBME国际孕婴童展成功在上海国际会展中心成功举办。展会上,新西兰专业儿童成长品牌奥己Organic Garden(以下简称"奥己")凭借卓越的产品力和品牌影响力
2025-08-01 18:40:00
英特尔代工:在现实中突围,在信任中重生
2025年7月24日,英特尔发布了第二季度财报。这份财报的特殊之处在于,它堪称新任CEO陈立武(Lip-Bu Tan)自3月上任后的第一份正式“答卷”
2025-08-01 18:40:00
融慧金科受邀共创蚂蚁数科“金融智能体联盟”
近日,在WAIC世界人工智能大会上,蚂蚁数科联合包括融慧金科在内的十余家科技伙伴共同发起“金融智能体应用联创联盟”。融慧金科联合创始人张羽受邀出席联盟成立仪式
2025-08-01 18:40:00
示范企业丨爱博绿C端业务已实现100%反向开票
在国家推进大规模设备更新更新、消费品“以旧换新”的战略背景下,国家税务总局2024年第5号公告明确了“反向开票”机制,招商银行总行凭借其领先优势
2025-08-01 18:40:00
电动窗帘品牌排行前十名,科创者(科创者)稳居榜首
随着全屋智能家居需求激增,智能窗帘市场进入高速发展期。《2025中国智能家居消费白皮书》数据显示,电动窗帘品类年增速高达34%
2025-08-01 18:41:00
中国网8月1日讯 近年来,随着互联网技术的发展和消费者需求的多样化,即时零售作为一种新兴业态,呈现出蓬勃发展的态势。即时零售通过“线上下单+本地供给+即时配送”的模式
2025-08-01 18:53:00
露营时想煮火锅却怕电量不足
露营时想煮火锅却怕电量不足?自驾游途中车载冰箱罢工让食材变质?户外办公时电脑突然黑屏?在移动互联时代,电量焦虑已成为探索自然的“隐形枷锁”
2025-08-01 19:10:00
7月24日晚间,海伦钢琴发布公告,公司控股股东海伦投资及一致行动人四季香港、实际控制人陈海伦等人与全拓卓戴(上海)企业管理中心(有限合伙)(以下简称“全拓卓戴”)签署了《股份转让协议》及《表决权放弃协议》
2025-08-01 12:29:00
丰坦机器人亮相首届粤港澳建筑机器人大赛,摘得「效能之星」奖
7月31日,由广东省住房和城乡建设厅、香港特别行政区政府发展局联合指导,粤港澳智能建造产业发展联盟和香港建造业议会共同主办的第一届粤港澳建筑机器人大赛颁奖仪式在香港举行
2025-08-01 12:29:00
掌阅科技上线AI讲书电台,打造“对话式”智能阅读新场景
在人工智能技术飞速发展的当下,AI对阅读方式的重塑正不断深化。近日,掌阅科技于掌阅APP推出全新功能“AI讲书电台”,通过双人虚拟角色对话的创新形式
2025-08-01 12:29:00
十五运会倒计时100天!松典登陆广东体育频道记录精彩赛事
第十五届全国运动会倒计时100天之际,松典相机成为广东体育频道独家倒计时播报合作品牌,结合倒计时内容与赛事精彩集锦,将“松典影像
2025-08-01 12:29:00
乘龙卡车称理想已构成严重侵权,误导和损害公众知情权,理想汽车抖音已关评
近日,理想汽车新车上市发布会上播放的一段理想i8与一卡车100公里/小时对撞测试的视频显示,正面碰撞后卡车的四个车轮出现弹起
2025-08-01 12:25:00
中国消费者报杭州讯(记者施本允)近日,浙江省杭州市萧山区市场监管局成功化解一起“盲盒众筹”投诉事件,集中受理退款投诉150余件
2025-08-01 10:44:00