• 我的订阅
  • 头条热搜
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...些“另类”。它不像其他云大厂那样强调自研模型的顶尖性能,而是早早推出一个大模型货架,集邮般摆上了各家头部大模型,供客户挑选。“没有一个模型能包办一切”,这个被亚马逊频繁强调的理念,已经逐渐深入人心。而...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...现为:随着模型大小的增加,训练损失会降低,模型生成性能会提高,捕捉全局信息的能力也会增强。 论文标题:Elucidating the design space of language models for image generation 论文链接:https://arxiv……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...。我们对慢帧使用 pXp 池化,对快帧使用 2pX2p 池化。基准性能LLaVA-Video 的表现。对于 VideoDC 和 VideoChatGPT 的,我们使用 5 分制度打分,其他评测集结果以准确率打分。所有结果均为 0-shot 准确率。* 表示该评测集的训练集已在我们...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...。因此,团队使用DCLM来设计高质量数据集从而提高模型性能,尤其是在多模态领域。其思路很简单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...映射关系,从而能够实现“以图生文”、“以文生图”等性能。2026年数据预言是真是假?数据,是人工智能赖以发展的核心资源。如何解决“数据瓶颈”是未来一段时期我们即将面临或已经面临的挑战。据业内人士分析,GPT-3于...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...展的多模态模型GLM-4V-9B能够很好地融合文本和视觉模态,性能比肩GPT-4V。如今,在视频生成领域,智谱立足多模态能力,再次实现“一举爆破”,推动技术天花板升维。 二、立足多模态能力,智谱补齐视频生成版图智谱在多模...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...、超参数调优:帮助用户找到最优的模型参数,提高模型性能,可能包括自动化的超参数搜索服务。 5、模型训练监控:提供训练过程中的实时监控和日志记录,帮助用户了解模型训练的状态和效果。 应用部署和构建服务确保...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GPT-4,引发众多猜测后被Mistral联合创始人证实,是此前一款公开的量化模型被泄露。字节跳动...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ul.……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...本嵌入模型:text-embedding-3-small和text-embedding-3-large,前者性能比前代模型大幅提升,价格降至1/5;后者能创建最高3072维数的嵌入,性能更强,价格亦十分经济。GPT-3.5 Turbo的新版本也将推出,输入价格降低50%,输出价格减少25%。.……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态理解和文档智能领域的潜力。最近,提升多模态大模型处理高分辨率图像的能力越来越引起这个领域的关...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
...高度准确和广泛的泛化能力,融入手机系统能够增强手机性能,而且随着AI算法的进化,大模型手机能够基于用户数据分析提供个性化服务,实现“千人千机”。一面是,AI大模型厂商积极挺进硬件领域(智能手机、智能学习机...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...的情况下学习和适应,进而根据具体目标最大限度地提高性能(有效性和自动化)。有了结构化推理之后,LLM 智能体可在内部重构自身,通过灵活和内在的(智能体内部的)自我反思功能实现主动推理,并在采取外部行动之前...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
ChatGPT一周年|炼制大模型芯片短缺数据有限,何以解忧?
...市值突破万亿美元,其领先市场的GPU(图形处理器)和高性能计算设施被全球科技企业争相抢购。“现在业内最好的(AI)芯片是英伟达的。”云知声智能科技股份有限公司董事长兼CTO梁家恩告诉澎湃科技,尽管也存在一些挑战...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...练,只用十分之一的数据就可以达到从头训练策略相近的性能,让模型可以不断迭代,真正地活起来了。Language Modeling:如下表所示,研究团队比较了 Transformer-based 的模型和 TokenFormer 在语言建模上的能力。在相同规模、相同模...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...高效利用人类演示数据,机器人系统可以实现更高水平的性能和适应性,使其更能在动态环境中执行复杂任务。(3)复杂环境认知。复杂环境认知是指具身智能体在物理或虚拟环境中感知、理解和导航复杂现实世界环境的能力...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...种中型多模态模型,针对多种任务的扩展进行了优化,其性能水平与谷歌迄今为止最大的模型1.0Ultra类似。谷歌增加了1.5Pro的上下文窗口容量,该大模型现在可以在生产环境中运行多达100万个token。这意味着1.5Pro可以一次性处理...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...础模型的升级。对于企业来说,在不同场景阶段,对模型性能和成本要求各不相同。 在复杂场景探索阶段,他们更加关注模型性能、部署成本。而在已验证过的大规模落地阶段,他们更侧重模型推理成本、响应速度。这次新发...……更多
千行百业加速拥抱大模型(AI前沿观察)
...础设施建设提速行动方案(2023—2025年)》提出,实施高性能算力提升工程,加快建设郑州、洛阳等全栈国产化智能计算中心,构建中原智能算力网。在“东数西算”战略背景下,西部智算中心建设迎来发展机遇期。11月30日,青...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...这可能会干扰模型对精确时刻定位的能力,进而影响整体性能,未来研究应该关注如何有效分离视频级别和片段级别的学习,并合理引入细粒度信息。图 5:细粒度 VCMR、VR 实验结果图 6:细粒度 SVMR 实验结果为了说明该研究的细...……更多
中兴通讯新一代智算整体解决方案揭幕,引发业界关注
...模模型训练设计的旗舰GPU服务器——R6900G5,以其卓越的性能和创新的设计,吸引了众多参展者的目光。#中兴通讯绿色算力主力军#R6900G5GPU服务器不仅具备高安全性和高能效等优势,还拥有强大的计算能力和对复杂模型的训练支...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了!AI角色扮演类游戏(如C.AI、Talkie)...……更多
刚刚,三名谷歌Vision Transformer作者官宣加入OpenAI
...确性。 另外,他们也为 ViT 开发了一些改进版本,对其性能或效率等不同方面进行了优化,比如能适应不同图块大小的 FlexiViT,参阅论文《FlexiViT: One Model for All Patch Sizes》。他们也探索了另一些架构创新,比如他们在论文《MLP-M...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...峰会推出了一系列产品,包括全新的骁龙X Elite Oryon CPU,性能超越苹果的M2 Max和英特尔的i9-13980HX。搭载骁龙X Elite的PC能够拥有130亿参数的大模型,即使在无网络环境下也能执行多种任务,如生成PPT和图像编辑。同时,高通还发布...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...在一系列基准数据集上的实验中,OmniSearch展现了显著的性能优势。特别是在处理需要多步推理、多模态知识和快速变化答案的问题时,OmniSearch相较于现有的mRAG方法表现更为优异。目前OmniSearch在魔搭社区还有demo可玩。动态检索...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00