• 我的订阅
  • 头条热搜
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...模型等。这些方式虽然能提升上下文窗口长度,但对模型性能均有不同程度的损害,换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此,如何在提高上下文支持长度的同时,保证处理能力的提升是目前业界...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...oud TPU v5p。谷歌表示,在六项基准测试中,大杯的Gemini Pro性能表现优于GPT-3.5;而在30项性能基准测试中,超大杯Gemini Ultra超越了目前最强模型GPT-4。甚至,Gemini Ultra在MMLU测试上得分高达90.0%,即数学、物理、法律等57个领域测试.……更多
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...行的高效率训练,同时自研了RLHF框架,相较于开源框架性能和收敛稳定性都有提升。推理上我们做了W4A8模型压缩,结合算子优化整体性能超过开源框架20%左右。“王晓博介绍道。最后,王晓博表示:“人工智能技术在多模态、A...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...和LLaMA-4-Maverick(超4000亿),实现了小而美、以小博大的性能。 这样的能力同样体现在其它模型当中。另一款小型MoE模型Qwen3-30B-A3B的激活参数量仅有30亿,仅有QwQ-32B的10%,更远低于DeepSeek-V3(总参数6710亿、激活370亿)和GPT-4……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。历经一年...……更多
大模型到了该「验收」的时候
...Turbo版本的混元大模型,定价仅为前一代Pro版本的一半。性能更强、价格更低,这是大模型是深入落地场景的前提。走进场景的第一步:找到场景解决问题的第一步是,定义问题,而落地场景的第一步是,明确场景。大模型的核...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...表现。 此外,Meta 也测试了 Llama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集,该评估集包含 1800 个提示,涵盖 12 种关键用例(征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取...……更多
...热能扩散过程,从而使该架构有效突破了遥感模型推理的性能和速度瓶颈,计算速度较传统结构模型提升2.4倍以上。孙显表示,“目前传统的、用于处理遥感图像的基础模型架构(transformer结构)本质上是基于文本处理架构发展...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...,通用型算力才具备更强的抗风险能力。三是AI、3D、高性能计算(HPC)跨技术与跨领域融合加速,推动空间智能物理AI和AI for Science、世界模型等领域的边界拓展,使得大模型的训练和应用环境更加复杂多元。 这些趋势对智算...……更多
具身智能竞速时刻,百度百舸提供全栈加速方案
...语言动作模型 VLA 等各类模型的训练与迭代效率。1.1. 高性能算力与极致优化:AIAK 赋能训推加速 百舸依托强大的算力基础设施,并通过自研 AI 加速套件 AIAK(AI Acceleration Kit)进行深度工程优化,针对具身智能主流模型提供显著...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...些“另类”。它不像其他云大厂那样强调自研模型的顶尖性能,而是早早推出一个大模型货架,集邮般摆上了各家头部大模型,供客户挑选。“没有一个模型能包办一切”,这个被亚马逊频繁强调的理念,已经逐渐深入人心。而...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...ini 1.5 Pro, GPT-4o, GPT-4 Turbo, Qwen-VL-Max, Reka Core 以及一些目前性能最好的开源模型。下图中展示了在 VCR-Wiki 中文的简单难度上各个模型的性能:红框测量指标包括代表包含了图像(VI)和图像中的文字(TEI)两部分作为上下文信息……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...现为:随着模型大小的增加,训练损失会降低,模型生成性能会提高,捕捉全局信息的能力也会增强。 论文标题:Elucidating the design space of language models for image generation 论文链接:https://arxiv……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...。我们对慢帧使用 pXp 池化,对快帧使用 2pX2p 池化。基准性能LLaVA-Video 的表现。对于 VideoDC 和 VideoChatGPT 的,我们使用 5 分制度打分,其他评测集结果以准确率打分。所有结果均为 0-shot 准确率。* 表示该评测集的训练集已在我们...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...。因此,团队使用DCLM来设计高质量数据集从而提高模型性能,尤其是在多模态领域。其思路很简单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
...域,持续优化升级问财HithinkGPT 大模型,不断提升其整体性能。同花顺在公告中称,公司建立了高效的训练体系,涵盖数据配比、模型架构优化等多维度,以低成本完成大模型训练;公司拥有数十年的数据积累和自建的HithinkFinEva...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...映射关系,从而能够实现“以图生文”、“以文生图”等性能。2026年数据预言是真是假?数据,是人工智能赖以发展的核心资源。如何解决“数据瓶颈”是未来一段时期我们即将面临或已经面临的挑战。据业内人士分析,GPT-3于...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...展的多模态模型GLM-4V-9B能够很好地融合文本和视觉模态,性能比肩GPT-4V。如今,在视频生成领域,智谱立足多模态能力,再次实现“一举爆破”,推动技术天花板升维。 二、立足多模态能力,智谱补齐视频生成版图智谱在多模...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...、超参数调优:帮助用户找到最优的模型参数,提高模型性能,可能包括自动化的超参数搜索服务。 5、模型训练监控:提供训练过程中的实时监控和日志记录,帮助用户了解模型训练的状态和效果。 应用部署和构建服务确保...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GPT-4,引发众多猜测后被Mistral联合创始人证实,是此前一款公开的量化模型被泄露。字节跳动...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...本嵌入模型:text-embedding-3-small和text-embedding-3-large,前者性能比前代模型大幅提升,价格降至1/5;后者能创建最高3072维数的嵌入,性能更强,价格亦十分经济。GPT-3.5 Turbo的新版本也将推出,输入价格降低50%,输出价格减少25%。.……更多
GPT-4劲敌,谷歌进入高能+高产模式
...世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ul.……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态理解和文档智能领域的潜力。最近,提升多模态大模型处理高分辨率图像的能力越来越引起这个领域的关...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
...高度准确和广泛的泛化能力,融入手机系统能够增强手机性能,而且随着AI算法的进化,大模型手机能够基于用户数据分析提供个性化服务,实现“千人千机”。一面是,AI大模型厂商积极挺进硬件领域(智能手机、智能学习机...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...的情况下学习和适应,进而根据具体目标最大限度地提高性能(有效性和自动化)。有了结构化推理之后,LLM 智能体可在内部重构自身,通过灵活和内在的(智能体内部的)自我反思功能实现主动推理,并在采取外部行动之前...……更多
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...据为主要数据源进行训练和测试。最终模型展现了卓越的性能,尤其是在X级耀斑的预测上,达到了95%的准确率和100%的真实阳性率。“入地”对中国科学院的科研人员来说,做学问、做研究是他们的本分,分担国家重大任务是责...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
更多关于科技的资讯:
鲁网11月19日讯近日,由建行日照分行青年员工朱杰主导研发的“机箱及计算机主机及支架装置及具有其的显示器”两项实用新型专利
2025-11-19 11:14:00
圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕
中国网讯 11月17-18日,在北京中关村国家自主创新示范区展示中心,以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官
2025-11-19 11:24:00
“箱包之都”牵手中国大集,共筑数字信任新生态
鲁网11月19日讯 (记者 吴艳萍)在数字经济与实体经济深度融合的背景下,11月18日,中国大集与白沟箱包产业带W2W战略合作签约仪式举行
2025-11-19 11:52:00
大华股份亮相中国国际电力设备及技术展览会
11月18日,第三十二届中国国际电力设备及技术展览会在上海新国际博览中心盛大启幕。大华股份携子公司华感科技、华消科技重磅参展
2025-11-19 13:58:00
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00
中国工程院院士邬贺铨、郑纬民点赞阿里千问APP:坚持走专业严谨的路线 期待中国AI走向世界舞台中心
11月18日消息,阿里巴巴千问APP近日开启公测,接入全球性能第一的开源模型Qwen3并免费开放。两位中国工程院院士就此分别接受了媒体采访
2025-11-18 16:57:00