• 我的订阅
  • 头条热搜
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...披露了更具参考意义的信息,主要包括从数据准备、模型架构、训练方案及优化策略几个方面。数据准备依托快手在视频技术领域的多年积累,可灵大模型团队已经构建了完备的标签体系,包括从视频基础质量、美学、自然度等...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开源模型。此外,Qwen3还包括六款稠密模型,涵盖6亿、17亿、40亿、80亿、140亿和320亿等...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...CPU上效率不高的工作转移到GPU上发明新的数值精度开发新架构(如张量核心)采用高速内存(HBM)通过MVLink和InfiniBand实现系统扩展这种快速发展使我们从人工编程转向了机器学习,整个技术栈都在快速创新和进步。Q:模型规模扩展方...……更多
腾讯、京东的机器人战略:不造硬件,搭平台
...客服、数字人、导购的数据。据介绍,京东JoyInside平台的架构是——在底层,通过京东云构建了智算基础设施,整合了RAG、TTS、ASR、LLM等多模态能力,让企业能够开箱即用。 在支持系统层,JoyInside平台支持主动对话、情绪检测...……更多
2024中国AI大模型产业发展报告发布 展望五大产业趋势
...大模型产业发展受到算力层面的一些制约。 主流大模型架构仍存在诸多局限。首先,Transformer架构消耗的算力资源普遍较大;其次,基于Transformer架构的大模型对存储设备的要求也更高。高质量的训练数据集仍需扩展。国内的AI...……更多
阿里妈妈首提AIGB并实现大规模商业化落地,将正式开源Benchmark
...23 年,阿里妈妈首次提出了 AIGB(AI-Generated Bidding)Bidding 模型训练新范式(参阅:阿里妈妈生成式出价模型(AIGB)详解)。AIGB 是一种全新的迭代范式,把自动出价问题建模为生成式序列决策问题,这是生成式 AI 在该领域的首...……更多
中国农业大学发布首个国际奶业领域垂直大模型
...业数据。曹志军介绍,孺子牛大模型依托GLM-4大语言模型架构,配备百亿级参数,实现了对中文语境的深度适配。大模型通过利用大规模语料库进行预训练基础模型,针对特定模型参数不断优化,以提升产业效率,优化资源配置...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
智东西9月13日消息,百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多
自研神玑芯片,让蔚来ET9感知范围大2倍,决策快1倍?
...片能否在后年继续保持领先,是大家比较关注的点。芯片架构大更新,单芯片解决多芯带宽限制在近日的蔚来NIODay活动中,蔚来发布了代号为神玑NX9031的自研智驾芯片,这款芯片被李斌评价为“用1颗实现4颗旗舰智驾芯片性能”...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...而合,而且360更早就提出了“慢思考”的理念,并在技术架构和产品中都付诸了应用。同时,360还在其AI产品中强调多模合作,让来自不同厂商的大模型“抱团取暖”,为国内模型追赶OpenAI,找到了一条可行的道路。 从o1看大模...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。目前人们有一个普遍的看法:在这种曲线拟合范式中,架构并不重要,关键的因素是数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心...……更多
AI黑科技齐亮相这个展,看科创产业力量如何撑高质量发展?
...,是一套从信息化到数字化再到智能化渐次递进的数字化架构,致力于让机器像人一样思考和工作。除了这些,还有一款桥梁检修机器人颇受欢迎。“我们今年带来展会的是桥梁斜拉索检修机器人,它是为了代替人工从事桥梁高...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...大规模算力集群来做训练。二是算法持续迭代,Transformer架构不能实现大一统,从稠密到稀疏模型,再到多模态模型的融合,多元架构持续演进并共存,面向特定领域设计的专用芯片难以适应未来算法,通用型算力才具备更强的...……更多
自然语言处理:大模型理论与实践
...sformer模型及预训练语言模型的基本知识。2. 大模型理论- 架构:讲解基于Transformer的编码、解码、编解码大语言模型架构,非Transformer架构如FAT、AFT、RWKV模型,以及大模型架构配置的归一化、激活函数、位置编码、注意力与偏置...……更多
小模型正在成为AI界的新宠
...)的发展,使得训练更大规模的模型成为可能;新的模型架构和训练技术的出现,如 Transformer 架构和预训练技术,使得模型能够更有效地扩展到更大的规模。此外,模型的大小往往被视为技术创新和研发实力的一种体现。因此...……更多
图森未来发布图生视频开源大模型“Ruyi”:RTX 4090 就能运行
...以从 huggingface 上下载使用。据介绍,Ruyi 是一个基于 DiT 架构的图生视频模型,它由两部分构成:一个 Casual VAE 模块负责视频数据的压缩和解压一个 Diffusion Transformer 负责压缩后的视频生成模型的总参数量约为 7.1B,使用了约 200M .……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...特征。此外,Gemma Scope使用了最新的、最先进的JumpReLU SAE架构进行了训练。原始的稀疏自编码器架构,在检测特征存在与估计强度这两个目标之间,往往难以平衡。而JumpReLU架构,就能更容易地实现二者的平衡,并且显著减少误...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...均达到突破性的满分100分,为国内首次。下一代基础模型架构Qwen3-Next及系列模型正式发布,模型总参数80B仅激活 3B ,性能即可媲美千问3旗舰版235B模型,实现模型计算效率的重大突破。Qwen3-Next针对大模型在上下文长度和总参数...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...年来一边继续做GPU服务器的开发,另一方面纷纷采取开放架构,兼容国产自主创新芯片。比如浪潮信息就推出了开放加速计算架构,据称具有大算力、高互联和强扩展的特点。基于此,浪潮信息发布了三代AI服务器产品,和10余...……更多
AI应用遍地开花,AI应用该如何选择显卡?
...的时候,速度更快、效能更高。但是值得注意的是,硬件架构对应的软件支持在这里也有很重要的地位。比如英伟达的GPU在Stable Diffusion的应用中,专门推出了针对GPU Tensor Core加速的版本,整体效能又提升了不少。因此在算力选...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...使用了哪些数据?其中有多少合成数据?为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Sp...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...覆性技术路线创新,北京将设立创新专项,前瞻布局新型架构芯片、脑智能、类脑智能等新路径探索,《若干措施》择优纳入市级科技研发计划,最高支持3000万元。在数据方面,鼓励各类主体开放共享高质量训练数据,根据数...……更多
华为AI存储助力中国移动构建超大规模智算集群
...练,涉及对象存储和文件存储的频繁转换,这对传统存储架构是一个巨大挑战;在数据管理效率方面,随着数据的动态变化,热数据与冷数据需要按需流动,传统系统主要依赖人工干预,效率较低。为应对上述挑战,华为为中国...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...游戏行业的应用前景及实践案例。王睿是一位经验丰富的架构师,他首先强调了AI已经渗透到我们生活的方方面面,甚至在相亲时遇到一位大妈,只要你说自己是做AI的,她都会优先选择你,这足以说明AI已经走出科技和IT界,成为一种全...……更多
前瞻2024人工智能四大趋势
...保护。在互联网隐私与版权保护尚未形成统一标准与完善架构的当下,使用互联网数据进行训练,极易导致大量法律纠纷。而若考虑对这些数据进行脱敏,又面临筛查识别准确率方面的挑战。两难之下,合成数据就成为最惠而不...……更多
英伟达超快stylegan回归
...024×1024高分辨率的图像,并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下:具体到细节上,作者们对生成器、判别器和文本对齐权衡机制进行了重新设计,用FID对样本质量进行量化评估,并采用CLIP来对文本进行对...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...former是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构,凭借强大的自然语言理解能力,Transformer在问世的短短几年内便取代了传统的RNN网络结构,成为自然语言处理领域的主流模型架构。如今,一家创业公司试图动摇Tran...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...些格式之间转换内容。Llama 4系列首次采用了混合专家(MoE)架构的模型,这种架构在训练和回答用户查询时的效率更高,可以将模型划分为多个专注于特定任务的“专家”子模型。据Meta介绍,Scout和Maverick不仅是其“迄今为止最先...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...本,秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神速AI生图工具,...……更多
更多关于科技的资讯:
潮聚湾区 创玩未来——《广州潮玩产业招商研究报告》发布会暨行业主题研讨会在荔湾成功举办
为精准把握潮玩产业蓬勃发展的时代脉搏,助力广州建设具有全球影响力的潮玩产业高地,12月11日,由广州市投资发展委员会办公室主办
2025-12-13 16:43:00
12日晚,第十届中国设计智造大奖(DIA)颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动
2025-12-13 07:36:00
全球首个甲骨文智能体“殷契行止” 上线 最懂甲骨文的AI来了
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)甲骨拓本甲骨文“门”字 甲骨文摹本甲骨文“马”字扫码看视频 厦门网讯 (厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)你只需往电脑上传一张甲骨图片
2025-12-12 08:28:00
厦门网讯(厦门日报记者 曾嫣艳 通讯员 曾焕滨)昨日,厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办
2025-12-12 08:28:00
从流程到质量:制片人为短剧工业化提供的“52集样本”
在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段,如何在有限周期内平衡效率、成本与成片质量,成为所有制作机构必须破解的难题
2025-12-12 08:29:00
剧想天开,造梦未来|一场关于“儿童剧人物造型”的想象力实验
儿童戏剧,是投射在少年儿童心灵舞台上的第一束光。人物造型,作为这束光中最具象、最绚烂的色彩,不仅定义角色的灵魂,更深刻影响着儿童认知世界的方式与审美情感的塑造
2025-12-12 08:29:00
聚焦“中文+职业”融合:星禾星穗在世界中文大会展示校企合作新范式
在近期举办的2025世界中文大会上,教育企业星禾星穗多维度参与,展现了其在“中文+专业/职业”领域的系统思考与实践成果
2025-12-12 08:30:00
会打拳的机器人带你触摸未来 走进国家“芯火”双创基地象屿园区孵化加速器
元启创新的人形机器人正在打拳。(元启创新 供图)厦门网讯 (厦门日报记者 吴晓菁) “灵犀,灵犀,表演一段佛山醒狮。”昨日
2025-12-12 08:59:00
“数字丝路”赋能文化出海,中国数字文化扬帆全球新蓝海
2025年12月9日下午,一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英
2025-12-12 09:00:00
AI 眼镜似乎成了AI具身智能行业中最“靓”的仔,无论是苹果、谷歌这些大厂,还是国内的科技巨头,纷纷下场。本周二,谷歌在The Android Show活动上宣布
2025-12-12 09:10:00
近日,中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果,苏州人保财险撰写的《破局与重构:保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析
2025-12-12 10:46:00
为提升员工职场软实力,优化内部沟通效能,12月7日,常熟人保财险琴川学府组织开展了“赋能职场进阶,高情商沟通与协作”专题培训
2025-12-12 10:56:00
长白时评评论员 刘颂寒声称“下载App必得大额红包”,旁边又用小字解释“仅限新人或以实际情况为准”;宣称“全场5折”,又在大大的“5折”后面跟个极小的“起”字……在日常的消费中
2025-12-12 10:56:00
在当前行业竞争加剧与市场环境多变的背景下,虎丘支公司持续推动降本增效工作,这既是应对挑战的必要举措,也是实现长期稳健经营的重要保障
2025-12-12 10:58:00
劳利近日“水银体温计明年起禁产”的话题引发热议。根据国家药监局此前发布的通知,自2026年1月1日起全面禁止生产含汞体温计产品
2025-12-12 11:01:00