• 我的订阅
  • 头条热搜
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...手的背后,又运用了什么样的技术呢?独创“专家协同”架构实际上,这种根据需求调度大模型的用法,也刚好是360推出的一项新技术——CoE(Collaboration-of-Experts),即专家协同架构。我们知道,很多国产模型在单项指标上都打...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...Nova 5.0”大模型。6000亿参数的“日日新5.0”采用混合专家架构(MOE),具备更强的知识、数学、推理及代码能力,成为国内首个全面对标甚至超越GPT-4 Turbo的大模型,多模态能力领先GPT-4V。基于端云结合的架构,商汤端侧大模型...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。Llama 3在Meta自制的两个24K GPU集群上进行预训练,使用了超过15T的公开...……更多
关于AI PC,联想和英特尔过于乐观了吗?
...求门槛是40TOPS,而英特尔即将发布的酷睿Ultra(Meteor Lake架构)可能达不到这个门槛,预计下一代的Lunar Lake才能。而Lunar Lake将于2024年采用18A制程制造,预计2025才会推出,或许会落后其它厂商的产品一年。 反观Arm架构阵营高通...……更多
探索AI落地路径,红帽胜算几何?
...化改造,消除现有系统和存储平台之间的障碍,提高基础架构的可持续性,并在云端、数据中心和边缘之间找到平衡点。 那么,如何以开源的方式将AI带入企业?在不久前举办的2024红帽全球峰会上,多年来在全球开源技术发展...……更多
ai终端产业创新论坛在沪举行
...在GGUF的基础上发展了自己的一套轻量化的推理引擎,助力大模型“瘦身’,并与合作伙伴一起完成了大模型端侧部署的验证。希望有更多伙伴一起合作优化端侧推理引擎,让我们端侧的AI变得越来越好。”探索AI终端新物种全方...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...腰。很快,Yi系列模型,被一位开源社区网友指出,模型架构与扎克伯格的Meta发布的开源大模型LLaMA完全相同,只是“其中将两个张量重命名”。这让公司陷入了“套壳”争议。2023年12月11日,零一万物在文章中表示,Yi-34B-Chat ...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...走完了整个多模态预训练流程。过程中他们从数据、模型架构与训练策略上协同推进,最终把相关发现形成科技报告并开放给所有人,也开源了最终的预训练模型与微调模型。值得一提的是,本次成果与苹果公司最近发布的多模...……更多
GTC 2024硬件一览:史上最强AI芯片GB200发布!
...黄在GTC宣布推出新一代GPUBlackwell。这里先介绍一下Blackwell架构,此前NVIDIA推出的显卡一般是两种架构,其中游戏显卡例如我们熟悉的RTX40系则是AdaLovelace架构,而面向AI、大数据等应用的专业级显卡则采用Hopper架构。图片源于网络...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...界上第一个用于Transformer的专用芯片(ASIC)。将Transformer架构烧录到Sohu芯片后,它无法运行大多数的传统AI模型:比如DLRMs、AlphaFold 2,或Stable Diffusion 2;也无法运行CNNs、RNNs或LSTMs。但对于Transformer来……更多
大模型价格战“卷”向何方?|深度
...量化和线性化。他特别提到了其公司刚发布的千亿参数MoE架构模型。MoE架构中基于多个专家并行机制,推理时只激活部分专家,以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方...……更多
infini-attention:谷歌大内存机制
...出的 Infini-attention机制(无限注意力)。它能让Transformer架构大模型在有限的计算资源里处理无限长的输入,在内存大小上实现 114倍压缩比。什么概念?就是在内存大小不变的情况下,放进去114倍多的信息。好比一个存放100本书...……更多
理想汽车推出全新自动驾驶技术架构
...理想汽车还隆重推出了基于前沿科技的全新自动驾驶技术架构,该架构深度融合了端到端模型、VLM视觉语言模型与世界模型,并启动了早鸟计划,邀请用户率先体验这一技术。具体而言,无图NOA技术的推出标志着智能驾驶迈入新...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...处理。 计算模拟训练可以快速探索、验证和测试各种PNN架构,有助于在进行实际的物理建构之前提高PNN的准确性和功能性。这种方法不仅速度更快,成本效益更高,无需为每次设计迭代建立和优化昂贵而耗时的物理系统,还具...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...https://huggingface.co/apple/DCLM-7BDCLM-7B同样采用了decoder-only的架构,使用PyTorch和OpenLM框架进行预训练。总共4T token的DCLM-baseline数据集来自于总量240T的DCLM……更多
...的自动驾驶系统开发进入了全新模式,新开发模式和技术架构将加速汽车智能化的进化进程。中国工程院外籍院士、清华大学智能产业研究院(AIR)院长张亚勤表示,AI大模型带来了从判别式AI到生成式AI的新技术范式变革,清华...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在HuggingFace上发布。MM1.5提...……更多
小模型正在成为AI界的新宠
...)的发展,使得训练更大规模的模型成为可能;新的模型架构和训练技术的出现,如 Transformer 架构和预训练技术,使得模型能够更有效地扩展到更大的规模。此外,模型的大小往往被视为技术创新和研发实力的一种体现。因此...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...所有情况下的评估均使用了1600个示例。研究者使用标准架构组件(自注意力、MLP、layer norm等)训练Transformer模型。他们使用了两层和四个头(理论上可以使用更少,但这种架构的优化速度更快)。训练使用Adam进行优化,批大小...……更多
成都人工智能产业多点开花
...速。就在前不久,创新中心发布了中国首个基于视觉扩散架构的人形机器人任务生成式模型R-DDPRM,这是人形机器人进化史上的重大核心技术突破。“扩散架构应用于人形机器人核心技术研发是全球人工智能最新最尖端领域,将...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
...为主要有4点原因:目前主流的LLM模型采用了基于transformer架构的深度神经网络算法,这种架构的算法通过自注意力机制处理数据,并考虑序列的不同部分或句子的整个上下文,从而生成对模型结果的预测。市面上先进的LLM通常包...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...幸存的patch中,从而显著减少高mask带来的性能下降。在本架构中,patch-mixer是通过注意力层和前馈层的组合来实现的,使用二进制掩码进行mask,整个模型的损失函数为:与MaskDiT相比,这里不需要额外的损失函数,整体设计和训...……更多
新一代aigc技术的发展
...对多级交换机的需求,从而带来了独特的优势。因此,DDC架构有效地避免了与PFC相关的死锁问题,确保了网络的无缝和不间断的运行。分布式操作系统提高可靠性在DDC架构中,管理功能在网络控制卡(NCC)的控制下进行集中管理...……更多
联想王传东:AI PC是打开大模型时代的第一终端|WISE2023商业之王大会
...在这种三种大模型的集合下,实际上如何实现我们的整体架构的联通呢?从联想的角度来讲,我们提出了一个“混合AI框架”体系。我们希望通过大模型的微调、隐私保护、本地算力,去服务于企业模型和个人模型。对于企业和...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...,创新两种运动处理模块Tora采用OpenSora作为其基本模型DiT架构,OpenSora是AI创企潞晨科技设计并开源的视频生成模型框架。为了实现基于DiT的轨迹控制视频生成,Tora引入了两个新型运动处理模块:轨迹提取器(Trajectory Extractor)...……更多
硬科技热潮来了,落地却为什么迟缓?
...车企和Tier 1公司内部的战略中都可以看到,整车电子电气架构的发展趋势,都是从分布式往中央式发展。其次,其实今年大家常提的就是降本,因为大家都要赚钱,降本也非常重要。基于这样大的背景下,如果要支撑跨域计算的...……更多
传统与AI性能两开花:AMD Zen 5架构处理器全解析
...力,让AI应用更加高效。在台北Computex2024中,AMD发布了Zen5架构处理器,包括锐龙AI300系以及锐龙9000系处理器,就在上周,AMD于洛杉矶举办了2024年的TechDay活动,为大家详细介绍了Zen5处理器的性能、参数以及与之配套的应用。热点...……更多
理想的智能驾驶,到底「City 不 City」?
...位低速 AEB」;同时,理想还发布了一套全新的智驾技术架构。那么,不妨一起来看看,如今开始深耕「City」智驾场景的理想无图 NOA 到底「City 不 City」?全新的智驾技术架构又是否能够领先行业一步?比「德芙」还丝滑的无图 ...……更多
让x86处理器也有AI智能,解读AMD Ryzen AI引擎
...理AI相关任务是采用神经网络进行计算的,和传统计算在架构和模式上都存在巨大的差异。我们知道人工智能最初是由传统的硬编码算法创造,并由人类编程完成,而现代的人工智能大多基于神经网络,数据以不同的权重从一个...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...,专注于为大语言模型构建芯片的初创公司,和Transformer架构捆绑得太紧了。在这种架构下,基于Transformer的模型基本是在预测最有可能出现的下一个单词,因此它们一直被诟病生成的回答是基于概率,而非基于推理。这也就意...……更多
更多关于科技的资讯:
鲁网11月21日讯为回馈客户,赋能业务高质量发展,近日,河东农商银行桃源支行联合辖内某药业集团举办“金冬时节·健康相伴”客户养生见面会
2025-11-22 09:34:00
灵光4天下载破100万,扩容8轮,刷新Sora2五天纪录
11月22日消息,蚂蚁灵光上线4天下载量突破100万,冲上App Store中国区免费榜第六。灵光首个百万下载速度超过ChatGPT
2025-11-22 14:13:00
知识带货热度高,历史作家梅毅在抖音直播间发布新书
知识带货热度不减,越来越多作家走进直播间推荐新书、好书。11月20日,知名历史作家梅毅(网名“赫连勃勃大王”)携新作《天命无常
2025-11-22 15:35:00
齐绘未来发布“快上岸”智能求职小程序,多项自主知识产权技术为大学生就业赋能
北京齐绘未来教育科技有限公司近日正式推出“快上岸”微信小程序,以多项具备自主知识产权的AI系统为核心,为大学生提供精准
2025-11-22 15:36:00
以开源聚合力,以生态促创新,电鸿走出行业操作系统自主路径
“在过去,去一次现场要带一大堆终端,以应对现场不同设备的接入。现在,只需一部手机和一箱基础工具就行。”来自广州南沙示范区运维工作人员的分享
2025-11-22 15:37:00
河北新闻网讯(李力芳)2025年7月份以来,河北建工省安装六分公司浙江八亿时空项目创新引入平台吊装系统、蜘蛛吊、电动遥控坦克等专业技术装备
2025-11-22 18:08:00
11月21日从太钢获悉,太钢近期硅钢产品订单在欧洲高端市场实现成功落地。此次出口的硅钢产品首次实现大卷重(15-17吨)和高牌号超宽规格(1250mm)供货
2025-11-22 18:20:00
校企携手研发新型电池 拓展长时储能应用新边界
荆楚网(湖北日报网)讯(记者唐天琪 通讯员王蕾、蓝静)11月20日,以“储能大时代,长时新蓝海”为主题的中国新型储能产业创新联盟2025年度大会在武汉召开
2025-11-22 19:06:00
必胜客中国业务进入快车道:门店突破4000家
2025年11月22日,百胜中国旗下必胜客在海南三亚举行中国第4000家门店的开业庆典。这一里程碑意味着必胜客在中国的布局进入新阶段
2025-11-22 22:32:00
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00