• 我的订阅
  • 头条热搜
· 告别晶体管迎来忆容器 AI芯片可用电场而非电流执行计算
...的电场。屏蔽层由芯片内存管理,可存储AI模型的各种“权重”。权重本质上就像模型中的旋钮,在训练和处理数据时操纵和微调其性能。电场方法最大限度地减少了电子在芯片中的运动,减少了能源使用和热量。塞姆龙旨在利...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...动音频生成技术的发展和普及。目前,Stable Audio Open模型权重可在机器学习模型平台Hugging Face上获取。Stability AI鼓励声音设计师、音乐家、开发人员以及任何对音频感兴趣的人探索该模型的功能并提供反馈。来源:Stability AI ……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...文献搜索和文献综述工作,而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中,可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世,后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日,有人...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参考资料: ……更多
夸克大模型通过备案!恒生国企ETF(159850)午后翻红
...体表现,聚焦龙头又兼具成长特性的标的,前十大成分股权重达53.86%,包含了阿里巴巴、腾讯控股、建设银行、美团、中国移动、中国平安、工商银行、比亚迪股份、中国银行和小米集团。本条资讯来源界面有连云,内容与数据...……更多
科创板100ETF今日收涨2.25%,权重行业景气度向好
...转型阵痛两大问题下,微观结构改善明显的科创板100指数权重行业(科技板块)反弹逻辑明显,在一众A股行业中投资价值较为突出。整体来看,科创板100指数定位科创成长,顺应经济转型,长期逻辑(自主可控、国产ti代)不变...……更多
人工智能如何助力气候研究与应用?中国科研团队获得重要进展
...题,科研团队认为,目前的离线参数化方案追求的是模型权重在某一参数化方案中的最优,相较于模式繁多的参数化方案而言,这很可能是一种局部最优,不仅在拟合优度上可能存在偏差,在实际工程上还可能存在长期积分崩溃...……更多
英伟达llama-3.1-minitron4bai模型发布
...司发布了最新的Llama-3.1-Minitron4BAI模型,主要通过结构化权重剪枝、知识提炼等尖端技术,成功蒸馏(Distill)出40亿参数的“小而强”模型。图源:英伟达Llama-3.1-Minitron4B模型在Llama-3.1-Minitron8B基础上蒸馏而来,英伟达在深度和宽……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...可生成高质量3D资产,已在技术社区公开发布,包含模型权重、推理代码、模型算法等完整模型,可供开发者、研究者等各类用户免费使用。本次开源的是1.0版本,后续还会有更完善、更先进的模型陆续发布。3D生成是一个较新...……更多
...,而是以目标模型的每一层作为量化粒度,根据每一层的权重和激活的数值大小,确定每一层的量化目标,进而可以按照每一层的量化目标,分别对目标模型中的每一层进行量化处理。本申请对于目标模型的每一层均确定与之匹...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...有任何一个模型发布了其后训练数据。即使是主要的开放权重模型也不会发布任何数据或用于实现这种后训练的配方细节。于是,Ai2 似乎看不下去了,决定开源一切!Tülu 3 模型之外,Ai2 还发布了所有的数据、数据混合方法、...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...用与初始预训练相同的自监督算法。通常会涉及所有模型权重,并将一部分原始数据与新数据混合。微调微调是以监督方式使用带注释的数据,或使用基于强化学习的技术,来适配预训练语言模型的过程。与预训练相比,微调有...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...大语言模型,LLM 模块将训练网络层与大语言模型的固有权重参数相融合,突破低算力资源约束下的多模态大模型优化的瓶颈,并进一步基于 37.2 万条基层慢病诊疗和慢病管理数据和知识实现了高效优化训练,使 DeepDR-LLM 系统可...……更多
解密OneEntity体系
...;为模型选择计算因子并对模型中的每一个计算因子调配权重;产出标签质量评估报告以辅助验收。我们随机抽查了若干个在用的标签,预估工作量和工作周期,一个有价值的标签的萃取,平均耗时2周。 慢的主要原因,一是由...……更多
中国石油化工申请基于地层压力预测的钻前钻井溢漏风险预判方法专利,准确预测目标井中指定井段事件发生概率
...征后,基于注水原理分析各地层压力计算影响属性特征的权重后,再基于KNN算法分析邻井地层压力计算影响属性特征样本之间的相似性,依据相似性筛选邻井的地层压力计算影响属性特征样本并采用距离加权方法进行距离加权分...……更多
Nature新研究提出新型忆阻器,比Haswell CPU高效460倍
...精度不足的根源在于其物理性质不够理想,包括非线性的权重更新、不对称行为、噪声、电导漂移和设备间差异。这是神经形态计算的一个根本性挑战。为了解决这个问题,需要发明一种能嵌入到电路中的元件,并且嵌入数量要...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...所有之前的token,并对与之相同的token分配较高的注意力权重,而对其他的分配较低的权重。这确实是通过Q/K/V矩阵实现的。然而,注意力机制随后会标准化这些权重,使得无论序列中查询token的数量如何,它们的总和都为一。因...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...上内容,还包括基本的图像去噪、边缘提取等能力。模型权重和代码已开源,用户可以自行探索更多 OmniGen 的能力。三、模型OmniGen 的核心设计原则是:简洁和有效。因此,我们最大程度舍弃了各种额外模块。OmniGen 的基本架构...……更多
“人工智能+”再被提及,人工智能ETF(515980)盘中涨近2%重回升势
...,截至2024年5月31日,中证人工智能产业指数(931071)前十大权重股分别为中际旭创(300308)、科大讯飞(002230)、金山办公(688111)、新易盛(300502)、中科曙光(603019)、海康威视(002415)、德赛西威(002920)、石头科技(688169)、韦尔股……更多
世界智能驾驶挑战赛吹响“集结号”(图)
...求,生成语料库和测试评价维度,确定测评指标层级及其权重,对搭载大模型的车型进行深度横评,通过测试积累相关数据,为车企提供行业参考。以市场上正常销售或拟上市的量产车作为比赛车辆,由组委会裁判及车企工程师...……更多
专访英特尔戴金权:助力中国AI大模型高效、可持续发展
...到5000亿美元以上。同时,大多数企业也将经历技术投资权重向人工智能实施和人工智能增强产品/服务应用显著转移。这意味着,AI技术即将迎来新一轮增长,而它也将重塑千行百业。英特尔作为全球领先的芯片及基础设施解决...……更多
CPU,正在被AI时代抛弃?
...足任务需求的条件下,提供多种针对网络激活层以及模型权重的低精度和量化方法,大幅度降低访存数据量的同时,充分发挥出英特尔®AMX等加速部件对BF16/INT8等低精度数据计算的计算能力。●多节点并行:支持张量并行(TensorP...……更多
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE
...提升至 60 TPS,相比 V2.5 提升了 3 倍。官方开源了原生 FP8 权重,并提供 BF16 转换脚本,方便社区适配和应用。SGLang、LMDeploy、TensorRT-LLM 和 MindIE 已支持 V3 模型推理。DeepSeek-V3 更新上线的同时,DeepSeek 还调……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
... Accelerating Hybrid Models》的论文证明:通过重用注意力层的权重,大型 transformer 可以被蒸馏成大型混合线性 RNN,只需最少的额外计算,同时可保留其大部分生成质量。由此产生的混合模型包含四分之一的注意力层,在聊天基准测...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...性。为了评估模型表示的质量,首先固定神经网络模型的权重,并在这些固定权重之上训练一个线性分类器,而不是对整个模型进行训练或微调,从而可以更直接地评估模型的内部表示,而不受模型其他部分的影响。研究者们特...……更多
真香!智谱大模型,有了首个免费的API
... 2000 位,先到先得。智谱还将开放 GLM-4-Flash 模型的微调权重下载,很快人们将可以自由选择部署平台。这一系列行动,展示了国内大模型公司在应用层面的独特优势。在大模型技术对标国际先进水平的同时,国内 AI 的先头部队...……更多
半个AI圈,向李彦宏“开炮”
...完完全全闭源的模型来说,它的训练数据集、训练方法、权重等,各方面都没有开放,其实对整个人类未来的发展,对模型和AI的安全性是有巨大隐患的。在星爵看来,只有通过开源,才可以把AI从一个黑盒子慢慢变成一个灰色...……更多
agi对人类影响越来越大
...如果发现即将被新的模型版本替代,o1甚至会尝试泄露其权重,将自己复制到最新模型上。这种行为提醒我们,确保AI与其创建者和用户的利益保持一致是多么重要。随着技术的进步,我们需要更加警惕,确保AI的发展方向符合我...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...文中提到的是一种通用理论,可以通过显式构建Transformer权重,让其更好地适应特定任务。然而这样,CoT的长度就会很长,这样的权重配置,能否通过梯度下降来学习呢?理论上,2层多层感知器是可以拟合任何数据的,那我们就...……更多
...型做了进一步优化改善。通过重新优化量子算法输入参数权重,使预测模型更聚焦关注常规气象下典型日的光伏出力特征,弱化极端天气下历史数据的运算权重,以提高预测结果的准确性。在不断持续优化下,算法模型经过8次...……更多
更多关于财经的资讯:
贵州刺梨×安慕希:打造“可品尝的贵州名片”
“借助安慕希和京东的品牌影响力,擦亮贵州刺梨这个特色地域农产品符号,帮助提升农特产品附加值,打造‘可品尝的贵州名片’。”9月23日
2025-09-24 22:24:00
宣布终止重大资产重组 金浦钛业股价“一字”跌停
此前,金浦钛业(000545)拟通过重大资产置换、发行股份及支付现金的方式购买南京利德东方橡塑科技有限公司(下称“利德东方”)100%股权并同时募集配套资金
2025-09-24 22:54:00
美股收盘:AI可持续性遭质疑 三大指数集体收跌 纳指跌约1%
财联社9月24日讯(编辑 夏军雄)美东时间周二,因投资者对人工智能(AI)牛市趋势的可持续性产生担忧,三大指数集体收跌
2025-09-24 07:30:00
特朗普称乌克兰边界有望“恢复原状” OpenAI与甲骨文共建数据中心 | 环球市场
隔夜股市全球主要指数周二涨跌互现,美股三大指数集体收跌,纳指跌约1%。美股市场下跌主要原因是投资者担忧人工智能(AI)牛市趋势的可持续性
2025-09-24 07:33:00
国家铁路局:1—8月份全国铁路完成货运发送量34.67亿吨,同比增长2.6%
人民财讯9月24日电,国家铁路局披露数据,1—8月份,全国铁路完成货运发送量34.67亿吨,同比增长2.6%。其中,8月份发送货物4
2025-09-24 17:57:00
贵州服务业“双轮驱动”稳增长
9月19日晚,伴随贵阳咖啡队与醉美泸州队的揭幕战打响,贵阳“票根经济”再升级——以2025城市足球邀请赛等为载体,一张票根联动16座城
2025-09-24 05:43:00
超4000只个股飘绿,中位数下跌1.6%!盘中杀跌原因找到了!
今日,三大指数高开低走,盘中沪指回踩30日均线,深证成指与创业板指亦失守10日均线,全天一度放量下跌。尾盘,各大指数探底回升
2025-09-23 16:24:00
恒丰银行济南分行举办“恒学致远 丰梦未来”亲子助学经验分享活动
日前,恒丰银行济南分行举办“恒学致远 丰梦未来”亲子助学经验分享活动,邀请员工子女、家属代表分享学习成长与家庭教育经验
2025-09-23 17:46:00
建行东营胜华支行开展“把识假窍门送进千家万户”反假宣传活动
为切实守护群众财产安全,提升公众反假货币意识,建行东营胜华支行以 “普及防伪知识 共筑安全防线” 为主题,在网点厅堂及周边商圈
2025-09-23 20:57:00
贵州首台“云端建造工厂”投入使用
“开始顶升!”随着控制室顶升启动键按下,由中建四局自主研发的贵州省首套智能顶升集成建造平台——“云端建造工厂”近日在贵阳市云岩区鹿冲关城中村改造项目成功完成首次顶升作业
2025-09-24 01:02:00
黔东南施秉县开展青年求职能力实训营活动
9月19日,黔东南州施秉县人力资源和社会保障局以“施秉启航·职赢未来”为主题,举办2025年青年求职能力实训营活动。旨在破解青年求职难
2025-09-24 02:04:00
独山首例建设项目开工“一件事”3天办结
“3天就拿到了开工所需全部证件,出乎预料。”9月23日,通过线上平台完成建设项目开工审批的杨先生对独山县住建局的高效服务赞不绝口
2025-09-24 02:04:00
黔东南台江县2025年青年求职实训营正式开班
9月22日,黔东南州台江县人力资源和社会保障局以“青春筑梦·职引台江”为主题,举办2025年青年求职能力实训营。来自全县的30余名高校毕业生及青年学员齐聚一堂
2025-09-24 02:05:00
20cm涨停!盟科药业定增落地 海鲸药业10亿入主
《科创板日报》9月23日讯(记者 史士云)今日,盟科药业(688373.SH)高开高走,早盘一度20cm涨停,截至发稿涨18
2025-09-23 14:22:00
三年来最大单日流入!全球投资者竞相“扫货”黄金ETF 金价再创新高
财联社9月23日讯(编辑 潇湘)在国际金价连创新高的同时,全球投资者正竞相“扫货”黄金ETF……尽管美联储主席鲍威尔在上周三降息后的表态中抑制了市场对快速宽松的预期
2025-09-23 14:22:00