• 我的订阅
  • 头条热搜
阿里云的AI路线图
...络、存储的“算力基础”区域,介绍Serverless(无服务器运算)应用开发范式的“云上开发”区域,以及包括数据库、大数据、云原生等领域的“开源开放”区域等。同时,阿里云的重要合作伙伴英伟达、英特尔、蚂蚁集团、Sales...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多
...练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。本月发布的推理大模型DeepSeek-R1在复...……更多
...市智能算力规模突破100EFLOPS(EFLOPS是指每秒进行百亿亿次浮点运算),形成50个左右具有显著成效的行业开放语料库示范应用成果,建设3个至5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。从《实施...……更多
“怪兽级”显卡发布,个人AI超级电脑亮相!黄仁勋:整个行业都在扩大AI规模
...达Blackwell架构搭建,在AI性能方面可提供每秒800万亿次8位浮点运算,能够运行支持人形机器人的多模态AI模型。 人形机器人计算平台Jetson Thor。来源:英伟达直播演讲结束前,黄仁勋为观众带来了最后的惊喜:个人AI超级电脑Proj...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
支持8K和更加大光追?索尼PS5 Pro游戏主机性能曝光
...并且还会加入主机学习(machinelearning)功能,支持300TOPS8bit浮点运算与67TFLOPS的16bit浮点运算。PS5Pro传闻开发代号为“Trinity”,CPU将与标准版的PS5相同,但具备超频模式,让CPU频率上升为3.85GHz,比目前PS5的3.5GHzCPU,……更多
amd推出10亿参数语言模型系列amdolmo
...10月31日发布博文,宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo,为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列(LMs),在AMDInstinct™MI250GPU集群上训练,使用了超过1.3...……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...实现从过去被动响应需求,进化为能主动聚焦问题、精准运算、深度分析、和智能决策、精准执行。相较于通用智能体,JoyAgent在企业场景展示出更多优势。在研发场景,JoyCode智能编码助手持续进化,实现开发即部署,代码采纳...……更多
...标准机架,算力总规模达到了230EFLOPS,即每秒230百亿亿次浮点运算。其中,智能算力比例持续提升,满足人工智能应用发展需求。截至2023年底,中国智能算力规模达到了70EFLOPS,即每秒70百亿亿次浮点运算,增速超过70%。工信部...……更多
破解AI耗电困局 科技巨头“押注”核能
...歌的Gemini Ultra模型训练时需要500亿PetaFLOPs(每秒千万亿次浮点运算)算力。如果要用商用计算机实现这种计算能力,需要大约1016台计算机。与此相关的训练成本为1.91亿美元,主要归因于能耗。单个AI模型的耗电量可达数万千瓦...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...公司正在研发的AI芯片能为7B大模型训练提供每秒至少1022浮点计算。在提供迄今最好的服务器单位价格性能基础上,该芯片的延迟也能得到优化。例如使用MatX芯片,训练70B大模型的延迟将小于10ms/token。该芯片也提供扩展性能,...……更多
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...出大招,联合宣布正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,而使用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。这次实训充分验证了夸娥千卡智算集群在大模型训练场景下...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...训练,保持全精度latent weight来累积参数更新。模型量化浮点量化提供了比基于整数的量化更宽的动态范围,这对于处理激活值的长尾分布至关重要。 研究人员将FFN下采样层的输入保留为8位整数,其他激活值使用MinMax量化器量...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础设施服务,为中国大模型产业繁荣发展提供技术支撑。去年9月,腾讯全链路自研的腾讯混元大模型正式亮相。根据沙利文的权威报...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,这一问题的答案已然变成了「算力」。随着模型规模急剧扩张,参数已经飙升到了千亿甚至万亿级,业界开启了千模大战,AI 算力需求不可避免迎来爆炸式增长...……更多
...根据训练它们所需的算力进行分类,使用称为FLOPS或每秒浮点运算的衡量标准。确切的门槛将由欧盟委员会在稍后阶段确定,并将根据需要进行更新。 公司可以对这一评估提出异议。相反,即使调查后未达到阈值,委员会也可...……更多
16384块NVIDIA H100训练Meta Llama3 4050亿参数大模型:3小时报错一次
快科技7月29日消息,如今的AI大模型规模越来越庞大,动辄成百上千亿参数,训练过程不仅需要数万甚至十几万块GPU加速卡,出错的几率也越来越高。Meta(Facebook)就披露了一份惊人的报告。Meta在报告中披露,为了训练自己的Llama ...……更多
...一号”,“天河三号”完成全国产化规模部署,200亿亿次浮点运算能力稳居世界第一。文心一言、智谱华章、360智脑等AI大模型共有53个,占全国45%。京津冀新一代信息技术应用创新集群集聚了百余所知名高校,中科院体系机构...……更多
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
《科创板日报》8月24日讯(记者 张洋洋)国产大模型企业DeepSeek“点燃”资本市场。近日,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale参数精度,并明确指出该精度标准是针对即将发布的下一代国产芯片设计。这一消...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...的是,PyTorch指出他们实现了F16推理,也就是使用半精度浮点计算。 FP32单精度浮点数F16半精度浮点数相对于FP32,使用FP16可以将位数减少一半,因而减少了所需内存,允许使用更大的模型或更大的批大小,且数据传输速度更快。...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...专门研究模型的推理能力,而忽略了其他因素(如大整数运算)。图 2 展示了一个简单的例题。 图 2通过这个数据集,作者首先测试了 GPT2(RoPE 版)的表现。用 op 代表解题所需的数学运算步数,作者发现,当在 op≤21 的题目上...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...可或缺的核心组成。然而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等...……更多
...安全且弹性足够强的环境,训练之后需要在云端为大模型运算提供足够算力服务等。在行业大模型落地过程中,人才团队的保障也至关重要。陈晓建表示,即使具备完善的数据基础、进行了很好的行业训练,行业大模型仍无法满...……更多
...等4款差异化产品,形成了一个从轻量化适配到超大规模运算的完整服务体系。记者了解到,这一服务体系能够充分满足人工智能研发、工业仿真、金融分析等多元化场景需求,并通过参数灵活配置,实现算力成本的优化,有力...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
OpenAI推出用户自定义版ChatGPT
...成式AI而设计,其性能和能效得到显著提升,整数运算和浮点运算的性能是前一代的2倍,功耗降低了45%。点评:天玑9300旗舰5G生成式AI移动芯片是联发科在移动芯片领域的一项重磅产品,展示了其在5G和AI技术上的创新能力和竞争...……更多
随着大模型的发展日新月异,其推理和训练的边界问题也引起了广泛讨论。近日,清程极智CEO汤雄超在一场行业活动中明确表示,尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限,但从技术角度来看,这两个阶段...……更多
...里的仿真测试,学习训练算力达3.3E FLOPS(每秒百亿亿次浮点运算),模型更新速度每5天迭代一次,用海量数据推动智能驾驶能力持续迭代升级;华为智慧屏搭载的AI摄像头拥有强大的智慧感知能力,可实现3D骨骼识别、坐姿或距...……更多
更多关于科技的资讯:
鲁网11月21日讯为回馈客户,赋能业务高质量发展,近日,河东农商银行桃源支行联合辖内某药业集团举办“金冬时节·健康相伴”客户养生见面会
2025-11-22 09:34:00
灵光4天下载破100万,扩容8轮,刷新Sora2五天纪录
11月22日消息,蚂蚁灵光上线4天下载量突破100万,冲上App Store中国区免费榜第六。灵光首个百万下载速度超过ChatGPT
2025-11-22 14:13:00
知识带货热度高,历史作家梅毅在抖音直播间发布新书
知识带货热度不减,越来越多作家走进直播间推荐新书、好书。11月20日,知名历史作家梅毅(网名“赫连勃勃大王”)携新作《天命无常
2025-11-22 15:35:00
齐绘未来发布“快上岸”智能求职小程序,多项自主知识产权技术为大学生就业赋能
北京齐绘未来教育科技有限公司近日正式推出“快上岸”微信小程序,以多项具备自主知识产权的AI系统为核心,为大学生提供精准
2025-11-22 15:36:00
以开源聚合力,以生态促创新,电鸿走出行业操作系统自主路径
“在过去,去一次现场要带一大堆终端,以应对现场不同设备的接入。现在,只需一部手机和一箱基础工具就行。”来自广州南沙示范区运维工作人员的分享
2025-11-22 15:37:00
河北新闻网讯(李力芳)2025年7月份以来,河北建工省安装六分公司浙江八亿时空项目创新引入平台吊装系统、蜘蛛吊、电动遥控坦克等专业技术装备
2025-11-22 18:08:00
11月21日从太钢获悉,太钢近期硅钢产品订单在欧洲高端市场实现成功落地。此次出口的硅钢产品首次实现大卷重(15-17吨)和高牌号超宽规格(1250mm)供货
2025-11-22 18:20:00
校企携手研发新型电池 拓展长时储能应用新边界
荆楚网(湖北日报网)讯(记者唐天琪 通讯员王蕾、蓝静)11月20日,以“储能大时代,长时新蓝海”为主题的中国新型储能产业创新联盟2025年度大会在武汉召开
2025-11-22 19:06:00
必胜客中国业务进入快车道:门店突破4000家
2025年11月22日,百胜中国旗下必胜客在海南三亚举行中国第4000家门店的开业庆典。这一里程碑意味着必胜客在中国的布局进入新阶段
2025-11-22 22:32:00
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00