• 我的订阅
  • 头条热搜
港媒:中国科学家开发出AI模型或可预测全球洪水
...5月11日报道,中国科学家开发了一种新的人工智能(AI)模型,可以预测世界各地的洪水风险和跨区域流量,甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM,不同于其他预测模型依赖历史流量数据,它使用海拔和...……更多
常见电子邮件分类算法的性能分析
...值向量,进而利用监督学习的方法进行训练。通过训练,模型能够学习到从文本到类别的映射关系,从而实现对新文本的自动分类。这些算法在垃圾邮件识别、新闻分类、情感分析等领域有着广泛的应用。关键词:TF-IDF;决策树...……更多
始于安全,不止安全丨迪普科技AI基座解决方案发布
...李瑞对本次重磅发布新品作详细介绍 中国DeepSeek等AI大模型横空出世,在全球范围内掀起了巨大波澜,国产AI技术正以一种前所未有的迅猛态势重构各行各业的生态格局。早在2016年,迪普科技便布局AI领域,开发出一系列AI小模...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
DeepSeek开源惠四方(科技名家笔谈)
...州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek,受到用户热烈欢迎。2025年1月20日,DeepSeek-R1发布上线,7天内用户超过1亿。ChatGPT从发布到达到相同的用户规模用时两个月。GitHub是全球最大的代码托管网站,Gi...……更多
算力市场格局生变,谁能“拔得头筹”?
...源人工智能研究院发布了全球首个单体稠密万亿参数语义模型Tele-FLM-1T,成为国内首批发布稠密万亿参数大模型的机构。针对大模型训练算力消耗高的问题,TeleAI与智源基于模型生长和损失预测等关键技术联合研发出的Tele-FLM系...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务
...务和NVIDIA NIM推理微服务,与刚推出的Meta Llama 3.1系列开源模型一起,为全球企业的生成式AI提供强力支持。Llama 3.1大语言模型有8B、70B和405B三种参数规模。模型在超过16000个NVIDIA Tensor Core GPU上训练而成,并针对NVIDIA加速……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为...……更多
openai公司宣布改善微调api,进一步扩展定制模型计划
...闻稿,宣布改善微调(fine-tuning)API,并进一步扩展定制模型计划。IT之家翻译新闻稿中关于微调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch(将训练数据集中的所有样本都过一遍(且仅过一遍)的训练过程)...……更多
腾讯发布全球首个重症医疗大模型:5秒总结病情 1分钟写病历
...房的痛点,腾讯和迈瑞医疗联合发布全球首个重症医疗大模型——启元重症大模型。启元重症大模型整体参数量达到万亿,是经过大量医学文本数据训练的医学大模型,涵盖285万医学实体、1250万医学关系,覆盖98%医学知识的医...……更多
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存...……更多
黄仁勋明天登港!沈向洋3小时重磅演讲:发布多款大模型,具身智能激情碰撞
...粤港澳大湾区为窗口,深入探讨了全国及全球视角下的大模型算力趋势、具身智能、AI+编程、AI for Science、低空经济等热点议题。作为IDEA研究院创院理事长,沈向洋进行了近3小时的主题演讲,期间发布多个IDEA研究院创新成果,...……更多
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...蒸馏这一概念,能在保证准确率接近的情况下,大幅压缩模型参数量,让模型能够部署在各种资源受限的环境。比如Siri能够出现在手机上,就是用知识蒸馏压缩语音模型。自它之后,大模型用各种方法提高性能上限,再蒸馏到...……更多
联想发布DeepSeek一体机解决方案:支持千亿参数大模型训练
...2月6日消息,联想集团与沐曦股份联合发布基于DeepSeek大模型的一体机解决方案。该方案以“联想服务器/工作站+沐曦训推一体GPU+自主算法”为核心架构,配合联想AI force智能体开发平台,推出智能体一体机与训推一体服务器双产...……更多
大模型手机密集下场:华为、荣耀、OPPO、vivo、小米杀疯了
不出意外,AI大模型浪潮卷到了智能手机领域,智能手机厂商争先恐后地自研AI大模型或者联手AI大模型厂商,挖掘智能手机与AI大模型的融合发展的巨大潜力。10月26日,荣耀CEO赵明官宣新机荣耀Magic6的部分信息。他表示,新机...……更多
2025国创赛总决赛郑州落幕 清华摘冠、AI成获奖主力
...单揭晓,AI相关项目占比突出本次大赛获奖项目覆盖智能模型、数据互联、材料研发等多个前沿领域。冠军为清华大学“基于类脑架构的下一代通用模型及智能体生态”项目。亚军为浙江大学“一知智能——AI大模型互动营销服...……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...上最大最快的巨型芯片Grace Blackwell NVLink72、首个世界基础模型Cosmos等,并公布了在AI代理、物理AI等方面的布局和进展。新一代GeForce RTX 50系列芯片,最高售价1999美元黄仁勋开场就开玩笑称“你们现在就在我们的数字孪生世界里...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
随着 AI 模型的参数量越来越大,对算力的需求也水涨船高。比如最近,Llama-3.1 登上了最强开源大模型的宝座,但超大杯 405B 版本的内存就高达 900 多 GB,这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛,...……更多
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...张卡的训练集群,研发MegaScale生产系统,用于训练大语言模型;科大讯飞2023年建成了首个支持大模型训练的超万卡集群算力平台“飞星一号”。7月1日,腾讯宣布其自研星脉高性能计算网络全面升级,升级后的星脉网络2.0搭载全...……更多
Meta推出Llama 3,号称“最强开源大模型”
Meta发布最新开源模型Llama3,号称“有史以来最强大的开源大模型”。在Llama3发布后没多久,就破纪录地登顶了全球开源AI社区HuggingFace排行榜,还使Meta股价在大盘小跌的情况下上涨了1.54%,影响力可见一斑。据了解,此次Meta推...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
2024 年的大模型产业,注定将是会被反复提起的历史一页。这一年,被按下加速键的市场,刚刚过半,就已经显示出冰火两重天的格局:算法的单模态扩展到多模态,趋势如燎原之火,让全球陷入对世界模型畅想的狂欢中醺然欲...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...新的石油。」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...AWS re:Invent大会上,AWS(亚马逊云科技)一口气发布6款大模型、预告2款大模型,还推出3nm第三代AI训练芯片Trainum3及其迄今最强AI服务器Trn2 UltraServer。这是Amazon Nova系列基础模型首次亮牌。包括Micro、Lite、Pro、Premier四……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
千行百业加速拥抱大模型(AI前沿观察)
...术创新快 应用渗透强 国际竞争激烈千行百业加速拥抱大模型(AI前沿观察)潘旭涛 陈斯达《 人民日报海外版 》( 2023年12月22日 第 08 版)在湖南省长沙市举办的2023世界计算大会专题展上,参观者在了解AI大模型。新华社记者 ...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...结果也证实了 QIREN 的确表现出超越信号表示任务上 SOTA 模型的优异性能,在参数量更少的情况下,拟合误差最多减少 35%。图 1 中展示了本文的核心思想和主要结论。相关论文已经被机器学习领域最权威的会议之一 ICML 2024 接收...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
amd推出10亿参数语言模型系列amdolmo
...10月31日发布博文,宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo,为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列(LMs),在AMDInstinct™MI250GPU集群上训练,使用了超过1.3...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
更多关于科技的资讯:
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00
“2025年度十大新词语”16日发布,依次为:苏超、票根经济、杭州六小龙、现代化人民城市、育儿补贴、跨境支付通、对等关税
2025-12-16 14:07:00
中国联通三明分公司全力护航“音综王牌超级LIVE演唱会”通信网络畅通
开展专项通信保障工作东南网12月16日讯(通讯员 肖锦雯)密集的人流举起手机,试图捕捉舞台上的精彩瞬间,一场关于信号流畅度的保障已在观众看不见的地方悄然完成
2025-12-16 14:19:00
在国家大力推进现代化产业体系建设的宏伟蓝图下,科技创新与数字经济已成为驱动高质量发展的“双轮”。中国人寿财险江西省分公司主动融入时代潮流
2025-12-16 14:58:00
京东与国际铂金协会达成战略合作 成为其首个线上零售合作伙伴
近日,京东与国际铂金协会(PGI®)达成战略合作,成为其首个线上零售合作伙伴,双方将共同推动铂金首饰的线上消费体验升级
2025-12-16 15:17:00
服务“2030愿景”:中国AI营销平台王牌狮助推中沙数字经济务实合作
2025年12月11日,王牌狮团队在北京迎来沙特阿拉伯投资考察团,并进行了战略与技术交流。此次沙特投资考察团之行,重点关注以王牌狮AI营销智能体及建筑业垂直大模型阿拉丁ALDGPT为代表的中国数智化解决方案
2025-12-16 15:22:00
【宅男财经|专家面对面】对于近期AI换脸被滥用的问题,工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 18:16:00
济南市商务局携手阿里高德推“烟火济南支持计划”: 免商家开店费+精准流量扶持
鲁网12月16日讯12月16日,在高德扫街榜“烟火城市系列发布会·烟火济南”活动现场,济南市商务局、济南市工商联餐饮协会
2025-12-16 20:53:00
【宅男财经|专家面对面】泡泡玛特在国外广受欢迎,针对中国是否还会出现下一个LABUBU,中国广告协会会长、国际广告协会全球副主席张国华在接受宅男财经采访时表示
2025-12-16 21:57:00
雪博会最强指南!6.5折薅遍全球冰雪好物
12月18日至22日,第九届吉林雪博会将在长春东北亚国际博览中心举办,想一站式囤齐冰雪装备、淘遍特色好物?这份购物攻略请收好
2025-12-16 22:24:00
过去,客户经理找客户,靠的是跑园区、混商圈的经验和熟人脉;今天,打开“数智江南”App,就像打开了小微企业导航地图。这小小的转变
2025-12-17 00:05:00
江南时报讯 今年以来,泗阳农商银行坚持以客户为中心,将财富管理作为零售升级的重要方向,着力打造专业、规范、有温度的财富管理服务体系
2025-12-17 00:10:00