• 我的订阅
  • 头条热搜
京东云发布八大领先智算产品,助力企业火速用上大模型
...,京东云发布八大极致性价比的智算产品,五种全场景大模型部署模式,同时推出“开发训练+场景应用”双引擎一站式平台,助力企业实现DeepSeek等大模型开箱即用、智能体深度开发与应用,全面打通从模型落地到产业智能升级...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种...……更多
算力市场格局生变,谁能“拔得头筹”?
...源人工智能研究院发布了全球首个单体稠密万亿参数语义模型Tele-FLM-1T,成为国内首批发布稠密万亿参数大模型的机构。针对大模型训练算力消耗高的问题,TeleAI与智源基于模型生长和损失预测等关键技术联合研发出的Tele-FLM系...……更多
openai公司宣布改善微调api,进一步扩展定制模型计划
...闻稿,宣布改善微调(fine-tuning)API,并进一步扩展定制模型计划。IT之家翻译新闻稿中关于微调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch(将训练数据集中的所有样本都过一遍(且仅过一遍)的训练过程)...……更多
常见电子邮件分类算法的性能分析
...值向量,进而利用监督学习的方法进行训练。通过训练,模型能够学习到从文本到类别的映射关系,从而实现对新文本的自动分类。这些算法在垃圾邮件识别、新闻分类、情感分析等领域有着广泛的应用。关键词:TF-IDF;决策树...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
...闻网中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美元。但在大模型扩...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
头图由天工AI生成随着中国加速研发 AI 大模型技术,追赶美国,如今已迎来新的节点。北京时间4月18日,Meta推出了新版开源大模型Llama 3,并推出了8B和70B的预训练和指令微调版本,在众多性能上都大幅超越了Llama 2。Meta官方还...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
手机厂商也加入了“大模型”赛道。11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多
提质降价,国产大模型加速奔跑
...302款生成式人工智能服务完成备案——提质降价,国产大模型加速奔跑本报记者 王俊岭《人民日报海外版》(2025年02月05日第 11 版)日前,在福建省福州市鼓楼区安泰街道南门兜地铁站里举行的2025年就业援助月专项活动中,工...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
6月底,谷歌新一代开源模型Gemma2发布,相比今年早些时候推出的轻量级开源模型Gemma,Gemma2有了90亿(9B)和270亿(27B)两种参数规模可用。就在谷歌摩拳擦掌准备与OpenAI一较高下时,前几天其发布的一份报告却引来了媒体的“...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
AI与人争资源怎么破解
...nAI公司发布的聊天机器人ChatGPT的爆红,各国都加快了AI大模型的训练,需要的算力也急速增加。马斯克最近在公开采访中表示,现在AI对算力的需求差不多每半年就会增加10倍,AI算力的瓶颈是可以预见的:“一年前,短缺的是芯...……更多
腾讯推出 Hunyuan-Large 开源大模型
IT之家11月5日消息,腾讯今日宣布推出Hunyuan-Large大模型,官方表示这是目前业界已经开源的基于Transformer的最大MoE模型,拥有3890亿总参数(389B)和520亿激活参数(52B)。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
...领域正在经历重大转型,从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基础模型」。目前虽然有不少基础模型已经提出,但如何有效地在高度多样化的时序数据上训练基础模型仍是一个开放问题。近期,来自...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...动做收缩调整。商汤在财报中指出,受惠于中国市场对大模型和智算服务的强劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
我国发布首个亿级参数量地震波大模型:名为“谛听”
...,据成都科技局官方公众号介绍,日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。同时,“谛听”也是目...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...一新兴的前沿领域还鲜少有人涉足,但绝对值得深耕!AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功,LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象,当前的模型规模如何能再扩大10倍...……更多
中国石油获得发明专利授权:“地震储层参数预测方法及装置”
...:将目标地层的地震数据,输入预先建立的储层参数预测模型中,得到目标地层的多个地震储层参数;储层参数预测模型按照如下过程建立:获取目标地层的地震工区资料,形成训练数据集;基于人工神经网络模型搭建多任务学...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
【新智元导读】北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式,相比传统模型在多项任务中表现出色,同时降低了参数量和计算量,增强了对周期性特征的建模能力,应用潜力广泛。周期性现象广泛存在,深...……更多
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...et系列的原班人马推出了新一代架构:BitNet a4.8,为1 bit大模型启用了4位激活值,支持3 bit KV cache,效率再突破。量化到1 bit的LLM还能再突破?这次,他们对激活值下手了!近日,BitNet系列的原班人马推出了新一代架构:BitNet a4.8...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...量化」的基本概念和分支方法进行了全方位总结。大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小...……更多
更多关于社会的资讯:
长白时评评论员 久泰平到12月7日,为期五天的吉林雪假悄然落幕。不同于寻常假期的匆匆而过,这场以冰雪为主题的专属时光,不仅为孩子们的童年相册添上了斑斓一页
2025-12-07 07:16:00
为进一步贯彻落实习近平文化思想,深化推进“杭州文化研究工程”,12月6日,由浙江大学主办,杭州城市文化研究中心(浙江大学杭州文化研究中心)
2025-12-07 07:21:00
12月6日,从太原市保障性住房开发建设有限公司(以下简称市保障房公司)了解到,12月8日至12月13日,将在小店区长治路109号阳光国际酒店3层阳光厅举行“锦绣汾东”项目的选房活动
2025-12-07 07:32:00
农业银行青州益都支行在下班前五分钟接待了这样一位客户,她手提一兜零钱进入,问工作人员还能不能存上这些零钱,说自己今天来的晚了点
2025-12-07 07:46:00
这两天,踏入杭州市第十二届老年生活博览会的“科技+养老”的特展区,空气里弥漫着一种安静却充满力量的氛围。不再是沉重的负担
2025-12-07 07:52:00
12月5日,2025年度“杭州市诚信艺术机构评选”结果揭晓。经过严格评审,全市共有10家单位荣获“2025年度杭州市艺术品行业诚信艺术机构”称号
2025-12-07 07:52:00
12月6日,“洞天行履——宋人自然秩序的审美转译”第二届宋韵艺术美学论坛暨第十届“两宋论坛”研讨会在中国国际设计博物馆举行
2025-12-07 07:52:00
最近,不少杭州市民收到了这样一条短信:“尊敬的用户,由于业务升级,您之前办理的‘绑卡租车’功能即将在2025年12月底取消
2025-12-07 07:52:00
厦门网讯(厦门日报记者 卫琳)昨日,民建厦门市委召开第十八届中小企业发展年会暨AI赋能生态大会,围绕“智创生态,赋新致远——AI与中小企业创新融合”主题
2025-12-07 08:04:00
剧院“演奏家”进公园 市民现场点歌不亦乐乎
这里没有预告,无需门票,甚至没有一张正式的座椅。在北京紫竹院公园的竹林深处,当熟悉的旋律响起,往来的游客便会驻足,汇聚成里三层外三层的听众
2025-12-07 07:52:00
上门换俩灯泡,收费240元。不久前,消费者张先生预约上门维修服务时的遭遇,让不少网友产生共鸣。便宜材料高价卖,人工费用糊涂账
2025-12-06 07:47:00
“北山街迪士尼”的摩天轮怎么拆了?已运转15年了准备换新
摩天轮全景。记者 顾心言 摄近日有网友在社交平台发帖:“西湖边青少年宫的摩天轮怎么拆掉了?”不少网友跟帖评论:“这个摩天轮
2025-12-06 08:18:00
近日,中国铁路哈尔滨局与沈阳局联合推出旅游计次票。作为东北地区首次推出的15日有效期跨省旅游计次票,通过“高铁+旅游”模式
2025-12-06 08:18:00
12月5日,香港特区政府医务卫生局局长卢宠茂表示,大埔宏福苑火灾所有伤者均已脱离危险期,仍有30人留院。卢宠茂表示,79名伤者已全部脱离危险期,其中49人已出院。
2025-12-06 08:18:00
“最强大脑”齐聚杭州 2025年“院士专家杭州行”圆满举办
院士们观看云深处科技机器人跳舞。记者 江玥 摄12月5日,为期5天的“2025院士专家杭州行”活动在杭州圆满收官。潘云鹤
2025-12-06 08:18:00