• 我的订阅
  • 头条热搜
腾讯推出 Hunyuan-Large 开源大模型
IT之家11月5日消息,腾讯今日宣布推出Hunyuan-Large大模型,官方表示这是目前业界已经开源的基于Transformer的最大MoE模型,拥有3890亿总参数(389B)和520亿激活参数(52B)。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
手机厂商集体奔向大模型,但应用场景仍局限于语音助手?
...小米、华为均已展示在大模型技术上的能力,并率先开启商用落地进程。苹果、一加、荣耀均在布局相关技术,但具体情况暂无透露。“小米将全面拥抱大模型技术。”8月14日,小米创始人雷军表示小米于今年4月正式组建了AI实...……更多
华为新聊天机器人专利曝光:可根据内容自适应准确回复
...用此技术发明。接着我们重点聊一聊另外一项专利“问答模型的训练方法、问答方法及装置”,目前在审核中。摘要:本申请提供了一种问答模型的训练方法、模型的训练方法、问答方法、数据处理方法及装置,涉及人工智能领...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
【产业互联网周报】商务部回应荷兰半导体出口管制;美团收购光年之外全部权益;人民大学通报学生信息泄露事件……
...”和智能投研平台“WarrenQ”。华为明年将发布端到端5.5G商用产品从2023世界移动通信大会获悉,华为将于明年发布端到端的5.5G商用产品。华为认为,5.5G是5G网络演进的必由之路。中国移动董事长杨杰:要将算力网络作为推进信...……更多
...略合作关系,华为云以及昇腾算力产品线同样能为公司大模型的研发提供算力支持,公司目前正在积极与华为对接,展开大模型产品与应用的软硬件解决方案的研发。公司大模型相关产品的研发从规划之初一直采用自主可控的路...……更多
京东要给实体产业做个GPT
...客服更多智慧乃至情感。2年后便推出了业内首个大规模商用情感智能客服系统 ——“言犀”,在大规模服务场景中沉淀AI能力。自诞生之际,言犀便自带“产业”属性,技术可用性强、复用度高、迁移成本低。目前,言犀每日...……更多
海信日立“信智AI平台”智造工厂解决方案入选数字化赋能新型工业化创新实践优秀案例
...日立共同投资,运作海信、日立与约克三大国际品牌,集商用与家用中央空调、新风等产品的技术开发、产品制造、市场销售与用户服务于一体,市场地位稳居国内中央空调前列。近年来,海信中央空调深化数字化、自动化、智...……更多
大模型如何开始生成一个全新时代
...:北京日报与其说人类进入智能时代,不如说进入的是大模型时代——大模型如何开始生成一个全新时代朱嘉明会问问题比拥有知识更重要(摘自《大模型时代》)ChatGPT是人类科技史上的里程碑事件,在短短几个月席卷全球,...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
我国发布首个亿级参数量地震波大模型:名为“谛听”
...,据成都科技局官方公众号介绍,日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。同时,“谛听”也是目...……更多
华为云盘古3.0大模型正式发布
...千行百业》的开场演讲。张平安在演讲中宣布华为盘古大模型3.0正式发布。张平安称,盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构L0基础大模型、L1行业大模型、L2场景模型三层架构,将重塑千行百业。L0...……更多
昨夜今晨:小鹏宣布“霸占”充电桩将按每分钟1元收费 百度上线隧道车道级导航
...、“车道级指引,更安全”。王小川旗下百川智能推出大模型百川智能发布公司旗下第三款大模型产品Baichuan-53B,同时开启第一批内测。此前,百川智能已经发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Cha...……更多
中国石油获得发明专利授权:“地震储层参数预测方法及装置”
...:将目标地层的地震数据,输入预先建立的储层参数预测模型中,得到目标地层的多个地震储层参数;储层参数预测模型按照如下过程建立:获取目标地层的地震工区资料,形成训练数据集;基于人工神经网络模型搭建多任务学...……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
【新智元导读】北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式,相比传统模型在多项任务中表现出色,同时降低了参数量和计算量,增强了对周期性特征的建模能力,应用潜力广泛。周期性现象广泛存在,深...……更多
...讯(记者 魏蔚)9月25日,百川智能发布Baichuan2-53B 闭源大模型,较Baichuan1-53B的逻辑推理能力提升100%,数学能力提升31%,语言理解能力提升29%,文本创作提升18%,知识问答提升9%。同时,百川智能开放了Baichuan2-53B API接口,启动toB...……更多
浪潮信息推出as13000g7-n系列
...步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存...……更多
训练一次ChatGPT,“折寿”3000辆特斯拉
...聊天应用ChatGPT风靡全球后,立即在全球范围内掀起了大模型开发的热潮。但准备参战的玩家们很快便认清现实,这不过是一场由巨头主宰的游戏,其中的关键,就是能耗。知名计算机专家吴军的形容并不夸张——ChatGPT每训练一...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...et系列的原班人马推出了新一代架构:BitNet a4.8,为1 bit大模型启用了4位激活值,支持3 bit KV cache,效率再突破。量化到1 bit的LLM还能再突破?这次,他们对激活值下手了!近日,BitNet系列的原班人马推出了新一代架构:BitNet a4.8...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...量化」的基本概念和分支方法进行了全方位总结。大语言模型(LLM)通常过于庞大,无法在消费级硬件上运行。这些模型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小...……更多
实现AGI之前 全球AI大佬在这4个关键问题上吵起来了
...国的企业和开发者并不友好。首先,LLaMA的开源生态无法商用;其次,LLaMA的语料主要来自国外,由此带来的部分和中文语境不适配的问题会被继承在基于LLaMA训练的模型中。为此,智源研究院搭建了一套更适用于国内的开源生态...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
为满足大模型的“暴力”计算需求,国内GPU企业正加码算力基础设施建设。12月19日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍,这是国内首个以国产全功能GPU为底座的大规模算力集群...……更多
据报道,谷歌上周发布的最新大语言模型使用的训练数据,几乎是2022年的上一代模型的5倍。得益于此,该模型在编程、数学和创意写作方面的表现更为优秀。谷歌是在其I/O开发者大会上发布最新通用大语言模型PaLM2的。内部文...……更多
轻量级的模型亦有其存在的市场空间。2022年11月底,基于GPT-3.5的ChatGPT刚出来的时候,小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌给ChatGPT抛出一个问题:证明一下勾股定理。最终,ChatGPT给出了一个基于数学归...……更多
【科技早报】董明珠首次回应格力落榜世界 500 强;X平台将移除“拉黑”功能
...段性应用成果。(央视新闻)清华系团队开源百亿参数可商用多模态医药大模型BioMedGPT-10B8 月 20 日消息,大模型初创公司水木分子联合清华大学智能产业研究院(AIR)带来全球首个开源可商用多模态生物医药百亿参数大模型BioMe...……更多
中国石油发布700亿参数昆仑大模型建设成果
...月28日,以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办,标志着中国石油在人工智能领域又迈出坚实一步。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多
开源狂潮让巨头惨败,谷歌内部文件曝光
...的LLMs:在Pixel6上,以每秒5个token的速度,就能运行基础模型。可扩展的个人AI:只要一个晚上,就能在笔记本电脑上微调出一个个性化AI。负责任的发布:这一点倒是没有「解决」,说「避免」会更贴切。现在网上到处都是充满...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...AGI-AIGC-GPT 评测 DIKWP(全球)实验室发布了全球大语言模型(LLM)情商(EQ)与智商(IQ)偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商和情商水平。(全球大语言模型(LLM)情商...……更多
更多关于科技的资讯:
户外品牌以技术创新,实现专业场景大众化破圈|世研消费指数品牌榜Vol.63
本次监测周期内,安踏、乔丹和李宁以1.85、1.83、1.81的综合热度位列榜单综合热度前三。图源:世研大消费指数文化符号锚定品牌情感消费升级
2025-08-27 11:10:00
悠湖湾商业综合体项目基本完工
近日,江宁区上秦淮未来科技城悠湖湾商业综合体基本完工。项目总建面约17.33万平方米,含6层裙楼与14层塔楼,裙楼将打造一站式体验空间,涵盖运动、餐饮等业态,提供多主题消费体验。
2025-08-27 07:36:00
智能制造是制造强国建设的核心赛道,更是筑牢实体经济根基的关键支撑。近年来,泰安市市场监管局将标准化作为驱动制造业高质量发展的核心引擎
2025-08-26 10:07:00
近日,山东移动淄博分公司济东数据中心再传喜讯——在第三届“华彩杯”算力大赛中区决赛中,该中心凭借卓越的绿色节能表现荣获三等奖
2025-08-26 10:25:00
本报讯 (记者 王薛淄)记者从中国香料香精化妆品工业协会获悉,2025年中国香料香精化妆品行业年会暨精品博览会(以下简称“2025CAME”)将于9月25日至27日在江苏南京扬子江国际会议中心举行
2025-08-26 10:55:00
鲁迅故里景区投诉人社交账号已无法查看
8月25日,绍兴鲁迅纪念馆公众号发文,关于“鲁迅故里景墙画面误导青少年”一事回应。近日,有位孙姓女士在社交平台发帖称“鲁迅故里景墙使用鲁迅吸烟画面
2025-08-26 10:59:00
北京机器人为何更聪明自主?
北京机器人在赛跑、足球等比赛中从跑步、踢球、跳高、跳远到场景应用,从遥控到全自主,在8月14日至17日举行的2025首届世界人形机器人运动会上
2025-08-26 11:12:00
AIGC短片《你的样子》运用人工智能技术“复原”了杨靖宇、赵尚志、赵一曼、左权、彭雪枫、张自忠等十余位抗日英烈拍摄历史照片时的鲜活模样。(技术支持:南京超级头脑信息技术责任有限公
2025-08-26 11:17:00
天籁之音,穿越时光回响,缅怀那段不朽历史。逝去的英雄与故人,面容虽模糊于岁月,但精神永存。AI技术奇迹再现,让一张张珍贵的照片重焕光彩
2025-08-26 11:19:00
北京礼品展文创区成爆款集合地
本报记者 赵 曦 □ 唐 瑞在刚刚落幕的第52届中国北京国际礼品、赠品及家庭用品展览会上,文创与玩具展区格外热闹。琳琅满目的展品中
2025-08-26 11:26:00
眼下,新的入托季、入学季正在开启,与以往不同的是,今年秋季学期起,公办幼儿园学前一年在园儿童保育教育费将被免除。具体来说
2025-08-26 11:26:00
一张小小的碳标签,正在成为撬动轻工业绿色转型的关键支点,从源头到终端系统重塑着“中国制造”的低碳竞争力。8月6日,在本报刊登《轻工行业积极推进绿色低碳循环发展战略》一文中
2025-08-26 11:27:00
贵州磷化磷镁材料在全国镁质材料发展大会受关注
日前,中国菱镁行业协会镁质材料发展大会在山东济南举办。贵州磷化集团磷美公司携磷镁产品受邀参会,并凭借其在技术研发与产品创新上的表现
2025-08-26 11:31:00
网易云音乐声明:你的隐私我守护,没有“访客记录”功能
8月25日,网易云音乐微博发文称:你的隐私我守护,网易云没有“访客记录”。近期,我们关注到网上有用户询问“在网易云浏览他人主页
2025-08-26 11:33:00
在竞争白热化的重庆房地产市场,房产中介机构如何杀出重围?仅靠门店数量与人力堆砌的粗放式扩张时代已然过去。优居重庆以其独特的平台化赋能模式和精准的差异化服务策略
2025-08-26 12:09:00