• 我的订阅
  • 头条热搜
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...文阅读等功能里。现在这样的一个模型彻底开源,免费可商用,算是很有诚意了。这次腾讯Hunyuan-Large总共开源了三个版本:预训练模型、微调模型、FP8量化的微调模型。在开源社区掀起一阵热议,HuggingFace首席科学家Thomas Wolf墙...……更多
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
快科技1月23日消息,据中国电信,在集团公司统一组织下,中国电信研究院、天翼云、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...l in AGI与AIGC是昆仑万维的战略。4月17日,昆仑万维发布了中国第一个真正实现智能涌现的国产大语言模型——「天工3.5」,并启动邀请测试。5月19日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成...……更多
专家模型不要专家并行!微软开源MoE新路径
...学和学院入学统一考试)的数学问题进行案例研究,这是中国一年一度的全国本科入学考试。 该考试以其严格的安全协议而闻名,是评估AI模型回答数学问题的能力的理想测试平台。请注意,GRIN MoE的训练于太平洋标准时间6月3...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...期第一财经记者参加的一场行业论坛上,高通AI产品技术中国区负责人万卫星谈到,AI处理的重心正向边缘端转移,大模型可根据终端侧数据提供个性化服务,且不需依赖任何网络连接,数据留在终端,可解决隐私问题。或是考...……更多
...水平,赵海笑道:“很多人没考过GRE,其实GRE的数学题难度和中国小学数学题差不多。GPT-4的数学水平不会很高,很多小学奥数题可能就解不出来。”GPT-4为何是“数学不太好的文科生”?他解释说,和图像分析能力一样,它的数学解题能...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
...mma依旧保持免费使用,其模型权重也一并开源,并且允许商用。谷歌共发布了两种不同权重规模的模型,分别为Gemma 2B(20亿参数)和Gemma 7B(70亿参数)。每种规模都有预训练和指令微调版本,允许所有组织(无论规模大小)负...……更多
中国电信何忠江发布千亿参数大模型
11月10日消息,今天,中国电信2023数字科技生态大会暨2023数字科技生态展在广州正式启幕,电信多个高管轮流上阵发布了多项产品、平台及技术更新。其中,中国电信人工智能科技总经理何忠江正式发布了"星辰语义"千亿参数的...……更多
奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...起:杨亦诚 王顺 郑勤锴 陈家泽ChatGPT 爆火,引发中国互联网科技圈对多模态大模型的关注。在国内,大模型市场更是开始躁动起来了,文心一言、盘古、通义千问、日日新SenseNova......可以说,从算力到应用,人工智能领...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
文|周鑫雨编辑|邓咏仪2023年10月26日开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和...……更多
阿里巴巴将开源720亿参数大模型
...开发者都可以使用这种最先进的云计算技术。其表示目前中国80%的科技企业,还有一半的大模型公司都跑在阿里云上面。“我们希望成为AI时代一朵最开放的云,让大家开发AI、使用AI变得更加容易、很便宜。” ……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...开源都已成为一大趋势。海外,去年7月Llama2宣布免费可商用后,一举成为了全球开发者首选的开源大模型。不久后,谷歌也通过发布Gemma开始进入开源大模型的竞争,凭借70亿参数碾压 Llama2-13B(130亿参数);国内市场,阿里宣...……更多
高通孟樸:终端侧生成式AI无处不在 将变革广泛终端
11月5日,在2023中国国际进口博览会期间,第六届虹桥国际经济论坛——“智能科技与未来产业发展”分论坛在上海国家会展中心举行。此次论坛由工业和信息化部、商务部共同主办,聚焦以人工智能、信息技术为代表的战略性...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
DeepSeek 视觉中国 资料图DeepSeek成为了海内外各大云厂商的宠儿。1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,...……更多
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
...480P和720P两个版本。四个模型全都是Apache 2.0,也就是免费商用。而且官方也放出计划表,AI创作者们非常喜欢的ComfyUI,之后也会集成。视频生成模型会写字了 目前可以玩到Wan 2.1的途径有很多,最简单的方法是通过通义万相自己...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...术产品,加速商业化进程。目前,业内仍没有完全开源可商用的千亿大模型,我们希望‘源2.0’能够为国内外开发者、研究机构、科技企业提供坚实的底座和成长的土壤。”浪潮信息高级副总裁刘军说。浪潮信息长期致力于人工...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent……更多
Kimi K2 + SunwayLink,让智能倍增释放
...面(Moonshot AI)推出最新旗舰模型 Kimi K2,开源、免费可商用这是Kimi首次开源基础模型,其市场反响强烈。Kimi K2是一个万亿(1T)参数规模的混合专家(MoE)模型,激活参数为320亿。其核心能力发生了清晰的转向,在延续Kimi此前...……更多
致敬劳动者|王浩名:匠心筑梦,领航商用车品质未来
...。曾获“全国五一劳动奖章”“齐鲁大工匠”等称号。在中国商用车迈向高端的路上,王浩名用15年的坚守与创新,将青春熔铸进每一辆下线的商用车。他不仅是产品质量提升的“守护者”,更是整车装调技术的“集大成者”。精...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...,已经月余。《IT时报》记者多方采访获悉,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8...……更多
纽约大学教授 Nature 发文:为了科学界的未来
...和广义线性模型在政治科学中的应用。研究人员应该避免商用模型的诱惑,共同开发透明的大型语言模型,以确保可重复性。拥抱开源,拒绝垄断似乎每天都有一个全新的大型语言模型(LLM)推出,其创建者和学术界相关人士每次...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
本文转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...挖了出来。有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。(图/钛媒体)3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中...……更多
...绝数据联网传输风险。”他介绍,除了在个人家用、办公商用等领域可以赋能终端设备拥有超强推理能力,在智能工业领域,还可以赋能产线质检、车路云协同等场景通过本地算力来完成实时分析决策。“在这个过程中,生产数...……更多
上海:加速实施“模塑申城”
...的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。李璟介绍,根据企业官方技术报告中的评测结果,阶跃Step-Video-T2V的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;阶跃Step-Audio是业内首款...……更多
本文转自:中国新闻网中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...研究院成立于2018年,其推出的「智源悟道大模型」,是中国首个大模型,为中国人工智能技术发展奠定了深远的研究基础。在2024北京智源大会上,智源研究院公布了大模型全家桶。当前,智源研究院正在优刻得国产智算集群上...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
更多关于科技的资讯:
在制造业提质增效的浪潮中,那些藏在生产环节里的“细枝末节”,往往藏着撬动效益升级的关键密码。近日,太重包储分公司的散件箱优化项目传来捷报
2025-09-24 07:52:00
被3000亿资金哄抢的创新药企,上市首日暴涨110%
文|胡香赟编辑|海若镜港股迎来今年第11家上市的创新药公司。9月19日,劲方医药在港交所挂牌,首日涨幅接近110%、市值逼近150亿
2025-09-24 06:26:00
2025北京文化论坛“虚实无界:视听产业融合破圈”平行论坛举办
中国青年报客户端北京9月23日电(中青报·中青网记者 沈杰群)今天,2025北京文化论坛平行论坛——“虚实无界:视听产业融合破圈”在北京国际饭店会议中心举行
2025-09-24 00:03:00
中信银行南京分行成功举办“小天元”企业生态服务平台江苏区域发布会
9月22日下午,在百余家江苏企业代表的共同见证下,中信银行“小天元”企业生态服务平台江苏区域发布会暨“进万企 信服惠企”系列活动在南京成功举办
2025-09-23 23:15:00
聚焦京津冀协同发展|一个平台,推动黄骅模具迈向高端
北京市科学技术委员会牵头,京冀相关单位共建智能模具科技成果转化中试平台一个平台,推动黄骅模具迈向高端9月11日,智能模具科技成果转化中试平台工作人员正在操作四轴机床进行生产
2025-09-23 08:49:00
AI赋能千行百业一线故事(十二):数智化转型,让电厂越来越智慧
数智化转型,让电厂越来越智慧——AI赋能千行百业一线故事(十二)8月28日,石家庄良村热电有限公司生产技术部专业主管苏朝宏介绍智慧展厅
2025-09-23 08:53:00
“产业炬光灯”系列短视频首期聚焦中材航特
“产业炬光灯”系列短视频于厦门日报官方视频号、抖音号、快手号、B站账号、央视频账号等全媒体平台同步上线,首期节目走进中材航特
2025-09-23 08:58:00
厦门网讯(厦门日报记者 林雯)旧低效工业用地加速变身科创高地。近日,随着位于思明区前埔片区的2025P13、2025P14地块成功出让
2025-09-23 08:58:00
国网厦门供电公司持续推进“EASIER用电”品牌建设
国网厦门供电公司为厦门天马微电子有限公司创造更优质、更稳定的用电环境。(国网厦门供电公司 供图)“EASIER用电”品牌厦门网讯(厦门日报记者 刘艳 通讯员 林艳婷 高芳 郭芷祎)近年来
2025-09-23 08:58:00
山东移动泰安分公司数智融合加速 赋能企业蝶变升级
鲁网9月22日讯数字化浪潮正在席卷千行百业,山东移动泰安分公司(简称:泰安移动)以“技术赋能、生态协同、梯次服务”为核心
2025-09-23 10:01:00
企鹅网络(Q学友)与腾讯云达成战略合作,携手共创“AI+职业教培”新范式
9月16日-17日,2025腾讯全球数字生态大会在深圳举办。大会期间,深圳市企鹅网络科技有限公司(以下简称“企鹅网络”)与腾讯云正式签署战略合作协议
2025-09-23 10:39:00
本报记者 赵 曦 □ 花沁昕“白天的时间都用于工作和社交,只有夜晚的时间才真正属于自己,我舍不得睡,但真想睡的时候又睡不着了
2025-09-23 10:48:00
科学为基,爱心为桥:儿童营养品牌inne携手德甲冠军俱乐部启动全球公益计划
在全民健康意识提高与消费升级的双重驱动下,新一代父母对儿童营养的重视程度前所未有。消费需求愈发细分、专业,推动儿童营养品行业从“标准化供给”向“专业化服务”转变
2025-09-23 11:20:00
《金刚狼》《权游》供应商分拆机器人数据业务,腾讯、字节大牛加入 | 智能涌现独家
文|邱晓芬编辑|苏建勋2023年底,全球出货量最大的动作捕捉设备提供商"诺亦腾(Noitom)"联合创始人戴若犁,一度以为自己被骗了
2025-09-23 20:47:00
近8成职场人每周都会使用AI工具 通用对话型AI占比最高
在人工智能技术日臻成熟的2025年,AI已不再是科幻概念或实验室产物,而是深度融入职场生态的“数字同事”。从“工具”走向“伙伴”
2025-09-23 11:37:00