• 我的订阅
  • 头条热搜
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...文阅读等功能里。现在这样的一个模型彻底开源,免费可商用,算是很有诚意了。这次腾讯Hunyuan-Large总共开源了三个版本:预训练模型、微调模型、FP8量化的微调模型。在开源社区掀起一阵热议,HuggingFace首席科学家Thomas Wolf墙...……更多
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
快科技1月23日消息,据中国电信,在集团公司统一组织下,中国电信研究院、天翼云、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...l in AGI与AIGC是昆仑万维的战略。4月17日,昆仑万维发布了中国第一个真正实现智能涌现的国产大语言模型——「天工3.5」,并启动邀请测试。5月19日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成...……更多
专家模型不要专家并行!微软开源MoE新路径
...学和学院入学统一考试)的数学问题进行案例研究,这是中国一年一度的全国本科入学考试。 该考试以其严格的安全协议而闻名,是评估AI模型回答数学问题的能力的理想测试平台。请注意,GRIN MoE的训练于太平洋标准时间6月3...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...期第一财经记者参加的一场行业论坛上,高通AI产品技术中国区负责人万卫星谈到,AI处理的重心正向边缘端转移,大模型可根据终端侧数据提供个性化服务,且不需依赖任何网络连接,数据留在终端,可解决隐私问题。或是考...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
...mma依旧保持免费使用,其模型权重也一并开源,并且允许商用。谷歌共发布了两种不同权重规模的模型,分别为Gemma 2B(20亿参数)和Gemma 7B(70亿参数)。每种规模都有预训练和指令微调版本,允许所有组织(无论规模大小)负...……更多
中国电信何忠江发布千亿参数大模型
11月10日消息,今天,中国电信2023数字科技生态大会暨2023数字科技生态展在广州正式启幕,电信多个高管轮流上阵发布了多项产品、平台及技术更新。其中,中国电信人工智能科技总经理何忠江正式发布了"星辰语义"千亿参数的...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
文|周鑫雨编辑|邓咏仪2023年10月26日开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和...……更多
阿里巴巴将开源720亿参数大模型
...开发者都可以使用这种最先进的云计算技术。其表示目前中国80%的科技企业,还有一半的大模型公司都跑在阿里云上面。“我们希望成为AI时代一朵最开放的云,让大家开发AI、使用AI变得更加容易、很便宜。” ……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...开源都已成为一大趋势。海外,去年7月Llama2宣布免费可商用后,一举成为了全球开发者首选的开源大模型。不久后,谷歌也通过发布Gemma开始进入开源大模型的竞争,凭借70亿参数碾压 Llama2-13B(130亿参数);国内市场,阿里宣...……更多
高通孟樸:终端侧生成式AI无处不在 将变革广泛终端
11月5日,在2023中国国际进口博览会期间,第六届虹桥国际经济论坛——“智能科技与未来产业发展”分论坛在上海国家会展中心举行。此次论坛由工业和信息化部、商务部共同主办,聚焦以人工智能、信息技术为代表的战略性...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
DeepSeek 视觉中国 资料图DeepSeek成为了海内外各大云厂商的宠儿。1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,...……更多
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
...480P和720P两个版本。四个模型全都是Apache 2.0,也就是免费商用。而且官方也放出计划表,AI创作者们非常喜欢的ComfyUI,之后也会集成。视频生成模型会写字了 目前可以玩到Wan 2.1的途径有很多,最简单的方法是通过通义万相自己...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...术产品,加速商业化进程。目前,业内仍没有完全开源可商用的千亿大模型,我们希望‘源2.0’能够为国内外开发者、研究机构、科技企业提供坚实的底座和成长的土壤。”浪潮信息高级副总裁刘军说。浪潮信息长期致力于人工...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent……更多
Kimi K2 + SunwayLink,让智能倍增释放
...面(Moonshot AI)推出最新旗舰模型 Kimi K2,开源、免费可商用这是Kimi首次开源基础模型,其市场反响强烈。Kimi K2是一个万亿(1T)参数规模的混合专家(MoE)模型,激活参数为320亿。其核心能力发生了清晰的转向,在延续Kimi此前...……更多
致敬劳动者|王浩名:匠心筑梦,领航商用车品质未来
...。曾获“全国五一劳动奖章”“齐鲁大工匠”等称号。在中国商用车迈向高端的路上,王浩名用15年的坚守与创新,将青春熔铸进每一辆下线的商用车。他不仅是产品质量提升的“守护者”,更是整车装调技术的“集大成者”。精...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...,已经月余。《IT时报》记者多方采访获悉,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
本文转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...挖了出来。有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。(图/钛媒体)3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中...……更多
...绝数据联网传输风险。”他介绍,除了在个人家用、办公商用等领域可以赋能终端设备拥有超强推理能力,在智能工业领域,还可以赋能产线质检、车路云协同等场景通过本地算力来完成实时分析决策。“在这个过程中,生产数...……更多
上海:加速实施“模塑申城”
...的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。李璟介绍,根据企业官方技术报告中的评测结果,阶跃Step-Video-T2V的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;阶跃Step-Audio是业内首款...……更多
本文转自:中国新闻网中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...研究院成立于2018年,其推出的「智源悟道大模型」,是中国首个大模型,为中国人工智能技术发展奠定了深远的研究基础。在2024北京智源大会上,智源研究院公布了大模型全家桶。当前,智源研究院正在优刻得国产智算集群上...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
中国石油发布700亿参数昆仑大模型建设成果
...的700亿参数昆仑大模型建设成果发布会在京举办,标志着中国石油在人工智能领域又迈出坚实一步。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型,展示了43个专业应用和通用应用创新...……更多
银泰商业算法负责人对话中科大学生:AI大模型商用前景广阔
10月11日下午,位于合肥高新区的中国科学技术大学高新校区内,百余师生参与了一场别开生面的技术交流会,关于AI大模型、人脸识别等热门技术话题被频频提及。学生们时而凝神聆听,时而用笔记录,他们的目光都聚焦在台...……更多
...国际尖端人工智能技术迭代迅速。工信部最新数据显示,中国人工智能核心产业规模达到5000亿元人民币,企业数量超过4400家。人工智能的飞速发展正在给我们的生产生活带来巨变,以大模型为代表的人工智能发展正在全方位重...……更多
更多关于科技的资讯:
新闻纵深·冀货出海新探索|平乡自行车童车:从“贴牌代工”到“骑向全球”
平乡自行车童车出口销量占国际市场的百分之四十从“贴牌代工”到“骑向全球”阅读提示平乡县,被誉为“中国童车之都”。在这里
2025-12-08 08:26:00
杭州市康复医院近日组织开展第34个国际残疾人日宣传教育活动。“杭州市智能仿生假肢适配服务基地”在本次活动上揭牌成立。未来将为肢体残疾人提供智能仿生假肢适配相关服务
2025-12-08 09:24:00
米连科技率先跑通新赛道,成实时视频情感社交重要实践者与引导者
当众多社交平台仍在探索可持续的商业模式时,米连科技通过将“视频社交+实时互动”作为产品核心,不仅成功开辟了新的市场空间
2025-12-08 09:24:00
国际人才嘉年华2025(秋季)盛大启幕丨科创动能全景绽放,多元机遇职引未来!
《2025年世界人才排名》显示,香港已跃居全球第四、亚洲首位,彰显了港府近期在人才引进与培育方面取得显著成效。港府推行的多项人才计划累计收到申请逾52万份
2025-12-08 10:24:00
“苏新消费·暖冬购物季”正式启动 苏宁易购这波精彩 很给“利”
12月5日,2025“苏新消费·暖冬购物季”正式启幕,本次购物季将持续至2026年3月。重点围绕十三地市“苏品苏货”,结合“双12”
2025-12-08 10:28:00
工行河北省分行:金融“活水”浇开智造之花 为科技自立自强蓄能加力
从7人团队起步,到现已成长为年营收超40亿元的全国电气百强企业,科林电气在智能电网领域成果斐然。工行河北省分行以源源不断的金融活水和与时俱进的智慧服务精准滴灌
2025-12-08 10:36:00
近期,民生银行张家口分行全面开展“金融护航·幸福养老”主题宣传活动,以专业服务赋能养老规划,以暖心举措守护金融安全。多维布局
2025-12-08 10:41:00
王涵不是戴上面具之后才能放飞自我,而是那个看似放飞的自我其实是面具的产物。对于社会交往而言,认为需要加入或取消某种媒介才能体验交往的快乐
2025-12-08 10:54:00
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00
刘沛雨摘要:本文主要从转型升级时期中小企业的管理创新方面展开分析,在市场发展变化迅速的局面下,通过应用一些管理创新手段和方法
2025-12-08 05:10:00
正值中国首个跨境电商综试区——杭州综试区设立十周年,也恰逢亚马逊全球开店(以下简称“亚马逊”)业务在中国开展运营十周年的重要里程碑
2025-12-08 07:21:00
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00
近日,一项重要国家标准——《电磁兼容 电磁兼容标准起草导则》工作会议在云栖小镇召开。这份由上海机器人产业技术研究院牵头起草的文件
2025-12-07 08:53:00
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00