• 我的订阅
  • 头条热搜
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...文阅读等功能里。现在这样的一个模型彻底开源,免费可商用,算是很有诚意了。这次腾讯Hunyuan-Large总共开源了三个版本:预训练模型、微调模型、FP8量化的微调模型。在开源社区掀起一阵热议,HuggingFace首席科学家Thomas Wolf墙...……更多
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
快科技1月23日消息,据中国电信,在集团公司统一组织下,中国电信研究院、天翼云、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...l in AGI与AIGC是昆仑万维的战略。4月17日,昆仑万维发布了中国第一个真正实现智能涌现的国产大语言模型——「天工3.5」,并启动邀请测试。5月19日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成...……更多
专家模型不要专家并行!微软开源MoE新路径
...学和学院入学统一考试)的数学问题进行案例研究,这是中国一年一度的全国本科入学考试。 该考试以其严格的安全协议而闻名,是评估AI模型回答数学问题的能力的理想测试平台。请注意,GRIN MoE的训练于太平洋标准时间6月3...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...期第一财经记者参加的一场行业论坛上,高通AI产品技术中国区负责人万卫星谈到,AI处理的重心正向边缘端转移,大模型可根据终端侧数据提供个性化服务,且不需依赖任何网络连接,数据留在终端,可解决隐私问题。或是考...……更多
...水平,赵海笑道:“很多人没考过GRE,其实GRE的数学题难度和中国小学数学题差不多。GPT-4的数学水平不会很高,很多小学奥数题可能就解不出来。”GPT-4为何是“数学不太好的文科生”?他解释说,和图像分析能力一样,它的数学解题能...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
...mma依旧保持免费使用,其模型权重也一并开源,并且允许商用。谷歌共发布了两种不同权重规模的模型,分别为Gemma 2B(20亿参数)和Gemma 7B(70亿参数)。每种规模都有预训练和指令微调版本,允许所有组织(无论规模大小)负...……更多
中国电信何忠江发布千亿参数大模型
11月10日消息,今天,中国电信2023数字科技生态大会暨2023数字科技生态展在广州正式启幕,电信多个高管轮流上阵发布了多项产品、平台及技术更新。其中,中国电信人工智能科技总经理何忠江正式发布了"星辰语义"千亿参数的...……更多
奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...起:杨亦诚 王顺 郑勤锴 陈家泽ChatGPT 爆火,引发中国互联网科技圈对多模态大模型的关注。在国内,大模型市场更是开始躁动起来了,文心一言、盘古、通义千问、日日新SenseNova......可以说,从算力到应用,人工智能领...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
文|周鑫雨编辑|邓咏仪2023年10月26日开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和...……更多
阿里巴巴将开源720亿参数大模型
...开发者都可以使用这种最先进的云计算技术。其表示目前中国80%的科技企业,还有一半的大模型公司都跑在阿里云上面。“我们希望成为AI时代一朵最开放的云,让大家开发AI、使用AI变得更加容易、很便宜。” ……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...开源都已成为一大趋势。海外,去年7月Llama2宣布免费可商用后,一举成为了全球开发者首选的开源大模型。不久后,谷歌也通过发布Gemma开始进入开源大模型的竞争,凭借70亿参数碾压 Llama2-13B(130亿参数);国内市场,阿里宣...……更多
高通孟樸:终端侧生成式AI无处不在 将变革广泛终端
11月5日,在2023中国国际进口博览会期间,第六届虹桥国际经济论坛——“智能科技与未来产业发展”分论坛在上海国家会展中心举行。此次论坛由工业和信息化部、商务部共同主办,聚焦以人工智能、信息技术为代表的战略性...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
DeepSeek 视觉中国 资料图DeepSeek成为了海内外各大云厂商的宠儿。1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,...……更多
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
...480P和720P两个版本。四个模型全都是Apache 2.0,也就是免费商用。而且官方也放出计划表,AI创作者们非常喜欢的ComfyUI,之后也会集成。视频生成模型会写字了 目前可以玩到Wan 2.1的途径有很多,最简单的方法是通过通义万相自己...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...术产品,加速商业化进程。目前,业内仍没有完全开源可商用的千亿大模型,我们希望‘源2.0’能够为国内外开发者、研究机构、科技企业提供坚实的底座和成长的土壤。”浪潮信息高级副总裁刘军说。浪潮信息长期致力于人工...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent……更多
Kimi K2 + SunwayLink,让智能倍增释放
...面(Moonshot AI)推出最新旗舰模型 Kimi K2,开源、免费可商用这是Kimi首次开源基础模型,其市场反响强烈。Kimi K2是一个万亿(1T)参数规模的混合专家(MoE)模型,激活参数为320亿。其核心能力发生了清晰的转向,在延续Kimi此前...……更多
致敬劳动者|王浩名:匠心筑梦,领航商用车品质未来
...。曾获“全国五一劳动奖章”“齐鲁大工匠”等称号。在中国商用车迈向高端的路上,王浩名用15年的坚守与创新,将青春熔铸进每一辆下线的商用车。他不仅是产品质量提升的“守护者”,更是整车装调技术的“集大成者”。精...……更多
大模型厂商急寻PlanB:英伟达改良版芯片已调试 华为等国产算力供应不足
...,已经月余。《IT时报》记者多方采访获悉,英伟达面向中国市场的改良版——HGX H20已与国内头部服务器厂商在进行适配测试,由于具体的性能差异和优化程度挂钩,目前还很难对其与高配版H800做性能对比,但是,预估HGX H20的8...……更多
纽约大学教授 Nature 发文:为了科学界的未来
...和广义线性模型在政治科学中的应用。研究人员应该避免商用模型的诱惑,共同开发透明的大型语言模型,以确保可重复性。拥抱开源,拒绝垄断似乎每天都有一个全新的大型语言模型(LLM)推出,其创建者和学术界相关人士每次...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
本文转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...挖了出来。有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。(图/钛媒体)3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中...……更多
上海:加速实施“模塑申城”
...的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。李璟介绍,根据企业官方技术报告中的评测结果,阶跃Step-Video-T2V的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;阶跃Step-Audio是业内首款...……更多
本文转自:中国新闻网中新网北京6月3日电 (记者 夏宾)近年来,为了追求大模型的智慧能力,各国公司不停加码投入,4月,Meta宣布追加10亿美元投资,用于其AI芯片研发和AI数据中心建设;亚马逊为了建设新数据中心投入110亿美...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...研究院成立于2018年,其推出的「智源悟道大模型」,是中国首个大模型,为中国人工智能技术发展奠定了深远的研究基础。在2024北京智源大会上,智源研究院公布了大模型全家桶。当前,智源研究院正在优刻得国产智算集群上...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
中国石油发布700亿参数昆仑大模型建设成果
...的700亿参数昆仑大模型建设成果发布会在京举办,标志着中国石油在人工智能领域又迈出坚实一步。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型,展示了43个专业应用和通用应用创新...……更多
更多关于科技的资讯:
越卖越贵,中产都开始“抢冰块”了?
作者:陈澄在经历过雪糕刺客、防晒衣刺客后,许多人发现,今年夏季的新刺客,似乎轮到了冰块。近日,农夫山泉在山姆上架的一款食用冰
2025-07-21 12:15:00
既要平台流量,更要自主话语权,外卖大战下半场的突围之道
餐饮行业的空气里,弥漫着2025年特有的焦灼。当消费者沉浸在外卖平台补贴带来的低价狂欢时,平台与商家间的成本转嫁矛盾正在凸显
2025-07-21 12:49:00
植物医生获“全球领先的单品牌护肤品专卖店”认证
中国化妆品市场在20世纪70-80年代开始萌芽,随着行业环境的不断发展与更迭,国货龙头有望逐步提升份额并开启多品牌并购整合战略
2025-07-21 12:49:00
X-Muse AI设计系统在校服圈掀起热潮
自X-Muse AI设计系统推出后,便在校服圈掀起热潮,众多企业竞相体验,并直接将其投入到实际招投标业务中。系统精准洞察校长的需求
2025-07-21 12:49:00
执中致和,智翼未来:湖北中翼以“平衡之道”破解酒店发展困境
执中致和,智翼未来:湖北中翼以“平衡之道”破解酒店发展困境2024年中国酒店总量突破37万家,行业连锁化率达55%,但RevPAR(每间可售房收入)同比下滑1
2025-07-21 13:10:00
学大教育参编《低空物流无人机末端配送要求》填补行业规范化空白
近日,中国标准化协会发布了《低空物流无人机末端配送要求》及《低空物流无人机自主导航与感知避障要求》。这两份文件的出台,为破解无人机物流规模化商用瓶颈提供了关键支撑
2025-07-21 13:10:00
2025上半年网络零售市场五大关键词:带电品类高增、代际需求细分、M型消费、AI驱动新质供给、新业态点燃新消费场景
2025年上半年,网络零售市场在多重积极因素交织作用下,展现出蓬勃活力与强劲韧性。提振消费政策成效显现,不同消费群体需求迸发
2025-07-21 13:16:00
东北零售巨头比优特和RELEX达成合作,提升供应链效率
东北零售巨头比优特与全球知名的供应链和零售计划解决方案提供商RELEX Solutions正式达成合作。RELEX将为比优特提供全链路供应链计划系统
2025-07-21 13:41:00
飞渡科技峥嵘大模型:引领空间智能新时代,开启数字孪生未来新篇章
在数字化转型浪潮席卷全球的今天,数字孪生技术正逐步成为推动智慧城市、智能制造、应急管理和水利工程等领域发展的核心动力。作为数字孪生领域的领军者
2025-07-21 14:11:00
青春执笔绘产业新篇:合工大学子助力瑶海服装智造升级
7月10日至13日,合肥工业大学社团管理服务中心暑期社会实践团队赴瑶海区开展“中国(合肥)服装原创设计基地产业升级探索和研究”主题调研
2025-07-21 14:44:00
齐鲁晚报·齐鲁壹点 主余凤在国家大力推进教育数字化转型、人工智能与教育深度融合的战略背景下,2025年,临沂教育版图增添了新锐力量——临沂耀中高级中学正式成立并启动首届招生
2025-07-21 15:01:00
金蓓欣在近期完成并公布的III期临床研究中,展现了其在治疗痛风性关节炎方面的卓越临床效果,尤其在快速缓解疼痛和长期预防复发这两大核心治疗目标上
2025-07-21 15:15:00
一城一队一能量 江苏移动助力“苏大强”
7月19日,南通足球训练中心如皋基地外的江苏移动服务点前,不少球迷亮出手机上的“中国移动 南通莱斯”标识,争相分享角标变化带给他们的惊喜
2025-07-21 15:17:00
稳健医疗、全棉时代在链博会释放绿色动能 绿色实践引领产业链共赢
7月18日下午,第三届中国国际供应链促进博览会(以下简称“链博会”)健康生活主题活动现场气氛热烈。作为健康生活链链主企业
2025-07-21 15:19:00
中新经纬7月21日电 据“市说新语”微信号21日消息,近日,市场监管总局(国家标准委)修订发布《家用和类似用途电器的安全使用年限和再生利用通则》(GB/T 21097—2025)国家标准
2025-07-21 15:32:00