• 我的订阅
  • 头条热搜
...绩报告,财报指出:“腾讯混元已经发展成为领先的基础模型,在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构,已扩展为万亿参数规模。自亮相以来,腾讯混元大模型持续迭代升...……更多
我国发布首个亿级参数量地震波大模型:名为“谛听”
...,据成都科技局官方公众号介绍,日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。同时,“谛听”也是目...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
...、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了500公里长距互联分布式训练,而且训练性能达到单数据中心...……更多
天垓100率先完成百亿级参数大模型训练,天数智芯迎来新的里程碑
...院(以下简称“智源研究院”)70亿参数的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数大模型训练的能力。图 天数智芯产品线总监宋煜在北京市海淀...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。Hunyuan-Large,3890亿总参数,520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
GPT-4被破解 训练成本 模型架构的秘密都被挖出来了?
...字节跳动、百度等在短期内都将拥有与 GPT-4 一样强大的模型。不要误解我们的意思,OpenAI 拥有令人惊叹的工程技术,他们构建的东西令人难以置信,但他们得出的解决方案并不神奇。这是一个优雅的解决方案,具有许多复杂的...……更多
小米AI大模型MiLM-6B首次曝光:64亿参数量,此前称不单独做ChatGPT|钛快讯
...在小米公司CEO雷军演讲前夕,其研发的人工智能(AI)大模型产品悄然现身。钛媒体App获悉,8月11日,小米公司开发的大规模预训练语言模型 MiLM-6B/1.3B登陆代码托管平台GitHub,参数规模最高达64亿,而且现身在C-Eval、CMMLU基准评...……更多
微软推出14b参数“最先进”小型语言模型
...13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。官方...……更多
微软专利提出生物+硬件联合评估优化AR/VR眼动追踪系统
...置109来估计摄像头101的一个或多个硬件参数。这可以使用模型和其他预定值来估计。如前所述,可以联合进行摄像头101的一个或多个硬件参数的估计和生物参数的估计,从而优化眼动追踪。这种联合估计使得设备能够生成定义眼...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
国产首台GPU千亿参数大模型训推一体机发布,优刻得提供灵活算力部署方案
...称“沐曦”)、智谱华章共同发布国产首台GPU千亿参数大模型训推一体机。国产首台GPU千亿参数大模型训推一体机发布仪式优刻得与沐曦、智谱华章共同在宁夏的开放平台上面向第一批用户:航天医院、数字宁夏建设运营有限公...……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
...里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上...……更多
...:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域...……更多
腾讯字节“硬碰硬”
近期相继在AI大模型上发力的腾讯和字节,仍然对上一个风口元宇宙抱有期待。据媒体爆料,Meta正在与中国科技厂商洽谈,计划将其VR头显Quest推向中国市场,腾讯则有望成为Quest的国内独家经销商。截至发稿,腾讯对此消息尚...……更多
中国石油获得发明专利授权:“地震储层参数预测方法及装置”
...:将目标地层的地震数据,输入预先建立的储层参数预测模型中,得到目标地层的多个地震储层参数;储层参数预测模型按照如下过程建立:获取目标地层的地震工区资料,形成训练数据集;基于人工神经网络模型搭建多任务学...……更多
20亿参数!谷歌发布轻量级开源人工智能模型Gemma
...CNMO新闻】近日,谷歌发布了其首个重要的开源大型语言模型Gemma,这标志着自从OpenAI的ChatGPT引领了人工智能聊天机器人热潮以来,在2022年取得了重要突破。Gemma是由谷歌DeepMind和其它团队共同开发的,旨在为开发人员和研究者提...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
腾讯正式发布混元大模型,号称拥有超千亿的参数规模
...办的2023腾讯全球数字生态大会上,腾讯正式发布混元大模型,号称拥有超千亿的参数规模、超2万亿tokens的预训练语料。在发布会上,腾讯宣布混元大模型今日起对外开放,用户可通过腾讯云进行体验,支持直接调用API接口,或...……更多
...自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训练,具备...……更多
大模型这把大火,烧到了手机领域
配图来自Canva可画AI大模型从年初一直火到了年尾,但似乎离普通人还有些距离。不过,现在情况似乎有了一些变化,各大手机厂商们,正在争先恐后地把大模型装进手机里,让AI变得“触手可及”。在很多人看来,手机厂商入...……更多
5620亿参数!谷歌发布史上最大“通才”ai模型
...大学的一组人工智能研究人员推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅可以理解图像,还能理解、...……更多
没有这些,别妄谈做 ChatGPT 了
...在用行动来表明战斗力,比如前些天复旦大学推出的 MOSS 模型,一经开放试用,便冲上热搜。一时间眼花缭乱,让人生疑。有钱就能训出模型?以美团大佬带资入组为代表,很多创业者和投资人盯上了 ChatGPT,作为一个 NLPer,我...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世,全世界大部分的注意力似乎都停留在一家公司,OpenAI。后...……更多
红米首批搭载骁龙8sgen3,支持100亿参数大模型
...,CPU主频是3.0GHz,根据官方的数据,其可支持100亿参数大模型,以及AI增强的GPU特性,大预言模型包括Baichuan-7B、GeminiNano、Llama2、ChatGLM等,可以为手机端侧大模型带来更好的表现。 ……更多
中国10亿以上参数规模以上大模型已发布79个
“据不完全统计,中国10亿以上参数规模以上的大模型已经发布了79个,从地区来看北京和广东最多,自然语言处理是大模型研发最活跃的领域。”在中关村论坛上,中国科学技术信息研究所所长,科技部新一代人工智能发展研...……更多
更多关于科技的资讯:
江南时报讯 在金融科技迅猛发展和客户需求持续升级的背景下,南通农商银行积极推动转型升级,以网点转型为核心,通过创新管理模式
2025-12-02 21:24:00
江南时报讯 近日,南通农商银行远程视频银行密码重置功能正式上线,当日即为两名客户顺利完成业务办理。这标志着该行在“远程银行”金融服务领域迈出关键一步
2025-12-02 21:24:00
迈萨科:亚太区首个生产基地落户常州,这里有着巨大的增长潜力
11月5日,迈萨科机械科技(常州)有限公司正式开业,这标志着全球工业混合技术领域的隐形冠军——德国迈萨科公司在中国市场布局迈出关键一步
2025-12-02 21:50:00
国家级赛事!薛家5家企业获奖
近日,历时3天的第十四届中国创新创业大赛合成生物与生物制造专业赛在常州正式收官。来自全国各地的44家企业与团队成功晋级
2025-12-02 22:20:00
中创新航跻身全国“百链千企”二十强
近日,在第八届中国国际进口博览会期间,“2025知识产权保护与企业国际化发展会议暨‘百链千企’专利产业化工程推进会”在上海举行
2025-12-02 22:20:00
千问APP接入万相Wan2.5,视频能力全新升级
12月2日,千问APP接入万相系列最新模型Wan2.5,视频创作能力再度升级。动作精度和肢体协调性全面提升,并成为首个支持音视频同时输出的移动端AI助手
2025-12-02 22:37:00
胶东在线12月1日讯 11月17日,在烟台金融监管分局指导下,《烟台市保险业整治“内卷式”竞争自律公约》(以下简称《公约》)正式发布
2025-12-02 19:54:00
12月2日,太重集团发布消息,由太重集团自主设计制造的6000UST(美吨)正向双动铜挤压机热试车圆满成功。这台堪称国内最大
2025-12-02 19:29:00
丰台怡海中学无人驾驶实训教学项目落地
11月28日,AI驭见未来——怡海教育&加州伯克利大学机器人自动驾驶大赛ROAR实训基地揭牌仪式在北京市丰台区怡海中学(北校区)举行
2025-12-02 12:04:00
●杨炯上周末,在珠海的亚洲通航展上,奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展,但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌
2025-12-02 08:18:00
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00