• 我的订阅
  • 头条热搜
谷歌发布gemma2大语言模型,共有两种大小
...亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示,Gemma2-27B模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多
能看风水 夸我有情趣 Kimi现在都这么野了吗
...何题,多少差了点意思。 但这次的 k1 就有说法了,既有推理能力又有视觉能力,意思就是可以直接拍照上传解题,还号称能在数理化上打平甚至超越 Open AI 的 o1 。那要是这么比的话,咱可就来劲了。正好, k1 新模型现在也不...……更多
华泰证券:DeepSeek或带来中美科技资产重估
...目前北美四大AI公司主要通过扩大GPU集群规模的方式探索下一代大模型,DeepSeek能否在下一代模型研发中生效有待观察,DeepSeek的出现不会改变美股AI公司的中长期叙事逻辑,回调到位后有反弹机会;3)但DeepSeek的推出显著缩小了...……更多
...相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面,Qwen-72B在GSM8K、MATH测评中也领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力也有质的飞跃。△72B模型做数学题 ……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院 供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...」。模型升级:Baichuan4-Turbo两张4090即可部署,Baichuan4-Air推理成本下降99%接下来,如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中?从名字中不难看出,它们都是Baichuan 4系列基础模型的升级。对于企业来说,在不同场景阶段……更多
新物种?联想Tech World 2024:AI的一切才刚刚开始
...我们期待与联想这样的行业领导企业一起创新,共同打造下一代AI PC,为用户带来智能的个性化体验。”联想倡导混合人工智能框架,是公有大模型和私有大模型的混合。大模型发展的下一步是基于大模型的智能体。联想集团高...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
ChatGPT一周年,机会在大厂还是小公司?
...到两个月,你们有没有看到特别激动人心的大模型,赋能下一代的产品生态?或者是产品应用?王小川:今年是元年,刚刚开始,在情感陪伴里面大家看到一些成绩。我们公司既做模型,也做应用,内部的医疗模型确实能够更好...……更多
...版本升级,当前版本为DeepSeek-R1-0528,模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...78%~90%。 检索增强(retrieval-augmented)的语言模型可以在推理时检索并集成外部知识源,从而缓解上述问题。然而,许多此类系统依赖于黑盒API或通用的LLM ,既没有针对文献综合的任务进行优化,也没有搭配适合科研的开放式...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...十亿左右。“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习(ICL,...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...,MoE在训练过程通过门控模型实现“因材施教”,进而在推理过程实现专家模型之间的“博采众长”。 图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化,在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多
OpenAI并未让DeepSeek惊出一身冷汗
...penAI开始后发补足自身在Agent能力上的探索。其中,o3作为推理模型,在编程、数学、科学、视觉感知等多个维度的基准测试中都刷新了纪录。比如在Codeforces、SWE-bench、MMMU基准测试中,视觉任务准确率高达87.5%,而MathVista达到75.4%...……更多
亚马逊云科技最强AI硬件猛兽背后,工程细节详细解读
...其首款自研AI芯片是2019年的Inferentia,能够切实降低小型推理工作负载的成本,比如亚马逊Alexa通过迁移到Inferentia节省了大量资金。2022年,亚马逊云科技推出了其首款自研AI训练芯片Trainium1,并实现可将在Trainium1上运行的工作负...……更多
...动终端在脱离了“云端”的情况下,依然具备本地大模型推理能力。在7月26日启幕的2025世界人工智能大会上,这一创新产品正式亮相,瞬间吸引了业内广泛关注,成为AI赋能千行百业的又一次跨越。当前,大模型行业正经历深刻...……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...C9X00AI是AI-GPU/AI-PC,Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道,NPU的发展近年来大概有三个方向:首先是DEEP AI,在很多嵌入式设备里面,要把AI跟其它的处理IP做比较紧耦合的绑定,可以...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...绍下Hyung Won Chung,从公布的o1背后人员名单来看,他属于推理研究的基础贡献者。资料显示,他是MIT博士(方向为可再生能源和能源系统),去年2月加入OpenAI担任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训...……更多
...赖算力资源的预训练阶段竞争终结了,下一阶段的重点在推理,并将出现一批新公司,DeepSeek的出现也是必然,用更低的算力资源就可以实现同等甚至更高的效能。虽然这几年大模型发展速度很快,但我们并没有投资大模型项目...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...型,MoE模型在相同成本下效果更优,在相同规模下训练/推理成本更低,而且容量大,可训练更多数据。当前MoE的挑战有训练稳定性差、专家负载不均衡等。 一些应对方案包括:1)Scaling Law探索,设计基于中小模型簇的MoE Scaling ...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,...……更多
...法不准确。同时,它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正...……更多
广汽宣布加入DeepSeek!覆盖昊铂、传祺、埃安三大品牌
...云端生成大模型接入DeepSeek模型,实现了原生自然的深度推理体验,并基于模型新增的强推理和反思能力,主动为客户提供更多个性化服务。这种融合使得汽车从简单的指令响应工具进化为能够预见需求的伙伴,重新定义了智能...……更多
腾讯:已囤很多GPU 足够训练未来几代模型
...实基础。从需求端来看,当前腾讯对GPU更大的需求集中在推理侧。随着用户推理需求的逐步增长,推理token(词元)的需求远超此前预期。此外,腾讯还计划深度整合AI与游戏业务,在游戏中以多种形式灵活部署AI。腾讯高管也坦...……更多
自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务
...24日报道,NVIDIA宣布推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务,与刚推出的Meta Llama 3.1系列开源模型一起,为全球企业的生成式AI提供强力支持。Llama 3.1大语言模型有8B、70B和405B三种参数规模。模型在超过16000个NVI……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
更多关于科技的资讯:
潮聚湾区 创玩未来——《广州潮玩产业招商研究报告》发布会暨行业主题研讨会在荔湾成功举办
为精准把握潮玩产业蓬勃发展的时代脉搏,助力广州建设具有全球影响力的潮玩产业高地,12月11日,由广州市投资发展委员会办公室主办
2025-12-13 16:43:00
12日晚,第十届中国设计智造大奖(DIA)颁奖盛典在中国美术学院良渚校区举行。第十届中国设计智造大奖征集自2024年12月12日启动
2025-12-13 07:36:00
全球首个甲骨文智能体“殷契行止” 上线 最懂甲骨文的AI来了
小程序“了不起的甲骨文”,展示甲骨文“其”的不同字形。(本组图/小程序截图)甲骨拓本甲骨文“门”字 甲骨文摹本甲骨文“马”字扫码看视频 厦门网讯 (厦门日报教育工作室首席专家 佘峥 通讯员 王志鹏)你只需往电脑上传一张甲骨图片
2025-12-12 08:28:00
厦门网讯(厦门日报记者 曾嫣艳 通讯员 曾焕滨)昨日,厦门临空经济片区场景创新平台推广暨供需对接与企业路演活动在翔安创新实验室举办
2025-12-12 08:28:00
从流程到质量:制片人为短剧工业化提供的“52集样本”
在短剧行业从 “流量争夺” 转向 “品质与流程双竞争” 的关键阶段,如何在有限周期内平衡效率、成本与成片质量,成为所有制作机构必须破解的难题
2025-12-12 08:29:00
剧想天开,造梦未来|一场关于“儿童剧人物造型”的想象力实验
儿童戏剧,是投射在少年儿童心灵舞台上的第一束光。人物造型,作为这束光中最具象、最绚烂的色彩,不仅定义角色的灵魂,更深刻影响着儿童认知世界的方式与审美情感的塑造
2025-12-12 08:29:00
聚焦“中文+职业”融合:星禾星穗在世界中文大会展示校企合作新范式
在近期举办的2025世界中文大会上,教育企业星禾星穗多维度参与,展现了其在“中文+专业/职业”领域的系统思考与实践成果
2025-12-12 08:30:00
会打拳的机器人带你触摸未来 走进国家“芯火”双创基地象屿园区孵化加速器
元启创新的人形机器人正在打拳。(元启创新 供图)厦门网讯 (厦门日报记者 吴晓菁) “灵犀,灵犀,表演一段佛山醒狮。”昨日
2025-12-12 08:59:00
“数字丝路”赋能文化出海,中国数字文化扬帆全球新蓝海
2025年12月9日下午,一场聚焦数字文化出海与青年文化交流的“共建数字丝绸之路”研讨会在上海举行。中国传媒大学经济与管理学院教授方英
2025-12-12 09:00:00
AI 眼镜似乎成了AI具身智能行业中最“靓”的仔,无论是苹果、谷歌这些大厂,还是国内的科技巨头,纷纷下场。本周二,谷歌在The Android Show活动上宣布
2025-12-12 09:10:00
近日,中国人民银行苏州市分行反洗钱科公布2025年苏州市反洗钱征文比赛评审结果,苏州人保财险撰写的《破局与重构:保险公司在反洗钱履职的实践困境与创新路径研究》一文凭借深刻的问题剖析
2025-12-12 10:46:00
为提升员工职场软实力,优化内部沟通效能,12月7日,常熟人保财险琴川学府组织开展了“赋能职场进阶,高情商沟通与协作”专题培训
2025-12-12 10:56:00
长白时评评论员 刘颂寒声称“下载App必得大额红包”,旁边又用小字解释“仅限新人或以实际情况为准”;宣称“全场5折”,又在大大的“5折”后面跟个极小的“起”字……在日常的消费中
2025-12-12 10:56:00
在当前行业竞争加剧与市场环境多变的背景下,虎丘支公司持续推动降本增效工作,这既是应对挑战的必要举措,也是实现长期稳健经营的重要保障
2025-12-12 10:58:00
劳利近日“水银体温计明年起禁产”的话题引发热议。根据国家药监局此前发布的通知,自2026年1月1日起全面禁止生产含汞体温计产品
2025-12-12 11:01:00