• 我的订阅
  • 头条热搜
英伟达h100gpu再创多项新纪录
...推出了新的测试项目,专门针对微调(Fine-tuning)大语言模型和图神经网络(GNN),而英伟达H100创下了多项纪录。Fine-tuning是指在预训练模型的基础上,通过在特定任务上进行额外的训练来调整模型的参数,以使其更好地适应该...……更多
图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?
自从 Transformer 模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手,不仅要挑战 Transformer 的地位,还致敬了经典论文的名字。再看这篇论文的作者列表,图灵奖得主、深度学习三巨头之一的 Yoshu...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...团副总裁、政企业务总裁李强表示,腾讯不仅通过自研大模型服务千行百业,也拥有坚实的AI基础设施服务,为中国大模型产业繁荣发展提供技术支撑。去年9月,腾讯全链路自研的腾讯混元大模型正式亮相。根据沙利文的权威报...……更多
stabilityai推出小语言ai模型
...lityAI日前发布新闻稿,公布了一款名为StableLM21.6B的AI“小模型”,这是该公司今年推出的第二款模型,号称是“自家迄今以来最为强大的小语言AI模型”。从新闻稿中得知,这款AI模型支持英语、西班牙语、德语、意大利语、法...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
360智脑成全国首个原生安全的大模型产品之一
...科技股份有限公司今天宣布,12月22日国内首个官方“大模型标准符合性测试”结果公布,360智脑成为首批通过的大模型产品之一。据介绍,360智脑是全国首个原生安全的大模型,官方声称其拥有自研千亿参数规模,核心能力位...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机APP开发者,不会去自创iOS、Android 以外的全新基础架构)。01.AI.……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...。供求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,...……更多
...,社交媒体平台X的AI团队发布公告,正式推出Grok大语言模型。(来源:xAI)Grok一词,是英国作家道格拉斯·亚当斯在知名科幻小说《异乡异客》造出来的概念。《牛津英语词典》对这个词的解释包括“直观地或通过同理心理解...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...显存具备更大的容量和更高带宽,可以支持超大参数的大模型训练与推理。官方给出的参数显示,H200相较上一代产品在Llama2和ChatGPT的训练速度分别能提升40%和60%。 可以看出,从MI300X到H200,再到Maia100,大厂对训练参数量、训练...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
自主研制!我国发布“全球首个”
...技术大会在山东济南开幕:全球首个百亿级遥感解译基础模型“空天·灵眸”3.0版正式发布;“北斗精准导航与高分遥感综合服务平台”正式发布。全球首个百亿级遥感解译基础模型发布中国科学院空天信息创新研究院科研团队...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...竞争关系。近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...本文转自:光明网10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
【新智元导读】大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...破?2024年2月16日凌晨,OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限,而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是,Sora较好地表现出了...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
...预见它的到来并来得及向全世界发出警报?随着大型语言模型,如ChatGPT的兴起,这个问题最近受到了很多关注。这些模型随着规模的增长已经获得了大量新功能。一些研究结果指向了“涌现”现象,即人工智能模型以一种骤然...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...又又动荡了,另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还...……更多
全新小布助手开启新一轮公测!OPPO官宣与联发科技共建大模型端侧化部署方案
10月11日,OPPO宣布与联发科技合作共建轻量化大模型端侧部署方案,通过采用4位量化技术,实现精度不掉点效果下端侧化性能更优,共同推动 AndesGPT 大语言模型和多模态大模型在端侧逐步落地。 AndesGPT 作为OPPO自主训练的生成...……更多
小扎新开源的Llama3.1,要带着套壳大模型追平GPT-4o?
...,开源 AI 界扛把子 Meta AI ,昨晚更新他们最新最强的大模型, Llama3.1 。 这玩意跟上次 Llama3 一样也是三个版本,除了同参数量的 80 亿和 700 亿,这次最亮眼的是他们的超大杯,在老黄数万显卡的供应下,小扎的新模型用了足足...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型,又上新了!就...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
【科技早报】联想、英特尔、爱奇艺签署谅解备忘录;国内低轨卫星通信测试成功
...AI PC,并表示AI PC将是能够创建本地知识库,运行个人大模型,支持人工智能计算,运用自然交互的更强大、更具创造能力的智能生产力工具。(证券时报) 网易在成都成立两家新公司天眼查App显示,10月26日,成都协奏影画科...……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
更多关于科技的资讯:
厦门网讯 (厦门日报记者 林露虹)来自厦门的光通信电芯片“单项冠军”登陆科创板。昨日,厦门优迅芯片股份有限公司在上交所科创板上市
2025-12-20 08:51:00
摘要:随着企业业务复杂度的提升与项目制运营的普及,多项目并行管理成为企业提升效率与竞争力的重要模式。然而,项目间的资源冲突
2025-12-20 05:18:00
摘要:在健康中国战略引领下,推进特殊人群运动康复指导课程教学改革已成为新时代体育教育与健康服务体系建设的重要任务。本文探讨如何以数智技术深度赋能传统教学模式
2025-12-20 05:18:00
蔡云霞摘要:企业人力资源管理创新发展是激活人力价值、适配组织转型的核心举措。本文聚焦传统管理中的理念滞后、流程固化等痛点
2025-12-20 05:18:00
12月18日,太原北方重工集团生产车间内机器轰鸣,电光闪烁。国内首台φ820mm特大型无缝钢管矫直机已完成安装,正式交付用户并进入试车阶段
2025-12-20 06:54:00
一家科技研发企业 为什么要做城市安全科普宣传?
今年秋季开学季,杭州叙简科技股份有限公司董事长金国庆在瓶窑中学主讲“开学第一课”,当他为近600名学生讲完“AI赋能城市安全”的讲座后
2025-12-20 07:22:00
昨日,由陕西省商务厅指导、西安市商务局主办的“美美共融”2025西安城市消费品牌合作周在西安浐灞凯悦酒店举行。中国连锁经营协会
2025-12-20 07:49:00
定了!明年4月28日,杭州恒隆广场商场亮相
12月18日,恒隆集团及恒隆地产对外发布消息,集团现任行政总裁兼执行董事卢韦柏,将于2026年8月31日前荣休。同时,在这份对外声明里
2025-12-20 07:52:00
摘要:人工智能技术正广泛应用于企业财务管理的各个方面,目前对于该领域的探讨多集中于提升效率、降低成本与优化决策,而对技术渗透所产生的深层风险并未引起企业重视
2025-12-20 05:18:00
一缕发丝织就“头上帝国”丨链接世界的河南力量
编者按:从中原大地到全球市场,一批来自河南的新服务新供给品牌企业正加速“出海”,以优质产品为全球消费者提供更多选择。12月12日起
2025-12-19 14:36:00
在国家持续推进税收现代化、优化营商环境的大背景下,企业合规经营与诚信纳税已成为衡量其可持续发展能力的重要标尺。新疆瑞源乳业有限公司作为巴州地区乳制品行业的领军企业
2025-12-19 14:47:00
浙江新昌:一家县属国企的低空经济腾飞记
在2025年公路交通行业数据要素应用创新大赛中,“基于异构低空飞行器协同的智慧巡检与低空运营解决方案”项目,荣获全国三等奖
2025-12-19 14:47:00
在数字化转型与精益管理深度融合的当下,电子商城作为企业物资采购、资源配置的核心载体,其运营效率与服务质量直接影响企业整体运营成本与发展活力
2025-12-19 14:47:00
浙江飞流科技创新模式成就“飞”速度
12月1日,河南省辉县市,河南共城智通低空经济有限公司正式开业,今年8月,该公司以“品牌加盟”形式获得浙江飞流科技有限公司(以下简称“飞流科技”)在河南省新乡市的品牌授权
2025-12-19 14:47:00
全省唯一入选,就在常州高新区新桥街道!
近日,工信部发布《再制造机电产品典型应用案例》公示名单,常州市新北区新桥街道企业常州越新传动系统有限公司(以下简称“越新传动”)的“再制造风电增速齿轮箱及其应用——以华奥新能源
2025-12-19 14:48:00