• 我的订阅
  • 头条热搜
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...类型的信息:- 仅输入和输出文本,也就是少样本学习- 推理追踪:添加中间推理步骤,可参阅思维链(COT)提示- 计划和反思追踪:添加信息,教LLM计划和反思其解决问题的策略,可参阅ReACT 选择正确的适配方法要决定上述哪...……更多
OpenAI「草莓」提前曝光?ChatGPT版搜索引擎惊现神秘模型
【新智元导读】围绕OpenAI草莓项目的炒作,又兴起一波。一大早,Perplexity AI的首席执行官暗示,AI搜索引擎用上了。网友们纷纷在线测试,为自家AI成功宣传了一波。过去的一周,OpenAI「草莓」项目被炒的热火朝天,把所有人情...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
...万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来,是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型,也是首个支持用单台409...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...市场瞬息万变,需要实时数据处理和决策支持,大模型的推理涉及到大量的矩阵乘法计算,对硬件的矩阵乘法计算能力提出较高要求,计算复杂性可能导致响应时间延迟,不利于实时应用。加之大模型训练和推理过程需要大量的...……更多
奥尔特曼X上发“草莓” 网友疯狂猜测:这难道是GPT新模型
...尔特曼(Sam Altman)在社交媒体X上发布了一张花园里自种草莓的照片后,引发了众多网友的热议,是否新的GPT模型即将上线?周三(8月7日),奥尔特曼在X上发文称,“我喜爱花园里的夏日”,并附了两盆草莓结果实的照片。草...……更多
ChatGPT已经慢了,这是国内AI搜索新高度,免费可用
...了强化。首先面对复杂问题的解决全面升级了多层次分析推理能力,再难的问题都努力为你解答。其次细分了更明确的目标群体,升级了金融投资和科研学术专业 AI 搜索,将这些领域的解答精准度提升到了前所未有的水平。最...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...。Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是,前不久上市的小...……更多
专访面壁智能:大模型仍处于技术发展期,只做应用放弃模型迭代很危险
...他还提到端侧的另一个优势:未来会有很多场景对终端的推理可靠性有很高的要求。这也是端侧非常好的落地方向。但他强调,端侧并不是“所有”,只是其中一块拼图,「端」和「云」协同在一起,才能够完整地把用户的所有...……更多
360副总裁梁志辉:搜索和浏览器,是AI应用的明星场景|新质生产力·AI Partner大会
...,普通搜索回答这个问题很困难,有了大模型以后,可以推理出来如果明天去广州,我要先看广州的天气,这个时候就可以直接调出来。 我们发现大模型是博古通今的智慧能力,过去搜索引擎不可能实现的,但有了大模型以后...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...拥有一个AI Agent。“如果说2024年是大模型落地应用之年,推理就会越来越重要。此前在训练芯片市场上,英伟达一骑绝尘,占有绝对的市场占有率,那么今天,推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保障技术的持续领先,开普云将不断完善...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多
百度李彦宏:不一定非要学AI专业 任何行业都能与AI结合
...闭源模型可以根据用户需求提供多种变体,以平衡效果、推理速度和成本。即使是从最大最强大的模型中裁剪出来的较小规模闭源模型,其效果也仍然优于同样规模的开源模型。【本文结束】如需转载请务必注明出处:快科技责...……更多
度小满CEO朱光:必须密切关注大模型在金融领域的发展
...供更多资料,例如银行流水记录。最近,我们尝试使用了推理大模型来处理这些上传的银行交易记录。该模型能够迅速发现并评估客户的风险状况。例如,模型可以识别出客户在过去几个月内疑似向高风险账户转账,表明其消费...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...The」。完整的回复,花了整整20个小时熟悉模型的训练和推理的朋友都知道,这些事情一点都不奇怪。集群搭建(GPU配置、网络设计、轨道优化等)、集群管理(实时监控、故障排除等)……个个都是「拦路虎」。对于缺乏相关...……更多
OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品
...,当下,OpenAI显然处于技术栈中的某个位置,OpenAI将会走多远?如果花费大量时间来调整RAG系统,是不是一种浪费时间的行为——因为OpenAI终将在应用程序中涵盖这一部分?A:我们通常会回答说,OpenAI将尽最大努力,并且坚信...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多
北京大学护理学院师生走进医渡科技
...平台的使用方法,这个平台为用户提供了从大模型训练到推理、评测和应用的完整工具链,使得非技术背景的用户也能轻松进行模型训练和创建智能应用。医渡科技与北京大学的校企合作历史悠久,双方在医疗大数据和人工智能...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
更多关于科技的资讯:
今日起 华为2025届校招陆续放榜
据华为招聘官方介绍,11月30日起,华为2025届应届生招聘录用意向书陆续发放。华为称,将通过邮件发送录用意向书,参与的同学敬请留意
2024-11-30 13:34:00
一男子恶意“找回”游戏账号被抓:行政拘留8天
快科技11月30日消息,近日,一男子卖了游戏账号又恶意用身份证“找回”,结果被抓了。据乐山警方介绍,近期峨眉山市公安局名山派出所接到范某某报警称
2024-11-30 14:04:00
博主建议国产新能源暂时不要碰跑车:不是老百姓消费的东西
快科技11月30日消息,国产新能源蓬勃发展,从几万到上百万都有产品布局,甚至还涌现了如仰望U9、昊铂SSR等百万级超跑
2024-11-30 14:04:00
鱼台县开展智慧化工厂生态渔业养殖,改变传统的依靠人力和经验的渔业管理模式,将工程技术、机械设备、监控仪表、管理软件和无线传感网络等现代技术手段用于渔业生产
2024-11-30 14:17:00
女孩边充电边玩手机突然被电瘫 手脚都肿了
日前,浙江一名女孩在客厅充电的同时玩手机,突然遭遇电击,瞬间瘫倒在沙发上,痛苦地尖叫起来。幸亏孩子的爷爷及时在场,迅速拔掉了电源线
2024-11-30 14:34:00
海洋主题VR沉浸展《深海奇遇》即将开业
本文转自:人民日报中央厨房-大有文化工作室随着当今技术的进步和文化内容创意的提升,VR大空间已经成为中国数字文化和文旅产业的重要组成部分
2024-11-30 16:01:00
本文转自:人民网-湖北频道11月29日,第二届武汉技术经理人大赛复赛火热开赛。21名选手从217名初赛选手中突出重围,在一场形式新颖的复赛中
2024-11-30 16:38:00
50岁林志玲晒新照引围观 与儿子庆生画面有爱:网友感慨少女感满满
11月30日消息,近日,知名影星林志玲在微博晒出了自己与儿子的合照,并发文庆祝自己的50岁生日,照片里的林志玲身着白色服装
2024-11-30 08:04:00
REDMI K80维修备件价格出炉:2K屏610元、电池119元
快科技11月30日消息,REDMI K80系列已经上市,首销一天时间就卖出了66万台,提前预定同档最强。尤其这次全系标配了顶级护眼2K屏
2024-11-30 08:04:00
印度指控大众汽车逃税14亿美元
快科技11月30日消息,海外媒体报道,印度海关文件显示,印度已向大众汽车公司发出通知,指控其“故意”少缴奥迪、大众和斯柯达汽车零部件的进口税
2024-11-30 08:34:00
俞敏洪称新东方教室100%是格力空调 用了20年:董明珠曾称不买格力是傻瓜
快科技11月30日消息,新东方创始人、东方甄选CEO俞敏洪公开表示,新东方教室100%是格力空调。俞敏洪表示,新东方的教室100%是格力空调
2024-11-30 09:04:00
形状像根葱 天津上空出现神秘绿光疑是UFO:官方揭秘
快科技11月30日消息,近日,网传天津出现不明飞行物(UFO),散发绿色的光芒,瞅着像“天上一根葱”。那么它的真实身份是什么
2024-11-30 09:04:00
90天免费试用!荣事达加热按摩足浴盆34元起
天冷一泡去疲劳,荣事达加热按摩足浴盆报价 138 元起,限时限量 99 元券,实付 39 元起包邮。购买链接:天猫(券后39元)经典款(旋钮标准款)此价
2024-11-30 10:04:00
深圳彩民80元中双色球2.25亿巨奖尚未兑奖上热搜:网友直呼走上人生巅峰
11月30日消息,深圳一彩民80元中双色球2.25亿巨奖上了热搜,不少网友看后纷纷感慨,这是直接到达了人生巅峰。“太激动了
2024-11-30 10:04:00
重型运载火箭制经费不足:俄罗斯推迟载人登月计划
快科技11月30日消息,在青年科学家大会上,俄罗斯国家航天集团Roscosmos顾问奥列格·戈尔什科夫宣布,由于研发俄罗斯超重型火箭的资金有限
2024-11-30 10:04:00