• 我的订阅
  • 头条热搜
3天把Llama训成Mamba,性能不降,推理更快!
...Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管了,之所以有此场景...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...元导读】史上最快Transformer芯片诞生了!用Sohu跑Llama 70B,推理性能已超B200十倍,超H100二十倍!刚刚,几位00后小哥从哈佛辍学后成立的公司Etached,宣布再融资1.2亿美元。有史以来最快的Transformer芯片,刚刚诞生了?去年21岁哈佛...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...类型的信息:- 仅输入和输出文本,也就是少样本学习- 推理追踪:添加中间推理步骤,可参阅思维链(COT)提示- 计划和反思追踪:添加信息,教LLM计划和反思其解决问题的策略,可参阅ReACT 选择正确的适配方法要决定上述哪...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... 和 ChartQA,它们不仅需要理解,还需要对图表进行强大的推理能力。对于这两个基准,PaLI-3 稍微落后于 PaLI-X。另外,研究人员还扩展了 PaLI-3 的功能,使其能够通过语言类似的输出来预测分割遮罩。实验结果表明,对于这种类...……更多
Meta连甩AI加速大招 首推AI推理芯片 AI超算专供大模型训练
...Meta当下正将这些基础设施进一步升级进化。01.Meta首代AI推理加速器7nm制程、102.4TOPS算力MTIA(Meta Training and Inference Accelerator),是Meta第一个针对推理工作负载的内部定制加速器芯片系列。AI工作负载在Meta的业务中中无……更多
CPU,正在被AI时代抛弃?
...以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大模型对...……更多
打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制
...被展示过了,但我喜欢你添加的新细节,特别是强调了“推理”类任务比其他任务受影响更大!还有不少学者、工程师也表示强烈推荐。敢打赌,其中一些见解最终将会用于改进Transformer。 其中的实验再次证实了:复制层对创...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...围内吗?能在智能手机或传感器这些边缘设备上进行本地推理吗?要回答这些问题,我们需要重新思考AI模型的工作和训练方式,尤其是要转换视角,首先考虑底层硬件的物理约束。或许,物理神经网络PNN(physical neural network)...……更多
阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
...云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。随着A...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...代表Omni,也就是“全能”的意思。据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。OpenAI CEO奥尔特曼(Sam Altman)在博客中表...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
... 2此次提供的90亿(9B)和270亿(27B)参数的两个版本,其推理性能和效率均优于第一代,并具有显著的安全性改进。事实上,270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争,并且提供了此前只有专有模型才能实...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,GPT-4在多个方...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...,因此它们一直被诟病生成的回答是基于概率,而非基于推理。这也就意味着,在当前的AI热潮中,这些模型架构可能无法幸存下来。毕竟,由于发展速度太快,如今的LLM寿命相对较短。昨天还炙手可热的模型,一两周后可能就...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
掰开安卓手机 满屏都是三个字:大模型
...的内存单元,是大模型进手机面临的第二道难关:大模型推理需要大量计算资源做支撑,与此同时,内存大小决定了数据处理速度的上限以及推理的稳定性。另外,在手机上跑大模型,也给电池带来了更大的压力。因此芯片能耗...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...Turbo已经在腾讯云正式上线。混元Turbo训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。与此同时,全新AI infra品牌“腾讯云智算”也和公众见面了,这是一个集算存网...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...其基础,看模型提出的声明是否有源文档作为依据- 数学推理:区分LLM生成数学解题方案的正确或错误- 编码:涵盖Python、JavaScript、Java、C++、Go和Rus等流行编程语言,训练FLAMe从备选答案中选出正确程序或修复程序- 安全性:为了...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...闭源的商业模型会配套相应的工具链,包括训练工具链、推理工具链,这些工具链的性能要比开源的好,对于客户来说,训练就能省大概10~20%的硬件成本,推理的时候省得更多,业务规模越大,省得越多。第二层,看模型带来的...……更多
AI PC是噱头还是更快的马车?
...言模型的能力,但其实是在本地运行的,而非借助云端的推理能力。讲真,应该没有人会认为整理文件名这种本地文件系统的操作还需要去云端绕一圈吧?从端到云之间隐藏的各种断点确实限制了我们的想象力,因此,AIPC的这些...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
更多关于科技的资讯:
打坐圣地!网友找到了黑猴打坐庙宇原型
9月24日消息,据媒体报道,近日,《黑神话:悟空》天蓬元帅建模演员胡涛跟着游戏的步伐,开启了寻宝之旅,在二仙庙找到了黑猴打坐的庙宇原型
2024-09-24 13:58:00
11万!最省油SUV开回家:亏电油耗3L比摩托车还低
重量2000kg+的家用五座SUV,和一辆重量200kg左右的两轮摩托车 ,谁更省油?你大概觉得这个问题很白痴,没常识
2024-09-24 13:58:00
Intel有望收获最高50亿美元投资!爱尔兰工厂已卖出110亿美元
快科技9月24日消息,Intel当下正处于前所未有的风雨飘摇状态,无论产品还是财务、股市表现都令人堪忧,甚至高通都有意将其收购
2024-09-24 13:58:00
乐道L60上市后订单爆了!博主:进店量暴涨8倍 店均新增大定160台起
快科技9月24日消息,蔚来子品牌乐道L60已于上周上市,选择电池租赁,起售价仅14.99万元,价格极具竞争力。虽然蔚来方面暂没有公布具体订单量
2024-09-24 13:58:00
2024年了,PC营销竟能再次“翻红”?
相信有些朋友看到这篇文章会有点懵逼。什么?现在居然还有人提什么PC时代?还营销重回PC?老粉都知道,倪叔不打诳语。没错
2024-09-24 14:08:00
国际包装创新包装大会即将启航,引领包装新纪元
近年来全球商业发展日新月异,各行业都面临着与日俱增的内卷竞争。在此背景下,欧盟于7月25日颁布了《企业可持续发展尽职调查指令》(CSDDD)
2024-09-24 14:08:00
本文转自:人民网人民网北京9月24日电 (焦磊)随着人工智能技术的快速发展,AI大模型在各行各业中得到广泛应用,并逐渐成为推动产业变革的重要引擎
2024-09-24 14:24:00
仰望U8同级但便宜33万!东风猛士917蛟龙战甲上市:售76.8万起
快科技9月24日消息,东风猛士917蛟龙战甲正式上市,推出两款车型,售价区间为76.8-86.8万元。作为与电影《蛟龙行动》联名的量产版
2024-09-24 14:28:00
腾讯《暗区突围:无限》端游国服体验服招募开启:最低GTX960就能玩
快科技9月24日消息,腾讯官方今天正式宣布,《暗区突围:无限》国服体验服将于10月正式开启。目前官方已经开启了玩家招募
2024-09-24 14:28:00
周鸿祎声明力挺华为:称赞华为Mate XT三折叠手机寓意好
快科技9月24日消息,日前,360集团创始人周鸿祎发布视频表示,他努力地拍视频,替华为的新手机做宣传,可惜还是有些人没看懂
2024-09-24 14:28:00
手机界过了一个热闹周末商报讯 9月10日,苹果和华为选在同天召开新品发布会;9月20日(上周五),两家又在同一天发售当季新机
2024-09-24 14:35:00
商报讯 下半年最大的购物热潮即将到来,跨境电商平台也开始进入备战海外双11的节奏。9月底短短一周内,速卖通就在杭州、义乌
2024-09-24 14:36:00
王牌功能丨法大大“强制阅读”,认真看完才作数!
签完的合同出现纠纷,最怕: ·签署人说没看清... ·签署人甚至说没见过这个条款... ·签署人直接对已签署文件进行抵赖
2024-09-24 14:45:00
财经观察:探访“单项冠军”,看“智”造时代“皖”胜密码
本文转自:人民网方经纶1台机器每小时可筛检30吨大米;1块合成革碳排放量降至一半;1个千亿市场正加速形成……近年来,安徽省不断推动制造业高端化
2024-09-24 14:56:00
百公里1.8升油 五羊本田SCR125踏板摩托发布:7580元起
快科技9月24日消息,昨晚,五羊本田发布了一款SCR125摩托车新品,首发价7580元起。具体到车型来看,SCR125手鼓版7580元
2024-09-24 14:58:00