• 我的订阅
  • 头条热搜
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...严格的定义,并详细分析了其性质。TSD的定义首先,定义矩阵的基、矩阵的方向如下。定义1:对于一个矩阵 ,其左奇异向量和右奇异向量分别由矩阵和表示,矩阵的基定义如下。核心基:矩阵的核心基定义为,其中每个是由奇...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...深圳正式召开,vivo发布自研大模型——全新蓝心大模型矩阵,为用户和开发者带来诸多惊喜。在同日举办的人工智能会场上,vivoAI团队分享了在AI领域取得的最新成果,以前沿解决方案引领大模型创新与用户体验升级,助力开发...……更多
阿里腾讯接连注资 月之暗面想要商业化明朗
...前,已经先后投资了国内4家大模型企业,分别是智谱AI、百川智能、零一万物和MiniMax,被投者几乎都是迅速崛起并跻身独角兽行业的新秀。就在阿里公开投资月之暗面时,市场亦传来消息,月之暗面完成新一轮融资,新入局的...……更多
李开复:现在卖AI大模型的方式行不通,需考虑技术和业务成本、要有客户买单
...基于自研算力管理平台和AI Infra技术,零一万物训练出新旗舰模型 Yi-Lightning、千亿参数模型 Yi-Large的MFU (模型FLOPs利用率)超行业平均水平,Goodput(有效训练时间比率)99%。“今天在大模型领域内,大部分 ToB 项目都集中在私有...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...中端平台上,该模型能够实现18.3字/秒的平均生成速度,旗舰平台上可达78.3字/秒,而人眼最快的阅读速度为20字/秒。目前商汤端侧模型已落地手机、汽车、个人计算机、智能音箱等终端,服务小米、荣耀等企业在内的客户。在AI...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
... 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之……更多
AI PC YES!AMD举办AI PC创新峰会
...裁潘晓明主持了中国AI生态伙伴论坛,在活动上始智AI、百川智能、有道、游戏加加、生数与另外30多家ISV合作伙伴在会上展示了AMDAIPC体验。AMD还展示了来自通义千问、智谱·AI、无问芯穹、元始智能、面壁智能等合作伙伴的端侧...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...过程可以被重新形式化为:其中⊕表示检索到的连续提示矩阵和q的单词嵌入矩阵的连接。 本文方法的可行性得到了P-Tuning等先前工作的支持,该工作证明了训练连续提示嵌入可以提高LLM在下游任务上的性能有效性。在RECIPE中,...……更多
AI难盈利,商汤生成式AI创收12亿增长两倍,全年净利亏损65亿
...新的大模型创业公司,包括月之暗面、MiniMax、智谱AI 、百川智能和零一万物等。不过,商汤仍在推进大装置+大模型的升级。在基础设施方面,早在2022年投入运营的上海临港AIDC推动商汤大装置总算力规模持续增长,最新总算力...……更多
阿里云AI基础设施获2024世界互联网大会领先科技奖
...、携程、喜马拉雅、三得利(中国)等30多万企业客户;百川智能、月之暗面、零一万物等大部分中国大模型公司都在阿里云上进行AI创新;复旦大学、浙江大学等国内50多所院校机构也携手阿里云开展AI for Science的相关研究。世...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
...地位,效果接近国外头部模型GPT4o和Claude3.5。作为新一代旗舰大模型,腾讯混元Turbo在语言理解、文本创作、数学和代码等领域都有较大提升,跟前代模型相比,复杂数学解决能力提升38%,代码能力提升32%。公开benchmark测评腾讯...……更多
AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了
...多科技公司、AI 创业公司进行了深度合作,包括阿里云、百川智能、Google、面壁智能、Meta、微软、零一万物、腾讯混元、百度文心等,实现了对主流大模型的大面积优化。 9 月 26 日,在 Meta 发布开源大模型标杆 Llama3.2 的同时...……更多
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
...。不过这也意味着,在执行推理时,需要进行混合精度的矩阵乘法运算(mpGEMM),即用低精度的权重和高精度的激活向量进行计算。然而,现有的系统和硬件并不原生支持这种混合精度的矩阵乘法,因此它们通常需要将低精度的...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...多款产品接入混元大模型,实现用户体验的提升。腾讯全矩阵的大模型产品目前已经在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等落地。AI infra品牌“腾讯云智算”也正式亮相,这是一个集算...……更多
MediaTek发布天玑9300旗舰5G生成式AI 移动芯片,开启全大核计算时代
...的AI生态,支持Android、Meta Llama 2、百度文心一言大模型、百川智能百川大模型等前沿主流AI大模型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验...……更多
ai终端产业创新论坛在沪举行
...是让他从小学生开始,读到中学生、大学生再到博士。”百川智能联合创始人、联席总裁洪涛介绍说:“大模型是在‘造人’,随着专业知识和模型能力的提升,大众就可以更轻松普惠地获取世界知识和专业服务。”与上述从小...……更多
豆包大模型公布价格清单 支持国内最高并发标准
...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型 pro-32k 为例,价格比行业低99%,TPM...……更多
一年投入数十亿,手机厂商抢滩大模型 | 焦点分析
...ivo发布十亿、百亿、千亿级别三个参数量级的五个大模型矩阵;上个月,小米也将搭载大模型能力后的语音助手小爱同学,整体嵌套到了澎湃OS上;在更早的8月份,华为鸿蒙OS 4也宣布接入大模型。手机厂商对于大模型的投入不...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...求。此外,该处理器还内置有英特尔® AMX(英特尔® 高级矩阵扩展)加速技术,经特定优化后,其每时钟周期可完成多达2048个INT8运算,较上一代同类指令实现了8倍性能飞跃。英特尔® 至强® CPU Max 系列处理器除硬件优势之外,...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...种应用。进一步完善大模型基础设施,升级为千帆大模型旗舰版,除了大模型相关的训练调优外,也包含了应用构建的平台。百度及生态伙伴深度参与到企业内部大模型相关培训和运营中,构建技术氛围、培训相关人才,与企业...……更多
把大模型装进手机,总共分几步?
...端协同,以vivo、OPPO为代表。11月vivo发布的自研AI大模型矩阵,其中包括十亿、百亿、千亿三个不同参数量级的5款大模型。其中,10亿量级模型是主要面向端侧场景打造的专业文本大模型,70亿模型是面向手机打造的端云两用模型...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...业非常理想。至强处理器的每个核心都内置了Intel AMX高级矩阵扩展,可以处理多样化的AI工作负载,并加速AI推理。以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例,通义千问2的下一个推理token延迟情况。最后是消费级...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...、AI数据分析师、产品创新助手、热点创意助手等智能体矩阵,提升前端消费者体验,助力后端运营人员决策。 智能终端大模型联盟发布会上,火山引擎与OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...判,帮助企业实现决策智能。技术优势:它支持智谱 AI、百川智能等国内领先的大语言模型,通过微调和优化提高模型的准确率和可读性,通过开放 API 接口支持个性化的数据应用搭建。(来源:“CSDN”微信公众号)《马斯克多...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
...11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失任何一个战略性风口,否则就会被时...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...1+2+N”的智能系统体验。其中的1,即vivo自研通用大模型矩阵——蓝心大模型BlueLM;2,即系统全局智能辅助应用“蓝心小V”和以公版APP形式推出的自然语言对话机器人“蓝心千询”;N,即开发者依托vivo业界首家开源的70亿蓝心...……更多
更多关于科技的资讯:
《黑神话》立功!Steam中国玩家激增:简体中文用户占比已突破50%
根据Automaton的消息称,在上个月V社发布了最新的Steam硬件和软件调查,结果显示:截至2025年2月,简体中文用户数量增加了20
2025-03-08 13:45:00
酒蒙子有救了!女子植入戒酒芯片称酒就像白开水
快科技3月8日消息,对于嗜酒如命的人而言,戒酒属实是个老大难的问题,不过随着科技的发展,一切皆有可能。据“成都市第四人民医院”官方报道
2025-03-08 14:15:00
何小鹏在央视采访中表示:机器人是汽车发展下一个形态之一
快科技3月8日消息,全国人大代表、小鹏汽车董事长何小鹏在接受央视采访时,深入探讨了智能网联新能源汽车及智能机器人的未来发展趋势
2025-03-08 14:45:00
女生每天自驾110公里跨市上班:是时候换台纯电车了
快科技3月8日消息,你能忍受最长的通勤距离是多远?有私家车的话每天跑100公里可能还行,但如果时间长度拉到10年呢?在河南荥阳
2025-03-08 14:45:00
小男孩如愿坐上小米SU7 Ultra 冲回家拿车模送车主
快科技3月8日消息,在这个看似平常的早晨,汽车博主@臧智渊却收获了一份意想不到的温暖与感动。当他的小米SU7 Ultra临时停在二环路边时
2025-03-08 14:45:00
犯罪片《最暖的归途》立项:《第二十条》同编剧
快科技3月8日消息,据灯塔专业版备案信息库,电影《最暖的归途》立项备案,备案单位北京光线影业有限公司、最高人民检察院影视中心
2025-03-08 15:15:00
小红书快成为新一代的App Store了
不是哥们,现在的开发者都这么野吗?老差友都知道,咱公众号时不时分享一些好玩、有趣的小软件。这些 App 我能第一时间知道
2025-03-08 15:15:00
最快300km/h!不少小米SU7 Ultra车主晒狂飙速度 雷军是否该限速
快科技3月8日消息,随着越来越多用户提车小米SU7 Ultra,那么上路后感受它的速度就是必不可少的操作了。已经有不少小米SU7 Ultra车主在社交媒体上晒视频
2025-03-08 15:45:00
超《复联3》近在咫尺!《哪吒2》票房破147亿
快科技3月8日消息,根据网络平台数据显示,全球动画电影票房榜冠军《哪吒之魔童闹海》总票房已突破147亿元人民币。目前,该片在全球票房排名中位列第7位
2025-03-08 15:45:00
一种“低成本”就能让心情变好的方式 真的推荐你试试!
让我们想象这样一个场景:结束了一天的忙碌,疲惫的你回到家中,满心渴望着将白天繁杂的工作以及烦恼统统抛诸脑后。于是,你抱起编织篮子
2025-03-08 16:15:00
姚明建议“息屏24小时”登热搜第一:24小时内不用手机
快科技3月8日消息,全国两会期间,全国人大代表姚明提出了一项引人关注的建议:在未成年人中开展“息屏24小时”行动。这一提议鼓励家长与学校共同参与
2025-03-08 16:15:00
卢伟冰:小米15 Ultra销量非常不错 平销期是上代2倍
快科技3月8日消息,小米15 Ultra于3月3日在中国市场正式发售,起售价为6499元。令人瞩目的是,其首销日销量较上一代同期增长了超过50%
2025-03-08 16:45:00
iPhone 16e游戏性能实测:牙膏版A18到底表现如何
随着苹果iPhone 16系列的发布,iPhone 16e作为其中的一员,凭借其轻薄设计、超长续航和AI生态等特性,吸引了众多消费者的关注
2025-03-08 17:15:00
中医有多厉害:杭州一女孩求中医后 1年身高增长21.6厘米
快科技3月8日消息,“中医要有点自信,5000年的东西不是谁能否就否得了的,还是靠疗效说明机理研制更多的好药,慢慢大家就会信任它
2025-03-08 17:45:00
每天4杯咖啡 25岁女孩确诊骨质疏松 弯个腰骨折了
快科技3月8日消息,弯腰捡个衣服,竟然闪到腰了,谁能想到竟然发生在25岁年轻人身上。据报道,日前,一位25岁女子到浙江宁波一家综合医院骨科就诊
2025-03-08 18:45:00