• 我的订阅
  • 头条热搜
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...严格的定义,并详细分析了其性质。TSD的定义首先,定义矩阵的基、矩阵的方向如下。定义1:对于一个矩阵 ,其左奇异向量和右奇异向量分别由矩阵和表示,矩阵的基定义如下。核心基:矩阵的核心基定义为,其中每个是由奇...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...深圳正式召开,vivo发布自研大模型——全新蓝心大模型矩阵,为用户和开发者带来诸多惊喜。在同日举办的人工智能会场上,vivoAI团队分享了在AI领域取得的最新成果,以前沿解决方案引领大模型创新与用户体验升级,助力开发...……更多
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
阿里腾讯接连注资 月之暗面想要商业化明朗
...前,已经先后投资了国内4家大模型企业,分别是智谱AI、百川智能、零一万物和MiniMax,被投者几乎都是迅速崛起并跻身独角兽行业的新秀。就在阿里公开投资月之暗面时,市场亦传来消息,月之暗面完成新一轮融资,新入局的...……更多
李开复:现在卖AI大模型的方式行不通,需考虑技术和业务成本、要有客户买单
...基于自研算力管理平台和AI Infra技术,零一万物训练出新旗舰模型 Yi-Lightning、千亿参数模型 Yi-Large的MFU (模型FLOPs利用率)超行业平均水平,Goodput(有效训练时间比率)99%。“今天在大模型领域内,大部分 ToB 项目都集中在私有...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...中端平台上,该模型能够实现18.3字/秒的平均生成速度,旗舰平台上可达78.3字/秒,而人眼最快的阅读速度为20字/秒。目前商汤端侧模型已落地手机、汽车、个人计算机、智能音箱等终端,服务小米、荣耀等企业在内的客户。在AI...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
... 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之……更多
AI PC YES!AMD举办AI PC创新峰会
...裁潘晓明主持了中国AI生态伙伴论坛,在活动上始智AI、百川智能、有道、游戏加加、生数与另外30多家ISV合作伙伴在会上展示了AMDAIPC体验。AMD还展示了来自通义千问、智谱·AI、无问芯穹、元始智能、面壁智能等合作伙伴的端侧...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...过程可以被重新形式化为:其中⊕表示检索到的连续提示矩阵和q的单词嵌入矩阵的连接。 本文方法的可行性得到了P-Tuning等先前工作的支持,该工作证明了训练连续提示嵌入可以提高LLM在下游任务上的性能有效性。在RECIPE中,...……更多
AI难盈利,商汤生成式AI创收12亿增长两倍,全年净利亏损65亿
...新的大模型创业公司,包括月之暗面、MiniMax、智谱AI 、百川智能和零一万物等。不过,商汤仍在推进大装置+大模型的升级。在基础设施方面,早在2022年投入运营的上海临港AIDC推动商汤大装置总算力规模持续增长,最新总算力...……更多
阿里云AI基础设施获2024世界互联网大会领先科技奖
...、携程、喜马拉雅、三得利(中国)等30多万企业客户;百川智能、月之暗面、零一万物等大部分中国大模型公司都在阿里云上进行AI创新;复旦大学、浙江大学等国内50多所院校机构也携手阿里云开展AI for Science的相关研究。世...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
...地位,效果接近国外头部模型GPT4o和Claude3.5。作为新一代旗舰大模型,腾讯混元Turbo在语言理解、文本创作、数学和代码等领域都有较大提升,跟前代模型相比,复杂数学解决能力提升38%,代码能力提升32%。公开benchmark测评腾讯...……更多
AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了
...多科技公司、AI 创业公司进行了深度合作,包括阿里云、百川智能、Google、面壁智能、Meta、微软、零一万物、腾讯混元、百度文心等,实现了对主流大模型的大面积优化。 9 月 26 日,在 Meta 发布开源大模型标杆 Llama3.2 的同时...……更多
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
...。不过这也意味着,在执行推理时,需要进行混合精度的矩阵乘法运算(mpGEMM),即用低精度的权重和高精度的激活向量进行计算。然而,现有的系统和硬件并不原生支持这种混合精度的矩阵乘法,因此它们通常需要将低精度的...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...多款产品接入混元大模型,实现用户体验的提升。腾讯全矩阵的大模型产品目前已经在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等落地。AI infra品牌“腾讯云智算”也正式亮相,这是一个集算...……更多
MediaTek发布天玑9300旗舰5G生成式AI 移动芯片,开启全大核计算时代
...的AI生态,支持Android、Meta Llama 2、百度文心一言大模型、百川智能百川大模型等前沿主流AI大模型,完整的工具链助力开发者在端侧快速且高效地部署多模态生成式AI应用,为用户提供文字、图像、音乐等终端侧生成式AI创新体验...……更多
ai终端产业创新论坛在沪举行
...是让他从小学生开始,读到中学生、大学生再到博士。”百川智能联合创始人、联席总裁洪涛介绍说:“大模型是在‘造人’,随着专业知识和模型能力的提升,大众就可以更轻松普惠地获取世界知识和专业服务。”与上述从小...……更多
豆包大模型公布价格清单 支持国内最高并发标准
...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型 pro-32k 为例,价格比行业低99%,TPM...……更多
一年投入数十亿,手机厂商抢滩大模型 | 焦点分析
...ivo发布十亿、百亿、千亿级别三个参数量级的五个大模型矩阵;上个月,小米也将搭载大模型能力后的语音助手小爱同学,整体嵌套到了澎湃OS上;在更早的8月份,华为鸿蒙OS 4也宣布接入大模型。手机厂商对于大模型的投入不...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...求。此外,该处理器还内置有英特尔® AMX(英特尔® 高级矩阵扩展)加速技术,经特定优化后,其每时钟周期可完成多达2048个INT8运算,较上一代同类指令实现了8倍性能飞跃。英特尔® 至强® CPU Max 系列处理器除硬件优势之外,...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...种应用。进一步完善大模型基础设施,升级为千帆大模型旗舰版,除了大模型相关的训练调优外,也包含了应用构建的平台。百度及生态伙伴深度参与到企业内部大模型相关培训和运营中,构建技术氛围、培训相关人才,与企业...……更多
把大模型装进手机,总共分几步?
...端协同,以vivo、OPPO为代表。11月vivo发布的自研AI大模型矩阵,其中包括十亿、百亿、千亿三个不同参数量级的5款大模型。其中,10亿量级模型是主要面向端侧场景打造的专业文本大模型,70亿模型是面向手机打造的端云两用模型...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...业非常理想。至强处理器的每个核心都内置了Intel AMX高级矩阵扩展,可以处理多样化的AI工作负载,并加速AI推理。以上是在五代可扩展至强上运行阿里云ecs.ebmg8i.48xlarge实例,通义千问2的下一个推理token延迟情况。最后是消费级...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...、AI数据分析师、产品创新助手、热点创意助手等智能体矩阵,提升前端消费者体验,助力后端运营人员决策。 智能终端大模型联盟发布会上,火山引擎与OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...判,帮助企业实现决策智能。技术优势:它支持智谱 AI、百川智能等国内领先的大语言模型,通过微调和优化提高模型的准确率和可读性,通过开放 API 接口支持个性化的数据应用搭建。(来源:“CSDN”微信公众号)《马斯克多...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
...11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失任何一个战略性风口,否则就会被时...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...1+2+N”的智能系统体验。其中的1,即vivo自研通用大模型矩阵——蓝心大模型BlueLM;2,即系统全局智能辅助应用“蓝心小V”和以公版APP形式推出的自然语言对话机器人“蓝心千询”;N,即开发者依托vivo业界首家开源的70亿蓝心...……更多
更多关于科技的资讯:
劳力士手表价格暴跌 有人卖块表赔了一台保时捷
快科技3月10日消息,据报道,二手劳力士手表价格近期正在持续下跌。“熊猫迪”已从40万元跌到19万元,一些型号更是跌破了劳力士发行的公价
2025-03-10 19:48:00
182.3米世界坝体最高!江苏句容抽水蓄能电站3号机组并网发电
快科技3月10日消息,据央视新闻报道,今天位于江苏句容市的国网新源江苏句容抽水蓄能电站3号机组正式并网发电。至此,该站首批3台机组已全部投运
2025-03-10 19:48:00
出色影像加持,华为nova 13 Pro氛围感照片触手可得
在这个时代,一张好看的照片胜过千言万语。你是否曾经因为拍不出美照而错失记录生活的机会?是否曾因为不会给女朋友拍照而被嫌弃
2025-03-10 19:48:00
网友买到三只松鼠发霉面包要求道歉 客服:赔偿2000元 道歉信没有
近日,据媒体报道,有网友买到三只松鼠发霉面包。该网友称,该发霉面包是从三只松鼠电商旗舰店购得,入口后闻到臭味,发现面包发霉现象
2025-03-10 19:48:00
网友脑洞大开!华为Pura 80鬼才设计图曝光
快科技3月10日消息,有网友放出了一张华为Pura 80的“鬼才设计图”,其最大看点是镜头模组是四分之一圆,四台手机组合在一起就能拼成一个完成的圆形
2025-03-10 19:48:00
对话全国政协委员、康希诺朱涛:疫苗出海需创新与差异化,国家免疫规划扩容是必然趋势
“我们不可能一天就把免疫计划扩容到跟发达国家一样多的品种。随着国内企业在疫苗供给、疫苗质量和技术水平方面的逐步提高,国家免疫规划扩容必然会来临
2025-03-10 19:54:00
秒“算”神机,西部大山为“哪吒”生出澎湃算力|贵州有“数”
据网络平台数据:《哪吒之魔童闹海》(《哪吒2》)全球电影票房(含预售及海外)超越《复仇者联盟3:无限战争》进入全球票房榜前6名
2025-03-10 20:15:00
13万就有激光雷达智驾!零跑B10搭同级唯一高通8650智驾芯片
快科技3月10日消息,零跑汽车今日晚间举办零跑B10预售发布会。零跑汽车介绍,B10为13万级首搭激光雷达高阶智驾的车型
2025-03-10 20:18:00
“县城贵妇”们开始纷纷加入二手经济
快科技3月10日消息,近日,转转集团发布2024女性二手消费洞察。数据显示,2024年转转平台女性用户同比增长70%,女性用户在高价值品类的交易中占比显著提升
2025-03-10 20:18:00
10倍长!微信正式官宣:朋友圈可以发5分钟视频了
快科技3月10日消息,微信,作为我们日常生活中不可或缺的社交工具,一直在不断创新和优化,为用户带来更加丰富的使用体验。以往
2025-03-10 20:18:00
鲁网3月10日讯(记者 陈珊珊 通讯员 韩巧苓)在人工智能技术飞速发展的当下,楼宇经济作为城市产业的关键支撑,正面临着数字化
2025-03-10 20:43:00
本文转自:人民日报客户端全国政协委员、中国载人航天工程副总设计师杨利伟接受人民日报“两会面对面”系列访谈时提到,从登月载人飞船梦舟到着陆器
2025-03-10 21:30:00
调查显示:超七成宁波女性消费者每年都出游
中国消费者报报道(记者郑铁峰)在“她经济”持续崛起的背景下,女性消费者正以多元化的需求重塑消费市场格局。近日,浙江省宁波市消保委面向18至60周岁的宁波女性消费者开展消费调查
2025-03-10 21:59:00
警惕!伪装成学习工具的色情软件威胁孩子健康成长
在数字化时代,手机应用为孩子们的学习和娱乐提供了便利。然而,网络中潜伏的危险却不容忽视。近日,河南郑州的一则事件敲响警钟
2025-03-10 22:32:00
长城汽车:坦克300是一台可以载入全球汽车编年史的越野车 女性用户占比35%
快科技3月10日消息,今日晚间,坦克300 2025款上市发布会正式举办。发布会一开始,坦克品牌执行副总经理谷玉坤率先回顾了坦克300上市4年来取得的成绩
2025-03-10 20:48:00