• 我的订阅
  • 头条热搜
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
pytorchtorchao正式发布,提供了一系列优化工具集
...下架构优化库torchao现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和RAM用量,从而提升模型运行效率,IT之家附GitHub页面地址(点此访问)。据介绍,torchao提供了一系...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...时间12月5日,OpenAI正式上线ChatGPT‍的o1和o1-Pro两个新的AI模型。其中o1模型实际上大家之前已经用过了,只是那时候还叫o1-preview,仅开放了o1模型的部分功能,如今新版本去掉了preview,也意味着o1模型的满血版终于正式上线。图...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...无数医生耗时耗力的环节——病历内涵质控,现在有了大模型来当得力帮手。所谓病历内涵质控,简单来说指的就是对病历内容的质量控制。那它为什么会让医生们如此耗时耗力呢?首先,病历本身就会完整、真实地反映出诊疗...……更多
大模型“免费”送,厂商们图什么?
2024年618,传统电商行业不再喧嚣,但大模型市场却开启了惨烈的“价格战”,甚至部分企业直接免费送大模型服务。5月15日,字节跳动宣布,豆包主力模型企业市场定价为0.0008元/千Tokens,0.8厘可处理1500多个汉字,比行业便宜99...……更多
大模型价格战谁会受益
从讳莫如深到开诚布公,大模型价格战开打两个月,从业者主动或被动地参与其中,7月4日—6日举办的2024世界人工智能大会期间,大模型价格战依然是热门话题,但参与各方强调的不再是价格本身,而是一针见血到商业模式、...……更多
IBM宣布将更多人工智能模型开源;通义千问9款主力模型降价
NO.1 IBM宣布将更多人工智能模型开源5月21日,IBM宣布,将以开源软件的形式发布一系列人工智能模型。IBM称,在watsonx平台推出一年后,该平台将进行多项新的更新,并即将推出数据和自动化功能,旨在使人工智能对企业而言更...……更多
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...双方此次合作旨在聚焦数字安全、信息与数字化服务及大模型等领域的创新应用,共同构建一个更加强大、可靠的人工智能生态系统,为各行各业提供先进的技术支持和服务。双方还将携手打造“360 智脑大模型一体机”,加速...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
就在刚刚,云计算一哥亚马逊云科技,在大模型这件事儿上搞了波大的——亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐...……更多
ai生命周期:ai训练和ai推理的完美结合
...部分,一个是AI训练,一个是AI推理。其中,AI训练就是让模型识别数据模式,是数据和处理最密集的部分,需要大规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时候根据情况也可以使用超...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...年度领先科技奖。腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...进行文献搜索和文献综述工作,而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中,可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世,后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日,...……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...领域。自从AI赛道大热以来,人们的关注点主要在各种大模型的竞争,OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI...……更多
为什么人工智能不是免费的?
...学习消耗大量的能量。所有这些能够制作视频的人工智能模型都在消耗每小时兆瓦数的电量。但似乎没有人——甚至是开发这项技术的公司——能确切地说出成本是多少。有专家表示,这些数字只是人工智能总消耗量的一小部分...……更多
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...发展新质生产力注入高效算力随着人工智能迅速发展,大模型的迁移成本和开发门槛成为影响AI创新的重要因素。为此,中兴通讯推出AI训推平台(AI Studio),简化创新之路、降低迁移成本。在中兴通讯南京滨江智能制造基地,...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...场跨国会议。 一 、混元Turbo亮相,700多款产品已接入大模型云和大模型,正在越来越深度地捆绑到一起。“大模型和云是密不可分的,大模型在云上训练,同时大模型能力通过云向外输出;另一方面,云产品也通过与大模型的...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...了开幕式。度小满CEO朱光在金融科技周主论坛上发言“大模型在金融行业的应用”是本届科技周最受关注的话题。度小满CEO朱光在科技周主论坛上表示,“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用,将从外...……更多
智启新元年:PC成为AI落地首选终端
...常高端,但和我们的日常生活有何关联?普通人不懂AI大模型,能否轻松上手这些应用?算力爆炸,又是如何给人们带来创新体验?“要真正实现AI的普惠,还需要克服AI个性化服务、效率、成本及安全性等多重挑战。但是时候去...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
加速落地 京东云大模型已支持数百个场景
...云城市大会在成都顺利举行,大会全面展示了京东场景大模型应用效果、言犀大模型技术能力升级,支持大模型的新一代数字基础设施,持续加速产业智能化变革。京东云相关负责人介绍,京东围绕大模型的平台构建和场景应用...……更多
阿里CEO吴泳铭:AI计算正在加速演进,成为计算体系的主导
...历史时期,但依然处于AGI变革的早期。2、下一阶段先进模型的投入门槛是几十亿、几百亿美金级别。3、生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。4、机器人将是下一...……更多
...转自:环球时报随着人工智能(AI)技术的快速发展,大模型的竞争正在从技术驱动过渡到市场驱动。在这一背景下,2024年以来,全球主流大模型间的比拼有两个要点。一是重要产品发布,OpenAI等企业的重大发布吸引全球目光;...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...持平。在过去的一年里,大多数企业都将资源投入到了AI模型的训练中,因此需要大量的算力资源支撑,在部署空间有限的情况下,英伟达的H100显然是最好的选择。 更何况H100是英伟达在2022年3月份发布的GPU加速卡,从中也不难...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00