• 我的订阅
  • 头条热搜
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
pytorchtorchao正式发布,提供了一系列优化工具集
...下架构优化库torchao现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和RAM用量,从而提升模型运行效率,IT之家附GitHub页面地址(点此访问)。据介绍,torchao提供了一系...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...时间12月5日,OpenAI正式上线ChatGPT‍的o1和o1-Pro两个新的AI模型。其中o1模型实际上大家之前已经用过了,只是那时候还叫o1-preview,仅开放了o1模型的部分功能,如今新版本去掉了preview,也意味着o1模型的满血版终于正式上线。图...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...无数医生耗时耗力的环节——病历内涵质控,现在有了大模型来当得力帮手。所谓病历内涵质控,简单来说指的就是对病历内容的质量控制。那它为什么会让医生们如此耗时耗力呢?首先,病历本身就会完整、真实地反映出诊疗...……更多
大模型“免费”送,厂商们图什么?
2024年618,传统电商行业不再喧嚣,但大模型市场却开启了惨烈的“价格战”,甚至部分企业直接免费送大模型服务。5月15日,字节跳动宣布,豆包主力模型企业市场定价为0.0008元/千Tokens,0.8厘可处理1500多个汉字,比行业便宜99...……更多
大模型价格战谁会受益
从讳莫如深到开诚布公,大模型价格战开打两个月,从业者主动或被动地参与其中,7月4日—6日举办的2024世界人工智能大会期间,大模型价格战依然是热门话题,但参与各方强调的不再是价格本身,而是一针见血到商业模式、...……更多
IBM宣布将更多人工智能模型开源;通义千问9款主力模型降价
NO.1 IBM宣布将更多人工智能模型开源5月21日,IBM宣布,将以开源软件的形式发布一系列人工智能模型。IBM称,在watsonx平台推出一年后,该平台将进行多项新的更新,并即将推出数据和自动化功能,旨在使人工智能对企业而言更...……更多
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...双方此次合作旨在聚焦数字安全、信息与数字化服务及大模型等领域的创新应用,共同构建一个更加强大、可靠的人工智能生态系统,为各行各业提供先进的技术支持和服务。双方还将携手打造“360 智脑大模型一体机”,加速...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
就在刚刚,云计算一哥亚马逊云科技,在大模型这件事儿上搞了波大的——亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐...……更多
ai生命周期:ai训练和ai推理的完美结合
...部分,一个是AI训练,一个是AI推理。其中,AI训练就是让模型识别数据模式,是数据和处理最密集的部分,需要大规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时候根据情况也可以使用超...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...年度领先科技奖。腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...进行文献搜索和文献综述工作,而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中,可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世,后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日,...……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...领域。自从AI赛道大热以来,人们的关注点主要在各种大模型的竞争,OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI...……更多
为什么人工智能不是免费的?
...学习消耗大量的能量。所有这些能够制作视频的人工智能模型都在消耗每小时兆瓦数的电量。但似乎没有人——甚至是开发这项技术的公司——能确切地说出成本是多少。有专家表示,这些数字只是人工智能总消耗量的一小部分...……更多
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...发展新质生产力注入高效算力随着人工智能迅速发展,大模型的迁移成本和开发门槛成为影响AI创新的重要因素。为此,中兴通讯推出AI训推平台(AI Studio),简化创新之路、降低迁移成本。在中兴通讯南京滨江智能制造基地,...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...场跨国会议。 一 、混元Turbo亮相,700多款产品已接入大模型云和大模型,正在越来越深度地捆绑到一起。“大模型和云是密不可分的,大模型在云上训练,同时大模型能力通过云向外输出;另一方面,云产品也通过与大模型的...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...了开幕式。度小满CEO朱光在金融科技周主论坛上发言“大模型在金融行业的应用”是本届科技周最受关注的话题。度小满CEO朱光在科技周主论坛上表示,“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用,将从外...……更多
智启新元年:PC成为AI落地首选终端
...常高端,但和我们的日常生活有何关联?普通人不懂AI大模型,能否轻松上手这些应用?算力爆炸,又是如何给人们带来创新体验?“要真正实现AI的普惠,还需要克服AI个性化服务、效率、成本及安全性等多重挑战。但是时候去...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
加速落地 京东云大模型已支持数百个场景
...云城市大会在成都顺利举行,大会全面展示了京东场景大模型应用效果、言犀大模型技术能力升级,支持大模型的新一代数字基础设施,持续加速产业智能化变革。京东云相关负责人介绍,京东围绕大模型的平台构建和场景应用...……更多
阿里CEO吴泳铭:AI计算正在加速演进,成为计算体系的主导
...历史时期,但依然处于AGI变革的早期。2、下一阶段先进模型的投入门槛是几十亿、几百亿美金级别。3、生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。4、机器人将是下一...……更多
...转自:环球时报随着人工智能(AI)技术的快速发展,大模型的竞争正在从技术驱动过渡到市场驱动。在这一背景下,2024年以来,全球主流大模型间的比拼有两个要点。一是重要产品发布,OpenAI等企业的重大发布吸引全球目光;...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...持平。在过去的一年里,大多数企业都将资源投入到了AI模型的训练中,因此需要大量的算力资源支撑,在部署空间有限的情况下,英伟达的H100显然是最好的选择。 更何况H100是英伟达在2022年3月份发布的GPU加速卡,从中也不难...……更多
更多关于科技的资讯:
中国网12月16日讯 据网信中国微信公众号消息,党的二十届四中全会明确坚持扩大内需这个战略基点,强调要大力提振消费,要以新需求引领新供给
2025-12-16 16:06:00
近日,瑞众人寿唐山中支围绕客服节“拾光美好·瑞意相伴”核心主题,开展了2025年客服节健康生活系列活动。通过线上线下融合
2025-12-16 16:04:00
【宅男财经|专家面对面】人工智能全面融入人类的生活,还有多久能够实现?工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 16:52:00
《科学智能生态报告》于腾冲科学家论坛发布——我国科学智能生态培育取得6项进展
12月5日至8日,由云南省人民政府和中国科学技术协会共同主办的2025腾冲科学家论坛在腾冲举行。论坛期间上海财经大学数字经济研究院与新华网融媒体未来研究院在“未来之问”可持续发展
2025-12-16 15:20:00
6.5折、每日5张!第九届雪博会优惠力度拉满了
12月18日至22日,第九届吉林冰雪产业国际博览会将在长春东北亚国际博览中心盛大启幕,以“购物最低享6.5折+1亿元冰雪消费券+企业特惠”等多重福利组合拳
2025-12-16 16:06:00
借势“疯狂动物城”热潮,叮当快药携手百多邦开启家庭健康新“城”事
伴随动画电影《疯狂动物城2》11月26日起全球热映,叮当健康旗下专业送药平台叮当快药与皮肤健康专业品牌百多邦,开展了一场覆盖线上线下的深度跨界合作
2025-12-16 14:03:00
从濒临倒闭到业绩暴增!“沸点计划”成功模型引爆区域代理签约潮
“沸点计划”上海合生汇店以一组硬核数据印证了其商业模型的爆发力:单日营业额最高突破6万元,平均翻台率稳定在5轮,远超行业平均水平
2025-12-16 14:04:00
中国消费者报南宁讯(杨霞 记者顾艳伟)知识产权纠纷曾是不少“出海”企业面临的难题。12月12日,记者从广西壮族自治区桂林市市场监管局了解到
2025-12-16 11:07:00
河北沧州:一张操作指南卡破解企业信息填报难题
中国消费者报石家庄讯(谭鑫 记者李建)记者近日从河北省沧州市标准化所获悉,今年以来,该所紧扣行风建设,以“群众易懂、流程畅通
2025-12-16 11:07:00
江苏省消保委调查货运平台发现:价格不透明、信息掺水、服务保障差等乱象突出
中国消费者报报道(记者薛晶晶)随着网络货运市场规模持续扩容,相关平台已成为货主发货、司机找活的核心渠道,但其背后的乱象也让消费者苦不堪言
2025-12-16 11:07:00
中国消费者报报道(记者李燕京)12月8日,《疯狂动物城2》在中国内地的票房突破30亿元。数据显示,截至11月30日,2025年度国产片票房已达403
2025-12-16 11:07:00
中国消费者报报道(记者桑雪骐)中央经济工作会议12月10日至11日在北京举行。在部署明年重点任务时,会议提到了“优化‘两新’政策实施”
2025-12-16 11:07:00
海尔集团与歌尔集团达成战略合作,新时达将助力歌尔深化智能制造领域布局
12月11日,海尔集团与歌尔集团正式签署战略合作协议,双方将聚焦智能家电、工业互联网、新能源及人工智能等领域展开深度合作
2025-12-16 11:33:00
于琛刚刚过去的这个“双十二”,除了各电商平台推出的促销活动,抖音出台严打“假揭黑真带货”等违规行为的多项举措,也成为人们热议的话题
2025-12-16 11:02:00
近日,全国首家“现代骑手学院”正式揭牌,该学院设在广州职业技术大学,为在职外卖骑手和快递员提供学历和技能“双提升”通道
2025-12-16 08:07:00