• 我的订阅
  • 头条热搜
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
pytorchtorchao正式发布,提供了一系列优化工具集
...下架构优化库torchao现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和RAM用量,从而提升模型运行效率,IT之家附GitHub页面地址(点此访问)。据介绍,torchao提供了一系...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...时间12月5日,OpenAI正式上线ChatGPT‍的o1和o1-Pro两个新的AI模型。其中o1模型实际上大家之前已经用过了,只是那时候还叫o1-preview,仅开放了o1模型的部分功能,如今新版本去掉了preview,也意味着o1模型的满血版终于正式上线。图...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本...……更多
大模型上岗三甲医院,给每个医生都配个“病历质控助手”
...无数医生耗时耗力的环节——病历内涵质控,现在有了大模型来当得力帮手。所谓病历内涵质控,简单来说指的就是对病历内容的质量控制。那它为什么会让医生们如此耗时耗力呢?首先,病历本身就会完整、真实地反映出诊疗...……更多
大模型“免费”送,厂商们图什么?
2024年618,传统电商行业不再喧嚣,但大模型市场却开启了惨烈的“价格战”,甚至部分企业直接免费送大模型服务。5月15日,字节跳动宣布,豆包主力模型企业市场定价为0.0008元/千Tokens,0.8厘可处理1500多个汉字,比行业便宜99...……更多
大模型价格战谁会受益
从讳莫如深到开诚布公,大模型价格战开打两个月,从业者主动或被动地参与其中,7月4日—6日举办的2024世界人工智能大会期间,大模型价格战依然是热门话题,但参与各方强调的不再是价格本身,而是一针见血到商业模式、...……更多
IBM宣布将更多人工智能模型开源;通义千问9款主力模型降价
NO.1 IBM宣布将更多人工智能模型开源5月21日,IBM宣布,将以开源软件的形式发布一系列人工智能模型。IBM称,在watsonx平台推出一年后,该平台将进行多项新的更新,并即将推出数据和自动化功能,旨在使人工智能对企业而言更...……更多
华为AI存储助力中国移动构建超大规模智算集群
...转自:人民日报《人民日报》(2024年12月19日第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...双方此次合作旨在聚焦数字安全、信息与数字化服务及大模型等领域的创新应用,共同构建一个更加强大、可靠的人工智能生态系统,为各行各业提供先进的技术支持和服务。双方还将携手打造“360 智脑大模型一体机”,加速...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
就在刚刚,云计算一哥亚马逊云科技,在大模型这件事儿上搞了波大的——亚马逊CEO Andy Jassy亲自站台re:Invent24,发布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐...……更多
ai生命周期:ai训练和ai推理的完美结合
...部分,一个是AI训练,一个是AI推理。其中,AI训练就是让模型识别数据模式,是数据和处理最密集的部分,需要大规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时候根据情况也可以使用超...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...年度领先科技奖。腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...进行文献搜索和文献综述工作,而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中,可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世,后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日,...……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...领域。自从AI赛道大热以来,人们的关注点主要在各种大模型的竞争,OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI...……更多
为什么人工智能不是免费的?
...学习消耗大量的能量。所有这些能够制作视频的人工智能模型都在消耗每小时兆瓦数的电量。但似乎没有人——甚至是开发这项技术的公司——能确切地说出成本是多少。有专家表示,这些数字只是人工智能总消耗量的一小部分...……更多
中兴通讯:全栈全场景智算解决方案,助力行业智能化转型升级
...发展新质生产力注入高效算力随着人工智能迅速发展,大模型的迁移成本和开发门槛成为影响AI创新的重要因素。为此,中兴通讯推出AI训推平台(AI Studio),简化创新之路、降低迁移成本。在中兴通讯南京滨江智能制造基地,...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...场跨国会议。 一 、混元Turbo亮相,700多款产品已接入大模型云和大模型,正在越来越深度地捆绑到一起。“大模型和云是密不可分的,大模型在云上训练,同时大模型能力通过云向外输出;另一方面,云产品也通过与大模型的...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...了开幕式。度小满CEO朱光在金融科技周主论坛上发言“大模型在金融行业的应用”是本届科技周最受关注的话题。度小满CEO朱光在科技周主论坛上表示,“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用,将从外...……更多
智启新元年:PC成为AI落地首选终端
...常高端,但和我们的日常生活有何关联?普通人不懂AI大模型,能否轻松上手这些应用?算力爆炸,又是如何给人们带来创新体验?“要真正实现AI的普惠,还需要克服AI个性化服务、效率、成本及安全性等多重挑战。但是时候去...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
加速落地 京东云大模型已支持数百个场景
...云城市大会在成都顺利举行,大会全面展示了京东场景大模型应用效果、言犀大模型技术能力升级,支持大模型的新一代数字基础设施,持续加速产业智能化变革。京东云相关负责人介绍,京东围绕大模型的平台构建和场景应用...……更多
阿里CEO吴泳铭:AI计算正在加速演进,成为计算体系的主导
...历史时期,但依然处于AGI变革的早期。2、下一阶段先进模型的投入门槛是几十亿、几百亿美金级别。3、生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。4、机器人将是下一...……更多
...转自:环球时报随着人工智能(AI)技术的快速发展,大模型的竞争正在从技术驱动过渡到市场驱动。在这一背景下,2024年以来,全球主流大模型间的比拼有两个要点。一是重要产品发布,OpenAI等企业的重大发布吸引全球目光;...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...持平。在过去的一年里,大多数企业都将资源投入到了AI模型的训练中,因此需要大量的算力资源支撑,在部署空间有限的情况下,英伟达的H100显然是最好的选择。 更何况H100是英伟达在2022年3月份发布的GPU加速卡,从中也不难...……更多
更多关于科技的资讯:
鲁网9月28日讯金融是经济的血脉,更是百姓生活的依托。在中国经济迈向高质量发展的今天,中国建设银行青岛市分行以国有大行的责任与担当
2025-09-28 10:37:00
五年连获七家世界知名轴承制造企业认证一根轴承钢转动全球——“铁疙瘩”怎样变成“金娃娃”(九)前不久,河钢集团石钢公司收到日本某国际知名轴承企业高碳铬轴承钢的认证邮件
2025-09-28 08:04:00
锚定新赛道 壮大新动能超31亿元新一代工业软件基地项目开工南报网讯(记者刘安琪)项目兴则产业兴,项目强则经济强。9月26日上午
2025-09-28 07:43:00
山东移动成功入选2025年度山东省中小企业服务支撑机构
近日,山东省轻工联社发布《关于公布2025年度山东省中小企业服务支撑机构名单的通知》,山东移动成功入选。作为推动中小企业数字化转型的主力军
2025-09-27 08:11:00
南报网讯(记者卫凌云通讯员建萱)9月26日,2025南京河西中央科创区生态建设推进会举行,“大厂+大学+大所”创新平台揭牌
2025-09-27 09:53:00
山东移动淄博公司织就高速信息网络,筑牢“数字淄博”智慧生命线
在数字化浪潮席卷而来的今天,信息传输网络如同城市的“神经网络”,是智慧城市运转的核心支撑。作为这一无形“生命线”的守护者
2025-09-27 12:34:00
迭代焕新“吾悦经营五步法”,新城控股再启商业新篇
9月24日-25日,新城控股“2025第八届商业年会暨吾悦商管第一届悦链计划合伙人大会”在上海西岸美高梅酒店举行,新城控股集团董事长王晓松及公司高管
2025-09-27 12:37:00
25日上午,以“上山下山·食在晋安”为主题的晋安区“一县一桌菜”云上发布会举行,12道“云端”盛宴引爆味蕾。
2025-09-27 13:53:00
产业链协同驱动 新奥加速冲刺氢硼聚变
河北新闻网讯(张新)2025年,是我国“十四五”规划收官之年,也是“双碳”目标提出五周年。在此背景下,央视《东方时空》栏目近日推出“可控核聚变专题”
2025-09-27 14:45:00
9月25日,国网山西省电力公司发布消息,该公司成功完成配电网无人机电力北斗定位服务的全面应用,标志着该公司依托电力北斗高精度定位服务
2025-09-27 19:56:00
谢志强:从金融菁英到人才“伯乐”,以产学研融合破局就业困境
谢志强,现任中科汇理信息技术研究院党支部书记、秘书长、中科产学研合作一体化人才培育开发平台项目主任。历任中国银行总行风险管理部业务经理
2025-09-27 20:20:00
聚焦数贸会 | 工匠行:机器狗能听会说还会自主巡逻
在第四届全球数字博览会上,贵州工匠行科技有限公司展出的SomaSeek具身智能平台,让机器人彻底告别了遥控器,也能听会说
2025-09-27 22:17:00
企业新市场何处寻?潍坊这场产业国际精准对接会送来“及时雨”
齐鲁晚报·齐鲁壹点 胡晓雪 李国栋9月26日,2025潍坊纺织服装产业国际精准对接活动在奎文区成功举办,本次活动以“我帮企业组主场·我为企业找订单”为主题
2025-09-27 22:22:00
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00