• 我的订阅
  • 头条热搜
Oracle四季度125亿美元销售合同背后:OpenAI用上Oracle云,模型推理或是关键
...系没有变化,与OCI的合作是,基于OCI使用Azure AI平台进行推理和其他需求。”不过,这并不影响Oracle仍需构建大规模数据中心,以支撑来自OpenAI的工作负载。据Oracle董事长兼首席技术官拉里·埃里森(Larry Ellison)在业绩会上解释...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单...……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级
...型的“专业教材〞,供大模型训练学习,也能让大模型在推理中随时“翻阅”。这些“专业教材〞,是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。以医疗行业为例,蚂蚁即将发布的“百灵医疗领域大模型”,背...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...加速卡等。相比于通用服务器,AI服务器更适应AI训练和推理的大算力、高并发、大数据流转等需求,已经成为大模型时代的“香饽饽”。以热门AI服务器型号浪潮NF5688M6服务器为例,某代理商在电商平台上挂出125万元的价格,这...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...等工具如何为部署模型提供支持,助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解,细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火,也带火了背后的 DiT(扩散 Transformer)...……更多
点亮合同管理未来 江西移动率先发布合同解析大模型
...移动江西公司与中国移动信息技术中心引入能力中台磐智推理平台能力,利用通义千问-72b大模型为基础,开发出一套合同解析系统。该系统通过大数据技术提高了合同文本识别的准确性,将识别准确率提升至92%,并能智能提取56...……更多
字节、阿里云、百度大模型价格混战:低价背后是数据竞争,爆款尚未出现
...云事业部总裁刘伟光表示:“阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计2024年大模型API的日调用次数有望突破100亿。”上周,字节跳动刚刚高调入局大模型战场,豆包主力模型在企业市场的定价...……更多
五大数字员工已上岗!讯飞星火让每个岗位都用上大模型
...面的升级迭代,在文本生成、语言理解、知识问答、逻辑推理、数学能力已经超越GPT-4 Turbo。与此同时,为了让企业直观感受到大模型对于这些场景的提质增效效果,科大讯飞在MWC上同步亮相了基于星火V4.0打造的企业智能体,真...……更多
CPU,正在被AI时代抛弃?
...以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大模型对...……更多
浪潮通软应邀参加“海右论道”智库沙龙,共话AI大模型发展机遇
...务。智能对话平台基于浪潮海岳大模型的语言理解、逻辑推理、内容创作等可持续演化的能力,打造了智能对话平台,具备知识管理、技能管理、多轮对话、对话策略等核心功能,支持常见问题问答、文档问答以及任务型处理等...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
对话律师和心理咨询师:使用过ChatGPT后,我反而不担心自己的工作被它取代了
...者和创意工作者的工作。”但也有研究发现ChatGPT在逻辑推理、非文本推理和常识推理等10个不同的推理类别中平均准确率为64.33%,ChatGPT并非可靠。牛津大学计算机科学系的研究结果表明,ChatGPT的数学能力明显低于普通数学研究...……更多
chatgpt低成本复现流程来了
...。相比原生PyTorch,单机训练速度最高可提升 7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量 3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
手机市场深陷泥沼,厂商如何破冰?
...4位量化技术,实现精度不掉点效果下更优的性能,通过推理引擎的加速,以及芯片硬件加速的方式,更是成为行业首个端侧应用的70亿参数的模型。基于来自端侧的70亿大模型参数,FindX7能够实现比其他手机更快速的大模型响应...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略,不仅是对当前市场的一次重大推动,更是对未来商业智能化转型的一次深远布局。阿里云智能...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...,因此它们一直被诟病生成的回答是基于概率,而非基于推理。这也就意味着,在当前的AI热潮中,这些模型架构可能无法幸存下来。毕竟,由于发展速度太快,如今的LLM寿命相对较短。昨天还炙手可热的模型,一两周后可能就...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
李彦宏:进一步提升“文心一言”产品采用率
...始人、董事长兼首席执行官李彦宏透露,百度文心大模型推理成本已降至1%。李彦宏表示,自发布以来,百度不断降低文心大模型的推理成本,“文心一言”3.5版本的推理成本是3.0版本的1%。通过推理成本的不断降低,越来越多...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...占绝对大头的因素——算力。 现在提及大模型的训练和推理,很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势,但它所存在“硬伤”也是比较明显,那便是供应不足、价格昂贵。何以破局?国产大模...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
...云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。随着A...……更多
...话会上还表示,自发布以来,百度不断降低文心大模型的推理成本,目前已降低至去年3月版本的1%。随着推理成本的降低,越来越多的用户和企业开始使用文心大模型。百度2023年年报显示,2023年百度实现总营收1345.98亿元,归属...……更多
AI行情再度席卷而来,机构看好这三个细分赛道丨ETF观察
...题。此外,AI模型升级迭代的背后是对海量数据的训练和推理,2012年以来全球算力需求快速增长,但算力服务器集群之间的数据交换需要数据中心内部的网络互联做配套,从而激发出对高速率光模块的大量需求,推动光模块行业...……更多
大模型价格战“卷”向何方?|深度
...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制,推理时只激活部分专家,以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2,就是其通过架构创新,实现了大模...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
更多关于财经的资讯:
广东首次赴港发行地方政府债券
本文转自:人民日报海外版《 人民日报海外版 》( 2024年09月11日 第 04 版)本报香港9月10日电 (记者冯学知)广东省人民政府2024年离岸人民币地方政府债券路演9日在香港金融管理局举办
2024-09-11 05:44:00
生态酿造 品牌竞争 消费多元
本报讯(记者 申川 张秀云)第十三届中国(贵州)国际酒类博览会2024世界酒业发展峰会9月9日在贵阳举办,多位参会嘉宾发表了对酒类高质量发展的思考和建议
2024-09-11 06:11:00
推进节能降碳 建设美丽山西
本文转自:人民日报“十四五”以来,山西单位GDP能耗累计下降10.9%推进节能降碳 建设美丽山西——写在2024年太原能源低碳发展论坛举行之际本报记者 何 勇 付明丽 马睿姗晋南钢铁集团的氢能重卡
2024-09-11 06:19:00
大型物流中心助力医药行业快速发展
昨天,位于六合经济开发区的安博南京六合物流中心内,不少货车停靠在卸货口装卸货物。该项目占地约10万平方米,紧邻宁洛高速
2024-09-11 06:36:00
全省上市公司整体经营质量不断提升
贵州日报天眼新闻记者 申川截至8月31日,贵州辖区各上市公司均已按时披露2024年半年度报告。数据显示,贵州上市公司持续保持整体向好态势
2024-09-11 06:42:00
· 中国旅游研究院发布三个入境旅游优选项目
中新社合肥9月10日电 (张强 刘鸿鹤)2024年入境旅游高质量发展大会10日在安徽合肥举办。会上,中国旅游研究院(中国文化和旅游部数据中心)发布了入境游客喜爱的十个景区度假区
2024-09-11 07:50:00
利来智造IPO分析来源|时代投研作者|雷映编辑|孙一鸣面对超5亿元短期债务资金缺口,苏州利来工业智造股份有限公司(下称“利来智造”)的压力不容忽视
2024-09-10 23:14:00
招商局集团和中国平安合资的地方资产管理公司“一把手”调整。9月10日,招商平安资产管理有限责任公司(下称招商平安资产)发布公告称
2024-09-10 23:45:00
工程机械龙头遇股东及董监高“组团”减持。9月10日,三一重工(600031)在上证e互动平台表示,本次减持计划系股东根据自身资金需求自主决定
2024-09-10 23:45:00
2024年9月10日“大众30”成份股报告
“大众30”11日调仓换股本报讯(记者 汤晓飞)周二,沪深A股探底后震荡回升,林业、银行、石油化工等板块领涨,旅游、酒店餐饮等板块走势较弱
2024-09-10 23:48:00
今年上半年重庆建筑业总产值达4750.2亿元
9月9日—11日,重庆市建筑业暨房地产业“渝水天山 同心共建”展示推介活动在新疆举行。会上信息显示,今年上半年,重庆全市建筑业总产值达到4750
2024-09-10 17:40:00
哈尔滨宾洲村镇银行原行长高雪松被通报
9月10日,中央纪委国家监委网站通报,为进一步严明纪律规矩、强化警示教育,突出常态长效深化落实中央八项规定精神,营造风清气正的节日氛围
2024-09-10 17:58:00
当地时间9月10日,欧洲最高法院裁定苹果在爱尔兰税收案中败诉。苹果当天盘前股价下跌约1%。苹果与欧盟就爱尔兰税务问题已经展开了长达10年的“拉锯战”
2024-09-10 17:58:00
又有多地出手稳楼市。9月10日,甘肃庆阳出台激活房地产投资和消费的措施,除了降首付降利率、提高公积金贷款额度外,还提出取消新建商品住房销售价格备案
2024-09-10 20:29:00
9月以来,多家银行消费贷再推新一轮优惠,最低消费贷利率再下行。其中,诸如宁波银行、招商银行部分分行等消费贷最低利率可至2
2024-09-10 20:29:00