• 我的订阅
  • 科技

真香!智谱大模型,有了首个免费的API

类别:科技 发布时间:2024-08-28 09:43:00 来源:机器之心Pro

真香!智谱大模型,有了首个免费的API

大模型API,正式进入Flash时代。

最近一段时间,国内外的大模型行业卷的是「快速版」。

5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推出了 Mini 版,号称比当前最为先进的小模型能力更强,价格更低。

如果你现在访问 ChatGPT,会发现原来的默认模型 GPT-3.5 已经消失,新的默认选项就是 GPT-4o mini。自 2022 年底一直沿用的 GPT-3.5 终于被取代了,这不禁让人们感叹 AI 技术进步速度之快。

真香!智谱大模型,有了首个免费的API

这一波技术迭代的背后,是直面应用的底层逻辑。新一代大语言模型继续保持多模态、长上下文等方面的性能优势,又因为速度和效率的大幅提升获得了更多开发者的青睐。

在实际应用场景中,新模型适用于处理高频次、相对简单的任务,禁得起人们的反复调用。现在想要开发一个使用生成式 AI 技术的产品,不再是一件难事了。

最近,国内大模型平台市场份额领先的智谱,也正式宣布了新模型,并提出了一系列提升 AI 开发效率的工具。

大模型开发便捷化

智谱此前已经上线了大模型的一键微调工具,这次更是决定将 GLM-4-Flash 免费。

智谱的最新版大模型 GLM-4-Flash 在 6 月份刚刚上线,在开放时 API 价格就已低至每 100 万 token 0.1 元,吸引了大量开发者使用。不论是国内还是国外,很多人都在社交网络上 po 出了自己的使用心得。

这款大模型 API 的能力如何?我们自己也上手试了试。

首先,要想调用大模型能力,有最简单的方法:通过 Python 脚本进行体验。智谱的官网上提供了一些示例,只需将其中的 api key 替换成自己的并修改其中的具体内容,就能很方便地使用这个大模型,比如可以在 VS Code 中使用它。

真香!智谱大模型,有了首个免费的API

当然,你也可以将其集成到任何支持 API 接入的应用之中。比如在这里,我们可以将其引入到笔记软件 Obsidian 中。选择 BMO Chatbot 插件,下载启用之后,我们进入其设置选项,找到 API Connections 下的 OpenAI。这里之所以选择 OpenAI,是因为 GLM-4-Flash 的 API 协议基本与 OpenAI 一致。

之后在 OpenAI-Based URL 中填入智谱的模型链接:https://open.bigmodel.cn/api/paas/v4/,并在 OpenAI API Key 填入我们需要使用的 key。为了使用 GLM-4-Flash 模型,你还需要修改该插件的 data.json 文件,将 glm-4-flash 加入到 openAIBaseModels 中。

这样你就可以将 GLM-4-Flash 引入到你的笔记工作流程之中,以下展示了部署好的示例,我们让 GLM-4-Flash 分析了一篇有关视觉语言模型的文章并让其建议了一些标题。

看起来效果都很不错。

另一方面,说到大模型微调,上周二 OpenAI 正式上线了大模型的微调功能,引发了 AI 领域的关注。

真香!智谱大模型,有了首个免费的API

OpenAI 的初衷,是帮助开发者能够低成本地构建个性化的应用。这次的智谱推出的大模型微调功能,也可以让我们通过微调工具,加入自身独有的场景数据,对平台提供的基础模型进行微调,快速使其定制化。这样做既符合了业务场景,也不需要进行复杂的调整或重新训练。

如果你认为基础模型无法满足复杂任务的需求时,使用微调可以获得更好的效果。微调可以让大模型表现出特定的风格,或是提高输出的可靠性,让大模型可以完成更加复杂的任务。

真香!智谱大模型,有了首个免费的API

智谱目前已开放了 GLM-4-Flash、GLM-4-9B 等模型的 LoRA 微调和全参数微调能力。在微调的过程中,你需要准备并上传训练数据训练大模型,尝试部署并评估结果,最后完成的模型也可以快速部署。

我们可以看到,如今各家大模型公司提供的产品,越来越贴近实际需求了。这些充分考虑开发者,能够用起来的工具,对于 AI 的大规模应用来说意义重大。

Flash 大模型意味着什么?

智谱提供的一系列新能力,背后作为支撑的基础都是 GLM-4-Flash 大模型。

GLM-4 大模型是智谱在今年 1 月推出的新一代基座大模型,它在十余项指标上逼近或达到了大模型标杆 GPT-4 的水准。与此同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。

真香!智谱大模型,有了首个免费的API

在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:

数据预训练:引入大语言模型进入数据筛选流程,使用 10T 高质量多语言数据进行了训练。 预训练技术:采用 FP8 技术进行高效预训练,显著提高了训练效率和计算量。 模型能力:GLM-4-FLASH 模型具备强大的推理性能,支持 128K 长上下文推理和多语言处理。 生成速度:输出速度高达 72.14 token/s,约等于每秒 115 个字符。

GLM-4-Flash 模型实测

GLM-4-Flash 模型已经在大量测试中展现了能力。

从模型界面来看,GLM-4-Flash 支持多轮对话、自定义系统指令构建(比如设定模型身份、任务目标)以及网页搜索、知识库搜索和函数调用等工具调用功能。

此外,用户也可以自由调整 GLM-4-Flash 对话窗口的最大 tokens 数量(输入上下文长度)、模型温度(控制生成的随机性和创造性)、top_p(控制回答风格,保证输出结果正确性的同时增加多样性)。

真香!智谱大模型,有了首个免费的API

体验地址:https://open.bigmodel.cn/

逻辑推理能力,从简单到复杂,包含一般逻辑推理和数学推理。

测试 1:先来一道前段时间让很多大模型翻车的「9.11 和 9.9 哪个更大」问题,很容易就答对了。

真香!智谱大模型,有了首个免费的API

类似的数字比较同样答对了。从解题思路来看,GLM-4-Flash 掌握了正确的小数位比较方法。

真香!智谱大模型,有了首个免费的API

而目前版本的 GPT-4o 全都翻车了。

真香!智谱大模型,有了首个免费的API

真香!智谱大模型,有了首个免费的API

测试 2:此前研究机构 LAION 在一项研究中发现,GPT-3.5/4、Llama、Gemini、Claude 和 Mistral 等大模型回答「爱丽丝(女性)有 N 个兄弟,有 M 个姐妹,那么爱丽丝的兄弟有多少个姐妹呢?」问题时,正确率非常低。

我们让 GLM-4-Flash 试了试,回答正确。

真香!智谱大模型,有了首个免费的API

改变了主角性别和亲属关系之后,GLM-4-Flash 同样可以理解,再次回答对了。

真香!智谱大模型,有了首个免费的API

测试 3:对于多人真假话判断问题,GLM-4-Flash 能够理清各种假设情况,并最终给出了正确答案。

真香!智谱大模型,有了首个免费的API

作为对比,GPT-4o 回答错误。

真香!智谱大模型,有了首个免费的API

函数调用能力,允许 GLM-4-Flash 调用外部函数或服务。

真香!智谱大模型,有了首个免费的API

网页检索能力,实时获取互联网最新信息。

比如 2024 巴黎奥运会中国体育代表团斩获金银铜牌的总数量,结果无误。

真香!智谱大模型,有了首个免费的API

还有代码生成、视频脚本制作、角色扮演、文章扩写等一系列能力,据说能力都不错。

通用化 AI 的应用,已经跑起来了

如今,GLM-4-Flash 已经上线两个月,人们都在用这款大模型做什么?很多人展示了自己的应用方向,或许能给我们带来一些启发。据介绍:

有生物学博士正在利用 GLM-4-Flash 模型处理复杂分子数据,大大提高了科研工作中数据处理的效率。通过 AI+Science,生物学和大模型的结合,我们可以探索基因序列与人类健康之间的深层联系; 有一群年轻科研人员正在使用 Flash 模型生成高质量数据材料。这些数据可以用于自身研究,也可以用于给其他领域的大模型进行训练; 有独立开发者发现 Flash 模型可用于高效翻译,开发出来的中英文翻译 APP 不仅提供翻译能力,还有互动学习模块。通过基于智谱大模型的 APP,小朋友可以在轻松愉快的环境下学习英语。这款 APP 已经帮助了大量学习者; 还有广告公司发现了 Flash 模型在内容创作上的巨大潜力。他们构建了应用对文章进行润色,帮助编辑和文案人员在创作过程中提升效率。AI 大模型可以联网获取最新信息,并提供创意灵感,保证了文案的质量和一致性。

看来,在速度更快,性能足够强大的 GLM-4-Flash 版本上,一些简单垂直,需要快速响应的应用已经得到了充分的验证。

不过对于通用的大模型来说,还有很多功能有待人们的发掘。

8 月 27 日,智谱 BigModel 开放平台正式宣布:GLM-4-Flash 全部免费,同时开启限时免费微调活动。

GLM-4-Flash 是智谱首次开放免费 API 的大模型,支持长度达 128K 的上下文。在用户调用量上,智谱做到了原有调用用户并发不变,新用户有两个并发,还可以申请进一步提高。

而在 GLM-4-Flash 微调赠送额度上,如果立即申请,你可以获得 500 万 token (3 个月)的训练资源包,限额 2000 位,先到先得。智谱还将开放 GLM-4-Flash 模型的微调权重下载,很快人们将可以自由选择部署平台。

这一系列行动,展示了国内大模型公司在应用层面的独特优势。在大模型技术对标国际先进水平的同时,国内 AI 的先头部队已经打磨好「内功」,通过系统优化大幅提升了推理效率。

现在,免费开放的大模型已经可以惠及广大开发者,让人不花一分钱就可以上线基于大模型的智能应用。

不论如何,是时候体验大模型的开发了,羊毛薅起来!

立即开始使用:https://www.bigmodel.cn/login?utm_source=1&utm_campaign=20240827&_channel_track_key=g0qAokQG

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-28 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

DeepSeek真香!华为等各大手机厂商纷纷接入
快科技2月8日消息,春节期间,名为DeepSeek(深度求索)的中国AI初创公司在不到30天的时间里先后发布DeepSeek-V3和DeepSeek-R1两款大模型
2025-02-08 20:46:00
“喜提”华为Pura70系列新机,速来解锁小艺“真香”新功能!
华为Pura70系列无疑是上半年最值得关注的影像旗舰机型。近期随着华为Pura70系列先锋计划的推出,已有不少用户“喜提”了这款期待已久的新机。除了卓越的影像性能和时尚的外观外,
2024-04-25 14:51:00
...AI大模型的革命,不一定要靠算力堆出来。是幻觉还是“真香”DeepSeek的小而精、强且美,是炒作出来的“幻觉”,还是厚积薄发而得的“真香”?自从在AI江湖中亮出名号,Dee
2025-02-28 10:48:00
...模型有收费有免费 开源代码是一种共享商报讯 免费的AI真香啊!从豆包、通义到Kimi、文小言,又到DeepSeek
2025-03-06 08:29:00
比起各式各样的AI应用 我们可能更需要AI for OS
...权。看到这里,大家可能会给出一个结论:AI for OS看起来真香,但市面上已经有的流派好像都差点意思。确实,在智能终端产业竞争激烈的今天,谷歌苹果微软这样的巨头,也不可能在
2023-06-08 15:15:00
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
在 ChatGPT 走红之后,本着「打不过就加入」的心态,很多职场人学起了 AI。但遗憾的是,不少人走了弯路,甚至还被某些「199」的课程割了韭菜。其实,学 AI 这事儿并不难。
2024-07-27 09:29:00
阿里云推新 “杠”上讯飞
...标用户节省1980元的支出。不管如何,先说一句,补贴“真香”。对标讯飞,听悟有何不同事实上,这不是猎云网第一次接触到听悟。在之前的云栖大会上,听悟就有内测版本,已经有离线语音
2023-06-02 17:45:00
百度智能云晒大模型落地成绩单:5个第一!
中国大模型平台市场第一!大模型应用落地元年,百度最新成绩单出炉——中国大模型市场份额第一 中国大模型产品布局第一 中国大模型产业落地规模第一 上半年中标数量/金额/行业覆盖数/央
2024-09-26 13:34:00
字节扣子模型广场,给AI大模型搭了一座擂台
...AI现象级应用呼之欲出2022年11月,GPT-3.5让人们见到了AI大模型的强大威力,AIGC百花齐放,文生文、文生图
2024-06-14 11:40:00
更多关于科技的资讯:
2025年以来,浙江深入实施“人工智能+”行动,抢抓人工智能发展的历史性机遇,开展人工智能赋能制造业试点,加快人工智能深度赋能千行百业
2026-02-09 17:14:00
“小皖”是如何练成的?
大皖新闻讯 安徽省第十四届人民代表大会第四次会议于2月9日上午在合肥正式闭幕。省两会期间,大皖新闻人形机器人记者“小皖”成为采访现场一道独特的风景线
2026-02-09 18:44:00
《电商消费维权指数2025年度暨第四季度报告》发布 结束连续3年增长态势 回落至正常波动区间
中国消费者报报道(记者桑雪骐)2025年,我国经济总量实现新跨越。消费特别是新兴消费,是我国经济增长的重要助推器。同时
2026-02-09 14:23:00
再度蝉联茶类目第一!八马茶业与京东用十四年“泡”出一壶共赢好茶
当八马京东旗舰店在京东超级品牌周期间再次以遥遥领先的销量蝉联茶类目第一,成交用户同比增长86%,这条从古老茶园到现代都市餐桌的数字化茶路
2026-02-09 14:48:00
全家等便利店全部接入,千问免单卡能买日用百货
春节临近,2月9日千问APP提示,“免单卡”可以买年货,不仅能买盒马、天猫超市,还能购买各大连锁商超和便利店的酒水零食
2026-02-09 15:00:00
以“智”提效 向“新”而行 | 威海银行智慧服务迈上新台阶
“以前办理大额存款得去柜台排队,现在智能柜台几分钟就能办好,还能开具存单,太方便了!”近日,客户刘先生在威海银行青岛路支行体验智能服务后评价道
2026-02-09 15:27:00
制作包装瓶、注油、压盖、加提手、装箱……在益海嘉里金龙鱼集团上海工厂的食用油包装车间,一整套流程在自动化生产线上顺畅运转
2026-02-09 16:33:00
华为应用市场7.0.1.300版本更新,支持远程守护功能
近日,华为应用市场迎来7.0.1.300版本更新,新增远程守护功能,用户可通过该功能与孩子或长辈建立安全守护关系,实现远程应用安装管理
2026-02-09 16:37:00
新闻多一点|国家信创园:在这里看见未来
2月9日上午,习近平总书记来到位于北京亦庄的国家信创园,了解信息技术应用创新和北京加快建设国际科技创新中心情况。为统筹创新资源
2026-02-09 16:44:00
国货焕新迎新春,洁柔以“几代人的陪伴”切入年货消费场景
春节临近,年货市场持续升温。近日,国货品牌中顺洁柔以一抹亮眼的“洁柔红”,在全国超2100家线下商超铺开新年主题陈列,并同步在线上发起话题营销
2026-02-09 16:54:00
秦皇岛市“一品一播”直播电商活动启动
河北新闻网讯(张辉)2月8日,秦皇岛市“一品一播”直播电商暨2026年网上年货节正式启动。该活动旨在通过“一个特色产品
2026-02-09 11:21:00
“一人成军”AI实战营苏城结营 厚植创新沃土培育智能开发新锐
江南时报讯 古韵今风交融的苏州,再次成为人工智能前沿人才培养的热土。2月7日,以“一人成军”为主题的AI智能体实战训练营在苏州湾中心广场举办
2026-02-09 12:35:00
全球互连芯片“第一股”!澜起科技港交所上市!
今天(2月9日)上午9:30,铿锵锣声再次敲响了春节前“开门红”,澜起科技股份有限公司(6809.HK)成功在香港联合交易所主板挂牌上市
2026-02-09 12:38:00
降本700万!焦作为企业开出“省电良方”
大河网讯 一场“诊断”,给企业节省了约700万的用电成本。近日,国网焦作供电公司联合焦作市发改委开展“电费诊断助企惠企”专项行动
2026-02-09 13:09:00
求职新场景火爆出圈,相城区今年首场“人才夜市”吸引41家企业参与
近日,相城区首场“人才夜市”火热开市,将传统夜市的烟火气与现代招聘的精准对接巧妙融合,在轻松愉悦的氛围中搭建起企业与人才高效互动的新平台
2026-02-09 12:32:00