• 我的订阅
  • 科技

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

类别:科技 发布时间:2023-07-13 05:54:00 来源:浅语科技

在OpenAI祭出GPT-4的API和“最强插件”代码解释器后,竞争对手显然坐不住了。

就在刚刚,Anthropic旗下Claude发布第二代——没错,就是被外界评价为GPT-4最强竞品的那一个。

浅划一下这次更新动作的重点:

免费,不用排队,自己用邮箱注册即可登录。

科技大佬们打起来真是妙啊,妈妈再也不用担心ChatGPT/GPT-4将我拒之门外后,打工或写作业时没有AI用了!

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

英伟达AI高级科学家JimFan火速尝鲜,并在推特上分享了自己的Claude2用户体验。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

关于JimFan老师谈到的Thingsyoushouldknow,量子位挑了些重点:

免费使用!

Claude2(100K上下文)比GPT-4-4K便宜了4-5倍。

实际可以支持20万token上下文,约15万个单词,输入一本书不在话下;不过现在只开放了10万token长度。

知识更新鲜,知识截止时间是2023年初,而GPT-4停在2021年9月;

可以将多个文档导入后,询问文档之间概念的关系,支持txt、pdf多种格式(ChatPDF之类的应用,危)

代码、小学数学能力,比初代Claude有所进步。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

国内AI博主海辛也在微博上惊讶连连。

因为上传自己的简历后,Claude2分析出了她的MBTI人格:

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

除了他们,第一波冲进网页体验Claude2的网友们已经在激情分享了自己的体验感:

不错子,和GPT-4-32k比,Claude2的回答更个性化~

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

于是乎,量子位先冲了一波网页对话,来看我们的人肉测验——咦,Claude更新了?注册一个试试

首先奉上最有节目效果的弱智吧Benchmark,给读者朋友们开开胃。

问的问题无外乎弱智吧的典中典,譬如“咖啡算不算豆浆”“数据线可不可以暂存数据”之类的。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

看到Claude2一本正经地回答弱智吧问题,就会发现AI还是太单纯了,看不出人类的小心机。

不过正经地看,这些回答倒也没毛病。

上面的两个问题算Claude2顺利过关,那么如果提问一些更无厘头的问题呢?

问,玉皇大帝到底住在九重天的哪一层?

答,从立足点来看,玉皇大帝所在的天庭,应该处于平流层,因为“这更符合天庭圣洁的定位”。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

当然,没有人能评判这个回答到底对还是错,但至少Claude2的这一通分析,还算有理有据。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

开胃小菜就展示到这里,下面上正餐!

长文档是本次更新的一大亮点,这一点已经被推特网友们惊呼鹅妹子嘤了。

比如上传两个pdf,可以看到,Claude2可以从两个pdf文档中做出摘要,这两个文档一个关于“语言流变模式”,一个关于“对称性”,并且将文档内容分点列在对话框中:

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

此前,量子位就出过让初代Cladue-100k版本在20秒速通92页论文的攻略《白嫖GPT-4最强竞品!》。

不只是较大的文档,根据Claude2开放的10万token的上下文来看,一次性上传一本书让它读,也是小菜一碟。

对普通用户来说,现在不仅能够上传长文档,还可以用上传的文件构建自己的知识库,对Claude翻阅文档后进行回答,真的是非常实用。

以至于内心出现一个疑问,会不会在ChatGPT摊薄Jasper、Notion等公司的蛋糕后,Claude也要对ChatPDF类工具下手了?

最后,我们为大家奉上今天的餐后甜点:让Claude2来写个程序试试。

为了考验Claude设计算法的能力,我们选择了一种古典密码,让它试着写个解密程序出来。

这种密码叫做维吉尼亚密码,可以理解成二维的凯撒(位移)密码,其中包括密钥。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

举个例子说明一下它的算法:

假如明文是B,密钥是C,B是字母表中第二个,那么从C开始数的第二个字母D就是密文。

如果数到了Z,就重新从A开始接着数,密钥长度不足时则进行循环。

解密自然就是把加密过程倒过来。

Claude输出了这样的代码(C++,下同):#include #include using namespace std; string decryptVigenere(string ciphertext, string keyword) { string plaintext; int keywordIndex = 0; for (int i = 0; i < ciphertext.length(); i++) { int p = (ciphertext[i] - 'A') - (keyword[keywordIndex] - 'A'); p = (p + 26) % 26; plaintext += (char)(p + 'A'); keywordIndex = (keywordIndex + 1) % keyword.length(); } return plaintext;}int main() { string ciphertext; cout << "请输入密文:"; cin >> ciphertext; string keyword; cout << "请输入密钥:"; cin >> keyword; string plaintext = decryptVigenere(ciphertext, keyword); cout << "明文是:" << plaintext << endl; return 0;}

我们把“CHATGPT”用密钥“CLAUDE”进行了加密,密文是“ESANJTV”,并尝试用Claude给出的程序解密。

一次就成功了,看来Claude的代码能力的确没让我们失望。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

这个问题可能有些简单,我们再加大难度试试。

我们试着从LeetCode中找了一道中等难度的问题,人类解这道题的通过率大概是60%。

给定一个长度为n的整数数组height。有n条竖直的线,第i条线的两个端点是(i,0)和(i,height[i])。找出其中的两条线,使得它们与x轴共同构成的容器可以容纳最多的水(容器不能倾斜)。返回容器可以储存的最大水量。

这样说可能不那么容易想象,下面的这张图或许更加直观:

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

原题中给出的示例一共有9条线,高度分别为“1,8,6,2,5,4,8,3,7”,相应的最大水量是49。

我们给Claude2的Promot是酱婶儿的:

写一个C++程序解决这个问题,不要自己设定初始值,让用户输入:(接上面的问题)

Claude2给出了这样的答案:#include #include using namespace std;int maxArea(vector& height) { int max_area = 0; int n = height.size(); for (int i = 0; i < n; i++) { for (int j = i + 1; j < n; j++) { int width = j - i; int h = min(height[i], height[j]); max_area = max(max_area, width * h); } } return max_area;}int main() { vector height; int input; cout << "请输入一系列整数:" << endl; while(cin >> input) { height.push_back(input); } cout << "最大面积为: " << maxArea(height) << endl; return 0;}}

我们没让Claude2专门调整输入和输出格式,所以没有提交给LeetCode,而是直接运行的。

用的数据也是上面提到的,结果表明,Claude2给出的代码至少在核心算法上是正确的。

(下图输入中的a是告诉CPU这一系列整数输入完了,可以替换成任意非数字字符)

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

看来这个问题也没能难倒Claude2。

除了代码,Claude2据称还拥有小学级别的数学水平。

那就顺便用经典的鸡兔同笼问题考一考它(这道题是ChatGPT出的):

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

反复尝试了很多次,虽然方程式列得没有问题,但Claude2解出的答案都是20(正确答案应该是40)。

看来计算这种事,对Claude2来说还是有点困难。

有关这次更新的更多信息,可以看下Anthropic的宣传片:与OpenAI“撕”出来的AI公司

见识过Claude2的表现后,那就不得不提一下背后的公司Anthropic,毕竟真的有点意思。

Anthropic自称是一家AI安全公司,且具有公益性(PBC)。

眼下,它和OpenAI同样将重心放在生成式AI上。1月份,公司在市场上已经有50亿美元估值。

Anthropic由OpenAI前研究副总裁DarioAmodei带领10名员工创业,于2021年成立。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

这里面既有GPT-3首席工程师TomBrown,也有OpenAI安全和政策副总裁DanielaAmodei(Dario的姐姐),可以说是带走了相当一批核心人才。

出走成立新公司的原因之一,自然是对OpenAI现状并不满意。

从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞研究,而且将技术授权给微软,甚至为微软自己的投资活动筹集资金。

这与OpenAI创立的初衷相悖,一批员工便想到了离职创业。

当然,还有一部分原因是这群人想做能控制、可解释的AI,说白了就是先搞明白AI模型背后的原理,从而在提供工具的同时设计更多可解释的AI模型。

于是,在OpenAI彻底变成“微软揽钱机器”后,他们便从这家公司离开,创办了Anthropic。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

现如今,微软真的和OpenAI有了“深度绑定”的味道。

然而既狗血又八卦味十足的事情是,今年2月,谷歌CEO劈柴哥重磅宣布,斥资3亿美元,投的就是Anthropic。

之所以被外界抱以厚望,称呼Claude2为GPT-4最强竞品,不仅仅是因为Claude实测下来体验确实位于第一梯队,还因为背后实力强大的“爸爸们”:

今年5月,该公司表示筹集了4.5亿美元,使Anthropic筹集的资金总额超过10亿美元。

在谷歌入股之前,Anthropic就已经获得了多位大佬的投资,如Skype创始人JaanTallinn,Facebook联创DustinMoskovitz,谷歌前CEO、现技术顾问EricSchmidt等人。

现在,合作伙伴列表里除了Zoom和 Notion.AI,还多了 Jasper.AI 的名字。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

不仅如此,公司核心技术ConstitutionAI也备受瞩目。

它主要围绕“语言模型如何决定它将涉及哪些问题以及它认为哪些问题不合适?为什么它会鼓励一些行动而阻止另一些行动?语言模型可能具有哪些价值?”展开。

为了解决上述问题,它让AI尽可能遵循很多原则。

原则条目有很多,包括联合国宣言、Anthropic从研究中自己发现的原则,DeepMind在Sparrow研究中提出的原则,甚至还借鉴了苹果的服务条款。

并且是通过AI反馈的方式,来评估输出,应对目前AI的缺点。具体体现在AI训练过程中,分为两个阶段:

第一阶段,模型被训练使用一套原则和一些过程的例子,来评估和修改自己的反应;

第二阶段,模型通过强化学习进行训练,使用基于原则集的AI生成的反馈来选择和输出更无害的内容。

chatgpt最强竞品重磅升级,免费可用,第一手实测在此

这一点与ChatGPT的的杀手锏RLHF(人类反馈强化学习)大相径庭,而Anthropic给出的解释是:

基于ConstitutionAI的强化学习,比从RLHF中强化学习得出的生成内容,更有用,且更无害。

并且,还更容易规模化。

在这套ConstitutionAI,迭代到2.0的Claude,确实在导入文件、上下文窗口理解等功能方面,比GPT-4更引人注目。

不过也不是完美的,比如GRE考试成绩上,Claude2就5局3败,输给了GPT-4。

但不可否认,巨佬们在AI方面你追我赶的局面,让本普通用户切切实实感受了一波渔翁得利的快乐,嘻嘻嘻(狗头)。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-13 09:45:33

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

钉钉“魔法棒”实测来了!生成文案、拍照生成程序、打工人不需再“爬楼”
...识别图案/文字,并且生成相应的应用。拍照生成应用 在实测中,对简单的投票统计、调查问卷的文字生成指令,钉钉“魔法棒”都在数秒内就生成完毕,若是拍照识别则需要十余秒,且识别结
2023-06-01 09:55:00
有道词典文档翻译免费权限升级24倍
...户享受到流畅翻译的便利,有道词典将文档翻译免费权限重磅升级至此前的24倍,面向所有用户每年开放240万字符的免费翻译权益。对职场、学术科研、学生等各类用户来说,每年获取240
2023-03-14 17:14:00
16GB/32GB内存笔记本对比实测:16GB不够用了
...真正重度体验上是否有无差距。16GB内存在重度应用中的实测表现在当前日常办公中,多开软件已经成为了一种常态,大V本人测试过程中
2023-06-09 16:41:00
...、源头数据真实,为综合评估该区玉米单产提供了真实的第一手佐证资料。本次玉米的实地测产培训只是全面开展秋收粮食实割实测工作的一个开始,接下来,该区还将开展水稻的实割实测。据了解
2023-10-08 17:15:00
致力解决生产实际问题
...展到最终击穿的电、磁、声数据。“通过真型试验获得的第一手数据,能够真实再现变压器放电的发展规律,对主动防御装置保护策略制定、阈值选取都具有重要意义。”团队骨干穆卡介绍说。依托
2024-04-26 01:30:00
...、记忆四项能力,为通用人工智能带来曙光。会上,百度重磅发布文心大模型、飞桨平台、AI原生应用如流等一系列技术、产品及生态成果。得益于飞桨产业级深度学习开源开放平台和文心大模型
2023-08-21 07:34:00
全球文档处理容量第一ai应用:通义千问
3月22日消息,阿里通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,
2024-03-24 01:44:00
vivo蓝心小v是如何实测的?
...贴等操作,效率提升明显。 文字识别可能不算难事,在实测中,我发现蓝心小V还能读懂图片里的内容,比如直接让它查找海边的照片、吃火锅的照片,当然,就算增加一些更复杂的条件,比如
2023-11-02 01:18:00
永久免费版+高额赠费,环信「着陆」计划重磅发布!
环信一直致力于提供稳定、安全、易用的即时通讯云服务,10年来积累了40余万开发者,我们提供了永久免费版、专业版、旗舰版等版本。如果您希望从第三方切换接入环信的 IM 服务,欢迎了
2023-08-07 19:00:00
更多关于科技的资讯: