哪个GPT效果好?
Claude2
- 道德感极强,几乎在任何情况下都不会说脏话,即便是你要求它说脏话
- Prompt工程的可操作范围很低。随口说一句的prompt+范例的效果并不比精心设计的prompt+范例差多少
- 智力基本上是介于ChatGPT和GPT4之间
- 对文本的理解力胜过ChatGPT、甚至很多时候胜过GPT4
- 支持100k的超长上下文,配合合理的prompt,直接输入你的笔记可以直接写出来一篇质量不错的长文章。
- 英文状态的智力远远高于中文状态的智力,但是知识水平上中英文差别不大。
ChatGPT
- 道德感不如Claude2强,可以通过prompt让其说脏话
- prompt工程的可操作性很强,出神入化的prompt有可能可以让它在实际的工程中有胜过claude2的效果
- 智力不如claude2
- 但是语言能力比claude2强太多了太多了,翻译任务最好是chatGPT
- 英文状态的智力比中文状态略高
GPT4
- 智力极高
- 速度非常慢,即便是POE订阅,速度也远远慢于Claude2和ChatGPT
- prompt工程的可操作性极强,优质的prompt可以让它在绝大多数工作中超过claude2
- 非常非常善于撰写大纲,这个能力配合Claude2以及自己的笔记库也许可以实现自动化的文章撰写
- 翻译水平比chatGPT好,但是也没有好很多。
- 坊间传闻New Bing的创造力模式是GPT4,但是这个事情有待考证。
- 英文状态的智力和中文状态的智力差不多。
NewBing
- 智力显著比chatGPT高,也比Claude略强
- 但是会拒绝执行某些任务,比如翻译
- 语法水平甚至比GPT4高,这点让我很困惑,因为按说如果按照普遍的传闻,NewBing应该是直接基于GPT4构建的,但是实测下来,发现NewBing在部分任务上比GPT4更强,而在某些任务上比GPT4更弱
- 逻辑能力不如GPT4
- 废话多,但是这却让它变得很适合写作
- prompt工程的可操作性比GPT4差比Claude强,出神入化的prompt有通常可以让它在实际的工程中有胜过claude2的效果
- 进入八月以后,不管是NewBing还是GPT4,速度都大幅度的提高,这件事很奇怪
对于我来说,这几个模型都是各有优势。我的大部分任务都由Claude2完成,因为我的大部分任务都是文本总结并撰写,也就是我输入我的笔记以及范例并撰写一个大纲,由Cladue完成文章的撰写工作。翻译任务主要是ChatGPT完成,因为GPT4速度实在是太慢。GPT4-32K有时候会负责润色工作,因为速度非常慢所以一般是饭前把Claude2写出来的文章喂给它。
编辑于 2023-09-09 02:50