哪个GPT效果好？

Claude2

道德感极强，几乎在任何情况下都不会说脏话，即便是你要求它说脏话
Prompt工程的可操作范围很低。随口说一句的prompt+范例的效果并不比精心设计的prompt+范例差多少
智力基本上是介于ChatGPT和GPT4之间
对文本的理解力胜过ChatGPT、甚至很多时候胜过GPT4
支持100k的超长上下文，配合合理的prompt，直接输入你的笔记可以直接写出来一篇质量不错的长文章。
英文状态的智力远远高于中文状态的智力，但是知识水平上中英文差别不大。

ChatGPT

道德感不如Claude2强，可以通过prompt让其说脏话
prompt工程的可操作性很强，出神入化的prompt有可能可以让它在实际的工程中有胜过claude2的效果
智力不如claude2
但是语言能力比claude2强太多了太多了，翻译任务最好是chatGPT
英文状态的智力比中文状态略高

GPT4

智力极高
速度非常慢，即便是POE订阅，速度也远远慢于Claude2和ChatGPT
prompt工程的可操作性极强，优质的prompt可以让它在绝大多数工作中超过claude2
非常非常善于撰写大纲，这个能力配合Claude2以及自己的笔记库也许可以实现自动化的文章撰写
翻译水平比chatGPT好，但是也没有好很多。
坊间传闻New Bing的创造力模式是GPT4，但是这个事情有待考证。
英文状态的智力和中文状态的智力差不多。

NewBing

智力显著比chatGPT高，也比Claude略强
但是会拒绝执行某些任务，比如翻译
语法水平甚至比GPT4高，这点让我很困惑，因为按说如果按照普遍的传闻，NewBing应该是直接基于GPT4构建的，但是实测下来，发现NewBing在部分任务上比GPT4更强，而在某些任务上比GPT4更弱
逻辑能力不如GPT4
废话多，但是这却让它变得很适合写作
prompt工程的可操作性比GPT4差比Claude强，出神入化的prompt有通常可以让它在实际的工程中有胜过claude2的效果
进入八月以后，不管是NewBing还是GPT4，速度都大幅度的提高，这件事很奇怪

对于我来说，这几个模型都是各有优势。我的大部分任务都由Claude2完成，因为我的大部分任务都是文本总结并撰写，也就是我输入我的笔记以及范例并撰写一个大纲，由Cladue完成文章的撰写工作。翻译任务主要是ChatGPT完成，因为GPT4速度实在是太慢。GPT4-32K有时候会负责润色工作，因为速度非常慢所以一般是饭前把Claude2写出来的文章喂给它。

编辑于 2023-09-09 02:50

Published

7月 26, 2023

Category

Zhihu

Tags

Zhihu 213