哪个GPT效果好?

Claude2

  • 道德感极强,几乎在任何情况下都不会说脏话,即便是你要求它说脏话
  • Prompt工程的可操作范围很低。随口说一句的prompt+范例的效果并不比精心设计的prompt+范例差多少
  • 智力基本上是介于ChatGPT和GPT4之间
  • 对文本的理解力胜过ChatGPT、甚至很多时候胜过GPT4
  • 支持100k的超长上下文,配合合理的prompt,直接输入你的笔记可以直接写出来一篇质量不错的长文章。
  • 英文状态的智力远远高于中文状态的智力,但是知识水平上中英文差别不大。

ChatGPT

  • 道德感不如Claude2强,可以通过prompt让其说脏话
  • prompt工程的可操作性很强,出神入化的prompt有可能可以让它在实际的工程中有胜过claude2的效果
  • 智力不如claude2
  • 但是语言能力比claude2强太多了太多了,翻译任务最好是chatGPT
  • 英文状态的智力比中文状态略高

GPT4

  • 智力极高
  • 速度非常慢,即便是POE订阅,速度也远远慢于Claude2和ChatGPT
  • prompt工程的可操作性极强,优质的prompt可以让它在绝大多数工作中超过claude2
  • 非常非常善于撰写大纲,这个能力配合Claude2以及自己的笔记库也许可以实现自动化的文章撰写
  • 翻译水平比chatGPT好,但是也没有好很多。
  • 坊间传闻New Bing的创造力模式是GPT4,但是这个事情有待考证。
  • 英文状态的智力和中文状态的智力差不多。

NewBing

  • 智力显著比chatGPT高,也比Claude略强
  • 但是会拒绝执行某些任务,比如翻译
  • 语法水平甚至比GPT4高,这点让我很困惑,因为按说如果按照普遍的传闻,NewBing应该是直接基于GPT4构建的,但是实测下来,发现NewBing在部分任务上比GPT4更强,而在某些任务上比GPT4更弱
  • 逻辑能力不如GPT4
  • 废话多,但是这却让它变得很适合写作
  • prompt工程的可操作性比GPT4差比Claude强,出神入化的prompt有通常可以让它在实际的工程中有胜过claude2的效果
  • 进入八月以后,不管是NewBing还是GPT4,速度都大幅度的提高,这件事很奇怪

对于我来说,这几个模型都是各有优势。我的大部分任务都由Claude2完成,因为我的大部分任务都是文本总结并撰写,也就是我输入我的笔记以及范例并撰写一个大纲,由Cladue完成文章的撰写工作。翻译任务主要是ChatGPT完成,因为GPT4速度实在是太慢。GPT4-32K有时候会负责润色工作,因为速度非常慢所以一般是饭前把Claude2写出来的文章喂给它。

编辑于 2023-09-09 02:50

Published

Category

Zhihu

Tags