从四个角度全面认识 ChatGPT

在这里插入图片描述

当下最引人注目的语言模型 ChatGPT 如火如荼，主要还是因为其能力远远超越了传统模型。本文将对 ChatGPT 与传统模型进行对比，深入探讨 ChatGPT 具备的强大能力以及其背后的技术来源。此外还将介绍面对大语言模型时代我们应该如何去做。

传统语言模型是什么样的？

传统语言模型的实现机制其实很简单，我们可以将它理解为“文字接龙”，当我们输入一个词之后，模型会帮我们去预测下一个词是什么，将这两个词拼接之后继续预测，如此往复就形成了一段一段的整句对话。

那么语言模型究竟是如何学会人类语言机制的呢？当我们向它询问某一个问题时，这个问题就作为了语言模型的输入内容，同理它会去预测下一个单词或字符。每一组这样的数据组合都可以称为一个范例，当这样的范例足够多以后，大预言模型就会涌现出一个新能力：泛化。也就是说同一个问题，它可以自行拓展，比如说我们问：“床前明月光的下一句是什么？”模型回答“疑是地上霜”，这是正确答案。那么这时候如果将问题稍微拓展：“床前明月光的后续内容是什么？”模型也可以理解并处理，这就是所谓的泛化能力。当然这个能力是需要一个长期的训练过程和大量的数据作为支撑的。

过去一直以来的语言模型都是遵循以上机制的，讲的直白一点其实就是一个“文字接龙”机器，你问出的问题它会有对应的答案，即使换个问法可能也是该答案。相信每个人都体会到过某宝/某多/某东的机器人客服，你问一个问题它是这么回答的，换个问法它还是同样的话术，就说气不气。事实上这样的产品就是传统语言模型的典型代表。

ChatGPT 涌现出了哪些新能力？

在 ChatGPT 出世以后，与传统语言模型完全不一样了，ChatGPT 给我们的感觉就是它可以像真人一样和人正常聊天，回答各种各样的问题，甚至能理解人的感情… 很多全新的能力涌现了出来。

第一 ChatGPT 好像 全世界的知识它都会，上知天文下知地理，我们可以向它提问各领域的知识，让它帮我们写代码、写稿子等等。

case1：让 ChatGPT 讲解量子力学知识
插图（提问ChatGPT）
case2：让 ChatGPT 讲解天文学知识
在这里插入图片描述
case3：让 ChatGPT 帮我们写一段 python 代码，调用 ChatGPT

python 语言调用 ChatGPT 模型代码如下：

import openai

def chat_with_gpt(prompt):
    # 设置你的OpenAI API密钥
    openai.api_key = 'YOUR_API_KEY'

    # 调用ChatGPT进行对话
    response = openai.Completion.create(
        engine='text-davinci-003',
        prompt=prompt,
        max_tokens=100,
        temperature=0.7,
        n=1,
        stop=None,
        temperature=0.7,
        top_p=1,
        frequency_penalty=0,
        presence_penalty=0
    )

    # 获取模型的回复
    reply = response.choices[0].text.strip()

    return reply

# 提示用户输入对话的起始语句
user_input = input("请输入你的问题或对话的起始语句：")

# 调用ChatGPT进行对话
gpt_reply = chat_with_gpt(user_input)

# 打印模型的回复
print("ChatGPT回复：", gpt_reply)

第二 ChatGPT 具有 接受“被催眠”的能力，所谓“被催眠”，就是当我们不停的告诉 ChatGPT 它是谁、它的特长是什么、它应该做什么事时，它自己就会开始按着这个逻辑去思考。当下的新型职业提示工程师就是基于此能力。

第三 ChatGPT 具有 复杂的推理能力，按道理来说“推理”应该是只有人才能做到的事情，但是现在 ChatGPT 也具备此能力，它也可以根据语义自行推理。

case4：输入一个公考推理题，让 ChatGPT 来解答
在这里插入图片描述
第四 ChatGPT 具有 中立、客观、安全的语言表达能力，当我们询问问题时，ChatGPT 的回答往往是准确客观且非常具有条理性的，同时它也会在一些涉及不良影响的问题上拒绝回答。

case5：询问当下最具潜力的创业项目
在这里插入图片描述

这些能力都是怎么做到的？

ChatGPT 能懂得全世界几乎所有的语言，是以海量的知识和数据作为基础的。简单来说就是将近乎所有的语料（文本）送进大语言模型当中，然后让它去预测下一个词汇是什么，与传统语言模型不同的点在于 ChatGPT 接触的预料数据是极其庞大的。下面这张表是 ChatGPT 历代版本的学习资料与模型大小：

OpenAI	学习资料	参数量
GPT1	5GB	1.17亿
GPT2	40GB	15亿
ChatGPT	45TB+	1750亿+

从始至终语言模型的训练机制都没有变，变的只是模型的量级。俗话说“量变引起质变”，相较于传统语言模型，ChatGPT 便是一个质的改变。

ChatGPT 的复杂推理能力源于“分治思想”，将一个大问题分解为一个个的小问题，逐步解决。

为语言模型灌输知识以及其“分治”的问题处理方式，这也就是我们常说的预训练。但是预训练之后也产生了一个问题：由于预训练接触了太多的数据信息，导致模型的回答没有约束，什么都说，不管好的还是不好的！

所以接下来就需要对语言模型进行规范、矫正，让它可以按照我们期望它输出的样子进行输出。具体的方式就是将一大堆人工标注好的范例输入到语言模型当中，这里所说的“人工标注好的范例”是指人为处理过的一些数据，包括答题要求和标准答案等。通过这些范例的大量输入告诉 ChatGPT 应该如何回答。

经过以上三个方面的训练之后，ChatGPT 就已经可以很规范的回答我们的问题了。当然至此想让它具有中立、客观、安全的语言描述能力还是不够的，还需要对 ChatGPT 进行最后的创意引导，具体的做法就是让任何用户对它进行自由提问，然后 ChatGPT 无干预的自由回答，最后人工告诉它哪个回答的好，哪个回答的不好，并分别给予奖励/惩罚。这些做法是在规范 ChatGPT 的表现，使它尽可能的作出符合人类认可的回答。

综上，ChatGPT 大语言模型的训练过程为：预训练→模板规范→创意引导。正是这三个步骤，再基于超大规模的数据造就了今天的最强语言模型 ChatGPT。

在 ChatGPT 大模型时代，我们应该怎么做？

万物都是有两面性的，拥有强大能力的 ChatGPT 也无可避免的存在着一些缺陷：

可能会胡编乱造；
可能会混淆，把一个人身上的事情用到另一个人身上；
无法直接操作，我们没有办法像操作数据库一样去操作它；
还存在一定的安全隐患，如某些机密性的信息；
更新效率低；
无法把语言和现实进行映射。

即使再强，也还有着很大的优化空间。事实上目前还有不少人对 ChatGPT 存在着抵触心理，因为在他们的认知中，ChatGPT 会造成大量的人员失业甚至是替代人类。但我想说的是“ChatGPT 并不会让你失业，熟练使用 ChatGPT 的人才会让你失业”。我们应该做的是拥抱科技、拥抱 ChatGPT，接受它并优化自己的学习方法，终身学习。

只有我们自身加入到科技发展的进程中，才不会被科技发展所淘汰。