
1.1.1 OpenAI大模型ChatGPT
ChatGPT是2022年11月30日由OpenAI团队发布的一款基于GPT-3模型的聊天机器人,它可以与用户进行自然和流畅的对话,并根据用户的输入生成各种有趣和有创意的文本。
ChatGPT的首页如图1-1所示,在界面顶部有两个选项:GPT-3.5和GPT-4。GPT-3.5是免费使用的,而GPT-4则需要个人支付20美元/月的费用。

图1-1 ChatGPT的首页
接下来,我们一起看看ChatGPT有哪些技能。先通过一个示例来体验一下ChatGPT回答问题的能力,如图1-2所示。

图1-2 使用ChatGPT回答问题
接下来体验一下ChatGPT写诗歌的能力,如图1-3所示。

图1-3 使用ChatGPT写诗歌
再体验一下ChatGPT写故事的能力,如图1-4所示。

图1-4 使用ChatGPT写故事
写诗歌、写故事,这些都是需要创意的任务,大模型可以轻松应对。接下来,我们通过一个示例来看看ChatGPT的改写能力,检验它能否支持改病句、造句,如图1-5所示。从结果可以看出,ChatGPT非常成功地完成了任务。

图1-5 使用ChatGPT改病句、造句
前面的例子已经证明了ChatGPT在完成自然语言理解(natural language understanding,NLU)任务方面有着非常优秀的表现,这是因为ChatGPT是一个强大的语言模型。但是如果说ChatGPT具有智能,那么它能否在推理任务方面也展现出同样的水平呢?让我们一起来通过一个解数学应用题的示例来验证它在推理任务方面的能力,如图1-6所示。

图1-6 使用ChatGPT解数学应用题
这是著名的“鸡兔同笼”问题,ChatGPT正确地解答了它。
ChatGPT还擅长编写代码、修复bug,示例如图1-7所示。题目是实现合并区间的功能,输入是多个区间,要求合并区间的重叠部分。

图1-7 使用ChatGPT编写代码
ChatGPT编写的代码,不但可以实现函数的功能,还能加入中文注释,使代码清晰易读。
ChatGPT不仅可以理解给定的程序代码的功能和逻辑,自动地检测并修复程序bug,而且还能给出详细的解释,说明为什么原来的代码是错误的,以及为什么修复后的代码是正确的。这样,用户不仅可以得到正确的程序代码,还可以学习一些编程知识和技巧。图1-8展示了一个示例:用户给出了一个用Python编程语言编写的函数,该函数的功能是在一个数组中查找最大值,并返回其下标。但是该函数中有两个错误,导致其无法正确地运行。ChatGPT成功地发现了这两个错误,并给出了正确的修复方法,同时还给出了清晰的解释,让用户明白了产生错误的原因。
虽然你已经从前面的例子中感受到了ChatGPT的强大能力,但是ChatGPT并不完美,尤其在数学推理任务方面,它还是会遇到一些困难的。例如,对于“在一个单位圆中随机扔石子,计算石子到圆心的期望距离”这个微积分问题,其正确答案是2/3,但是GPT-3.5给出的答案为1,如图1-9所示。

图1-8 使用ChatGPT修改程序bug

图1-9 GPT-3.5无法解决复杂的数学题
OpenAI在2023年3月发布了更强大的GPT-4,它是ChatGPT的升级版。目前,微软New Bing集成了GPT-4功能,用户可以通过聊天入口进入GPT-4页面。GPT-4在数学推理任务方面比GPT-3.5表现得更加优秀,能够正确地回答上述微积分问题,还能给出详细的解释,如图1-10所示。GPT-4能够理解和生成复杂的数学公式、逻辑推理和证明,甚至能够解决一些高中或大学水平的数学问题。可以说,GPT-4是目前最先进的大模型之一。

图1-10 GPT-4解决了ChatGPT答错的数学问题
GPT-4是由OpenAI公司开发的先进的自然语言处理系统,它可以根据不同的输入和输出生成高质量的文本,它比之前的ChatGPT有了很大的改进和创新。相比于ChatGPT,GPT-4有如下不同之处。
● GPT-4使用更多的数据、更深的网络结构和更先进的训练技术,能够理解和生成更复杂、更准确的文本。它能够处理更长的上下文,更好地保持一致性和逻辑性,更少地出现错误和幻觉。
● GPT-4是一个多模态的系统,它可以接收图像和文本作为输入,并且可以根据输入生成图像或文本。这使得它能够处理更多样化的任务,例如识别和描述图像中的人物、物体、场景等内容,根据描述生成图像,或者根据图像回答问题等。它还能够对图像进行编辑、变换或合成,例如改变颜色、大小、形状或位置,或者把两张图像融合在一起。它还能够识别和生成声音,如人物对话、音乐等,并且能够根据给定的条件调整声音,如音量和音调。
● GPT-4是一个更安全、更可靠的系统,它可通过更多的人类反馈和评估,提高其指令遵循能力。它在一定程度上能够避免产生暴力、色情、歧视或虚假信息等不合适的内容,并且能够在必要时提供来源或证据。
目前,GPT-4已经被应用到很多领域和场景中,包括但不限于以下场景。
● 聊天机器人:GPT-4可以通过API和ChatGPT Plus提供给用户使用,它可以与用户进行自然、流畅、有趣和有用的对话,帮助用户解决问题、获取信息、学习知识或娱乐消遣。
● 教育:GPT-4可以作为一个教学辅导机器人,帮助学生学习数学、物理、化学、生物、历史等各种科目。它可以提供解释、示例、练习、反馈等功能,并且能够根据学生的水平和学习的进度进行个性化的调整。
● 创意写作:GPT-4可以作为一个创作伙伴,帮助用户完成创意和写作任务,例如创作歌曲、编写剧本、写文章或学习用户的写作风格等。它可以生成、编辑和迭代文本,并且能够根据给定的主题或风格进行调整。
● 网页设计:GPT-4可以根据用户给出的设计草图或描述生成HTML、CSS或JavaScript等多种语言的网页代码,它还可以对网页进行优化或修改,并且能够适应不同的设备和浏览器。