ChatGPT 是当前最热门的话题之一,它是由 OpenAI 开发的一种基于大规模语言模型的对话系统,可以用于文本生成、机器翻译、自动问答、语音识别、情感分析、代码编写等多个任务。OpenAI发布ChatGPT后,仅用时2个月其月活跃用户数量就超过了1亿。为进一步了解ChatGPT,在本期的推文中我们将简单介绍ChatGPT的历史进程,并举例说明一些使用技巧。除此之外,我们还将介绍ChatGPT与其他工具的结合。
一、ChatGPT的介绍
(1) GPT-12018 年,OpenAI 发布了名为 “Improving Language Understanding by Generative Pre-Training” 的模型,即 GPT-1。GPT-1是一个基于transformer架构的神经网络, 其架构包含了12个transformer block, 同时每个block中又含有12个self-attention, 总共有1.17亿个参数。GPT-1 的主要应用领域包括机器翻译、文本摘要、对话系统等。由于其出色的性能,GPT-1 在生成文本和机器翻译等任务中都获得了很高的成绩。(2)GPT-22019 年,OpenAI推出了名为 “Generative Pre-trained Transformer 2” (GPT-2)的模型,即 GPT-2。它是ChatGPT的第二个版本,跟GPT-1相同之处是仍采用了transformer的网络架构。不同之处是GPT-2的训练数据大约是GPT-1的10倍,同时GPT-2引入了一种名为Masked Language Model(MLM)新的无监督预训练任务,该模型主要目的是预测在文本序列中被遮盖(masked)的单词。通过训练MLM模型,可以使模型学习到词语间的相互关系和语言结构。这有助于提高模型在自然语言理解、问答和文本生成等任务上的性能。
(3)GPT-32020 年,OpenAI 推出了 名为“Generative Pre-training Transformer 3”(GPT-3)的 模型架构,它也是一种基于Transformer的神经网络模型,但是与GPT-2相比,GPT-3在模型规模,训练数据,模型参数等方面都有了大幅提升,其中GPT-3模型的参数量达到了1.75万亿,是GPT-2的10倍以上。此外,GPT-3还支持few-shot learning,即只需要给定几个示例就能进行推理和生成任务。这意味着GPT-3可以从更少的数据中学习,并在处理新的任务时也能够获得较好的表现。
(4)GPT-42023年3月15日OpenAI 发布了最新的多模态语言模型GPT-4,其中OpenAI官方运用这样一句话“GPT-4 is OpenAI’s most advanced system, producing safer and more useful responses”来介绍GPT-4. 与之前的版本相比,GPT-4能够进行图像的输入和长文本的输入,是该版本的一个重要功能。二、ChatGPT的使用技巧
(1)网络波动问题当您点击运行之后出现了以下答复,那么就说明您的网络存在着波动,解决方法就是刷新当前页面。但要注意的是,如果您在输入框内输入了很多内容,需要在刷新页面之前复制一下,否则在您刷新之后会消失不见。
(2)相同问题下可能给出不同的回答
对于一个相同的问题,在您重复运行后,ChatGPT给出的回答可能会不一样,它会根据上次给出的答案去调整这次的回答内容,对于使用者来说,您需要有考虑地去选择合适的答案,就比如以下的相同问题会给出不一样的结果。
(3)使用过程中尽可能详细地描述您的问题
对于您想让ChatGPT帮你解决的一个问题,您描述的越详细,ChatGPT给出的结果就会越准确,这也是您个性化使用它的最好方法,让我们看一下示例。
(4)回答框的长度限制
ChatGPT回答的长度被限制在了5000词以内,超过5000词的部分不会显示出来,但对于一些答案比较长的任务来说,会出现答案不完整的情况,就比如下面的示例:
…
对于这个问题,ChatGPT在答案中间进行了截断,造成了很不好的使用体验。这里给出两种解决思路,一种是对于答案比较多的问题,您可以对ChatGPT进行调试,让它以模块的形式给出您的答案,每个模块占用1个回答框,这样就可以避免截断的问题。另一种解决办法就是Upgrade to Plus,这样您就可以使用新发布的GPT-4版本,这个版本可以支持25000词的回答。(5)需要警惕虚假答案ChatGPT在回答问题的时候,可能会出现一些不存在的东西。比如您想利用ChatGPT查阅文献,一方面它会根据您的输入内容去查阅它的数据库,另一方面它可能还会根据您的关键词去生成一些从未发表过的文献,这是需要您在使用时额外关注的一件事情。三、ChatGPT与其他工具的结合
(1) GitHub Copilot X2023年3月23日,Github推出了编程辅助工具Copilot 的全新版GitHub Copilot X[1],该版本接入GPT-4模型,并且新增了聊天和语音功能,允许使用者利用自然语言询问如何完成特定的编程任务。Copilot X 在开发者体验中添加了聊天功能[Copilot Chat]。该功能可以识别开发人员输入的代码、显示错误消息,并将其嵌入到 IDE 中。与此同时,开发人员可以深入分析和解释代码块的用途,生成单元测试,甚至获得针对错误的建议修复。在使用该功能时,要注意其只专注于编程问题,若问题与编程无关,将迅速关闭无关内容。(2)Microsoft 365 Copilot
2023年3月16日,微软推出Microsoft 365 Copilot[2],再次掀起大家的热议。Microsoft 365 Copilot 基于GPT-4的技术,通过结合人工智能大型语言模型LLM模型和Microsoft 365应用中的数据,成功实现将文字转化为强大的生产力工具。具体来说,一方面Microsoft 365 Copilot与Microsoft365的应用软件相结合,根据简单的命令使得这些应用能够自动生成文档、根据文档创建演示文稿、分析 Excel 的表格数据等功能,提高办公效率。另一方面Microsoft 365 Copilot将用户数据与应用程序相关联,根据一个自然语言的提示来实现会议内容总结,文档整理等任务。为进一步探索Microsoft 365 Copilot的奇妙之处,我们在下文中简单列举了几个实例:
Copilot in Word:只需简短的提示,就可以帮助使用者创建初稿,或者在当前文档上添加内容、重写、总结。例子:
1)根据文档及[电子表格]中的数据写一份两页的项目提案
2)简练第三段内容
3)根据大纲创建一份草稿Copilot in Excel:帮助分析数据,或者根据使用者的问题生成对应的模型。例子:
1)插入表格
2)对变量进行分析
Copilot in PowerPoint: 根据 Word 文档创建演示文稿。例子:
根据文档创建一个5页的幻灯片参考文献
[1] https://github.com/features/preview/copilot-x.
[2]https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/.