声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html，语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg）。如有转载，请注明出处。

Is ChatGPT a general-purpose natural language processing task solver?

本文章是 Nanyang Technological University, Amazon Web Services，Shanghai Jiao Tong University, Georgia Institute of Technology, Stanford University在2023年2月8日发表的文章，内容主要为实验报告，其ChatGPT数据采集时间为2023.01.10~2023.01.31。该文章报告ChatGPT的优缺点，旨在这项研究能够启发未来的工作。具体文章参见https://arxiv.org/pdf/2302.06476.pdf

正文

由于该文章主要是实验报告，我们就直接看实验结果即可。

一 ChatGPT与GPT3.5对比

文章提到ChatGPT是在GPT3.5的基础上训练而来，所以在Arithmetic Reasoning、commonsense reasoning、 Symbolic reasoning、Logical reasoning 、Question Answering、Summarization和Sentiment Analysis任务进行对比。ChatGPT的效果在大多数任务优于GPT-3.5，也存在summary和Sentiment 任务表现较差，同时与具体任务微调的模型相比性能较差，与理想的通用模型还有一段距离。

二在不同任务上与GPT3.5变种（ext-davinci）和其它语言模型对比

任务：

Arithmetic Reasoning、Commonsense, Symbolic, and Logical Reasoning、Question Answering、Natural Language Inference、Dialogue、Named Entity Recognition、Summarization和Sentiment Analysis。

任务输入格式：