为什么所有GPT-3复现都失败了？使用ChatGPT你应该知道这些--2023 年 2 月 12 日

这一推文写于 2023 年 2 月 12 日，其中均为个人意见，仅供参考。

为什么所有公开的对 GPT-3 的复现都失败了？我们应该在哪些任务上使用 GPT-3.5 或 ChatGPT？

这篇推文将包括，我在仔细重新检查了一系列文章的细节之后给出的总结，以及对上面两个问题我个人的思考。这些文章包括且不限于：GPT-3, PaLM, BLOOM, OPT, FLAN-T5/PaLM, HELM 等。如果您有更可靠的参考资料或者更实际的经验，欢迎指正。

对于那些想要复现一个属于自己的 GPT-3 或 ChatGPT 的人而言，第一个问题是关键的。第二个问题则对那些想要使用它们的人是重要的（下文提到 GPT-3，主要是指 GPT-3.5 或 InstructGPT 的最新版本，除了一些指向 GPT-3 原文的情况）。

为什么所有公开的对 GPT-3 的复现都失败了？

这里，我称之为 “失败”，是指训练得出模型有接近 GPT-3 或者更大的参数量，但仍无法与 GPT-3 原始文献中报告的性能所匹配。在这一标准下，GPT-3 和 PaLM 是 “成功” 的，但这两个模型都不是公开的。而所有的公开模型（例如：OPT-175B 和 BLOOM-176B）都在一定程度上 “失败” 了。但是我们仍然可以从这些 “失败” 中吸取一些教训。

本文链接：https://my.lmcjl.com/post/3440.html

展开阅读全文

擅长工具开发、爬虫采集技术、大数据统计处理！
座右铭：皇天不负有心人。

为什么所有GPT-3复现都失败了？使用ChatGPT你应该知道这些--2023 年 2 月 12 日

4 评论

留下您的评论. Cancel reply

相关文章

4 评论

留下您的评论. Cancel reply