ChatGPT,令人沮丧的开源故事

当OpenAI在2022年11月底发布ChatGPT 3.5时,没有人对这个新版本抱有过高的期望。这只是一个“研究预览” ,OpenAI的AI政策研究员Sandhini Agarwal解释道。 该组织的科学家Liam Fedus补充道:“我们不想将它过度宣传为一个重大的基本进步。”

然而,现在情况完全不同了。除非你一直生活在石头下面,你应该知道ChatGPT从那时起成为了这个十年,甚至是这个世纪最火热的技术发展。至少比尔·盖茨(你还记得他吗?)认为这是自1980年引入图形用户界面(GUI)以来的最大事情。这导致了一个名为Windows的产品。

有意思的是,ChatGPT 3.5并没有什么新鲜东西。 它使用了与早期版本相同的大型语言模型(LLM)。 关键的区别是现在你可以更容易地用自然语言提出问题,而不需要使用应用程序编程接口(API)或API驱动程序。

通过使ChatGPT易于访问,OpenAI惊讶地发现它变得非常受欢迎。 而且,顺便说一句,自从微软投资了100亿美元到这家公司以来,它似乎已经为公司做得不错。

那么,对于开源来说还是好消息,对吧?我的意思是,公司的名字是OpenAI,对吧? 是的,名称仍然带有“开源”的含义,但其源代码和基于其的服务已经有一段时间没有开源了。

虽然Google新近发布的答案ChatGPT,Bard,“认为”“GPT-4模型和ChatGPT都是开源项目”,但是这是错误的。

其中一位公司的联合创始人,你可能也听说过他的另一个家伙埃隆·马斯克说过,这原本是要开源的。马斯克注意到:“OpenAI是作为一个开源(这就是为什么我把它命名为“开放” AI)非盈利性公司而成立的,旨在作为对抗谷歌的权衡,但现在它已经成为一个闭源的、效益最大的公司,实际上被微软控制。这根本不是我想要的。”

事情是这样的,马斯克在2018年离开了OpenAI,当时这家公司还是一个非营利组织,专注于SpaceX和特斯拉。 明年,看到它需要更多的资金,OpenAI成为了实质上的营利性公司。正如OpenAI的CEO Sam Altman随后在推特上发表的推文中指出:“我们将不得不在某个时候以某种方式对其进行货币化; 计算成本令人瞠目结舌。” 我猜100亿美元只能支撑它到这个程度了。

换句话说,又一家公司未能找到如何利用其开源工作获利的方法。然后,使用开源构建到GPT-2,它关闭了代码门。

此外,即使在微软大力投资OpenAI之前,微软也在2020年独家授权了GPT-3语言模型。

请注意,ChatGPT仍然使用开源代码。就在本周,当人们可以查看其他人的搜索历史时,Altman将错误归咎于开源库。 “由于一个开源库中的错误,我们在ChatGPT中遇到了重大问题,现在已经发布了修复程序,并且我们刚刚完成了验证。”

这个错误起源于Redis客户端开源库redis-py*。

现在ChatGPT获得了金钱支持,则不再能够名副其实地使用OpenAI这个名称。 正如Nomic AI的信息设计副总裁Ben Schmidt在推特上写道:“我认为我们可以在“Open” AI上打上一个关门的标签:介绍GPT-4的98页论文自豪地宣布,他们没有在任何关于训练集内容的问题上透露任何细节。”

在这之前,你可以追溯ChatGPT的旅程到AI,机器学习,自然语言处理和深度学习框架的核心的开源程序。

特别是,Google和Facebook分别开发的TensorFlow和PyTorch推动了ChatGPT。 这些框架为构建和训练深度学习模型提供了必要的工具和库。 没有它们,就没有ChatGPT。

ChatGPT的另一个重要的开源部分是一个奇怪命名的Hugging Face的Transformer。 这是构建最先进的机器学习模型的领先开源库。 它为自然语言处理任务提供了预训练模型、架构和工具,使开发者能够在现有模型的基础上构建并调整它们以适用于特定的用例。 ChatGPT受益于该库支持GPT系列模型的能力,使其快速部署和扩展。

你可以在OpenAI的GPT-2中看到所有这些。而GPT-2却没有得到大众瞩目,它令人印象深刻的能力是深度学习、无监督学习和Transformer架构的进步的结果。 开源社区在GPT-2的开发、测试和改进中发挥了重要作用。

那么OpenAI如何做到这一点呢?容易。以上的开源软件许可证,TensorFlow,Apache 2.0;PyTorch,修改的BSD;Hugging Face Transformer支持各种开源许可证,包括BSD。 换句话说,OpenAI在法律上是合法的。

因此,就像许多其他程序一样,ChatGPT欠了开源社区很大的债,但它不是开源的,也不可能会成为开源的。 这就是另一个令人沮丧的开源故事。

本文链接:https://my.lmcjl.com/post/8344.html

展开阅读全文

4 评论

留下您的评论.