ChatGPT原理解析以及使用方法介绍

一、背景

这里我就直接贴上跟ChatGPT的对话作为背景输入,说真的,它的回答比我写的还要专业,具体见如下截图:

二、原理

从官网介绍可以看到,ChatGPT与InstructGPT是同源的模型。那么接下来我们来看下什么是InstructGPT。从字面上来看,顾名思义,它就是指令式的GPT,“which is trained to follow an instruction in a prompt and provide a detailed response”。接下来我们来看下InstructGPT论文[1]中的主要原理:


从该图可以看出,InstructGPT是基于GPT-3模型训练出来的,具体步骤如下:

步骤1.)从GPT-3的输入语句数据集中采样部分输入,基于这些输入,采用人工标注完成希望得到输出结果与行为,然后利用这些标注数据进行GPT-3有监督的训练。该模型即作为指令式GPT的冷启动模型。

步骤2.)在采样的输入语句中,进行前向推理获得多个模型输出结果,通过人工标注进行这些输出结果的排序打标。最终这些标注数据用来训练reward反馈模型。

步骤3.)采样新的输入语句,policy策略网络生成输出结果,然后通过reward反馈模型计算反馈,该反馈回过头来作用于policy策略网络。以此反复,这里就是标准的reinforcement learning强化学习的训练框架了。

所以总结起来ChatGPT(对话GPT)其实就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通过人工标注方式训练出强化学习的冷启动模型与reward反馈模型,最后通过强化学习的方式学习出对话友好型的ChatGPT模型。如下是论文中相应对话友好型的定量结果(其中PPO-ptx曲线就是InstructGPT模型),可以看到在回答友好型上InstructGPT是远超原始GPT的:


三、应用

1、世界杯问题咨询

Q1:荷兰、阿根廷、克罗地亚、巴西、英格兰、法国、摩洛哥、葡萄牙这几只足球队各自特点是什么,每支足球队请用一句话总结

A1:这些国家和地区都是足球大国,每支队伍都有其独特的优势和特点。

荷兰:以高超的团队配合和快速的进攻著称。

阿根廷:有着传奇般的阵容,以出色的个人技术和激情演出著称。

克罗地亚:以技术精湛和整体配合著称,有着不俗的进攻能力。

巴西:以炫酷的超级脚法和攻势激进著称,是全世界最具攻击性的球队之一。

英格兰:以强大的防守能力和顽强的拼搏精神著称,但在世界杯上的成绩并不理想。

法国:在技术、配合和战术方面都有着出色的表现,有着强大的实力。

摩洛哥:以精心调整的阵容和出色的战术执行力著称,有着不俗的实力。

葡萄牙:以超强的个人实力和攻势激进著称,拥有世界足坛著名的球星。


Q2:如何通过AI实现足球场上的越位识别

A2:越位识别是一个非常有挑战性的问题,因为它涉及到对足球场上复杂的动态环境进行实时分析。然而,近年来,人工智能技术取得了巨大的进步,可以用来解决这类问题。

一种常用的方法是使用视觉识别技术,即通过摄像头捕捉比赛过程中的影像,然后使用人工智能模型对影像进行分析。模型可以通过学习大量数据,例如足球比赛录像、比赛规则和越位情况,来学会识别越位行为。

除了视觉识别技术,人工智能还可以通过其他方式来实现越位识别。例如,可以使用定位系统,如 GPS 或超声波定位,来捕捉足球和球员的位置信息,然后通过人工智能模型来分析这些数据,并进行越位识别。

总的来说,人工智能可以通过多种方式实现越位识别,关键在于选择合适的方法,并使用高质量的数据来训练人工智能模型。

2、写书信(情书):


正如ChatGPT自己回答的那样,它非常擅长对话、情感分析、文本生成、摘要提取等,有了这些直接打开了更广阔的应用面。可想而知,如若在垂直领域做定向训练,它将会发挥出更极致的性能,即可作咨询用途,同时也可以辅助创作(这将颠覆很多行业的工作方式)等等。


四、试用

步骤1:网络准备

由于内容规定,这里不作过多介绍。

步骤2:国外手机准备

推荐优先找国外的亲朋好友去要,这里只需要在OpenAI账号注册的时候需要用到,获取相应验证码就行。后续登陆OpenAI不需要相应手机,只需要记住相应注册的账号与密码即可。如果实在没办法找到相应亲朋好友手机号的话,可以参考这篇文章“接码”部分内容,亦或是通过其他方式购买相应的国外手机号。

步骤3:开始账号注册

首先打开步骤1网络,其次打开OpenAI账号注册链接,然后开始相应账号注册,推荐注册gmail邮箱,很多类似的跟gmail邮箱基本都有打通账号体系。完成注册后,最后一步会需要手机验证码,这一步就用到了步骤2中准备好的内容了。直到这里就完成了相应注册了。

步骤4:开启试用之旅

1. ChatGPT,在如下红框中输入文本内容,就能与ChatGPT交互体验了。


效果是非常惊艳的,使用完之后的体感是这应该能辅助到各行各业中,应用空间无限大,这类技术可能会成为未来AI系统的基石应用之一。


2. Discord,选择美国地区网络,然后下载该应用并进行安装,安装完成后选择如下社区参与文生图体验,文章《人工智能内容生成元年—AI绘画原理解析》中已介绍到Midjourney的用户通过该文生图的能力,在美国科罗拉多州举办的艺术博览会,《太空歌剧院》的画作获得数字艺术类别冠军。相应参与界面如下:


五、文献

[1]InstructGPT:https://arxiv.org/abs/2203.02155


六、应用

接下来给大家介绍下我们研发的各个域上的开源免费模型,欢迎大家体验、下载(大部分手机端即可体验):

https://modelscope.cn/models/damo/cv_resnet50_face-detection_retinaface/summary

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

https://modelscope.cn/models/damo/cv_manual_face-detection_tinymog/summary

https://modelscope.cn/models/damo/cv_manual_face-detection_ulfd/summary

https://modelscope.cn/models/damo/cv_manual_face-detection_mtcnn/summary

https://modelscope.cn/models/damo/cv_resnet_face-recognition_facemask/summary

https://modelscope.cn/models/damo/cv_ir50_face-recognition_arcface/summary

https://modelscope.cn/models/damo/cv_manual_face-liveness_flir/summary

https://modelscope.cn/models/damo/cv_manual_face-liveness_flrgb/summary

https://modelscope.cn/models/damo/cv_manual_facial-landmark-confidence_flcm/summary

https://modelscope.cn/models/damo/cv_vgg19_facial-expression-recognition_fer/summary

https://modelscope.cn/models/damo/cv_resnet34_face-attribute-recognition_fairface/summary

本文链接:https://my.lmcjl.com/post/4040.html

展开阅读全文

4 评论

留下您的评论.