ChatGPT 技术架构
ChatGPT是一种基于自然语言处理的神经网络模型,它使用了大量的未标注文本数据进行训练,并通过预测文本中下一个词的方式来自我监督。
文章目录
- ChatGPT 技术架构
- 自监督预训练模块
- 预训练模型
- 深度学习
- Transformer模型
- 生成式模型
- 微调模块
- 注意力机制
- 多头自注意力机制
- 基于人类反馈的强化学习与PPO机制
- 残差连接
- 长短时记忆网络(LSTM)
- 词嵌入(Embedding)
- 多层感知器(MLP)
- 梯度下降优化算法
- 自注意力机制
- 序列到序列模型
本文链接:https://my.lmcjl.com/post/5442.html
展开阅读全文
4 评论