loss - 个人博客

查询到最新的4条

ColossalChat：使用完整的 RLHF Pipeline复现ChatGPT 的开源解决方案

2023-09-22 0 Comment

ChatGPT、GPT-4等大型AI模型和应用在全球范围内风靡一时，成为技术产业革命和AGI（Artificial General Intelligence）发展的基础。不仅科技巨头竞相发布新品，许多来自学术界和产业界的人工智能专家也加入了相关的创业浪潮。生成式 AI 每天都在快速迭代，不断完善！ 然而，OpenAI 并没有将其模型开源，这让许多人对继续阅读

PyTorch之前向传播函数forward

2023-07-12 0 Comment

神经网络的典型处理如下所示： 1. 定义可学习参数的网络结构（堆叠各层和层的设计）； 2. 数据集输入； 3. 对输入进行处理（由定义的网络层进行处理）,主要体现在网络的前向传播； 4. 计算loss ，由Loss层计算； 5. 反向传播求梯度； 6. 根据梯度改变参数值,最简单的实现方式（SGD）为: we 继续阅读

Paper：《GPT-4 Technical Report》的翻译与解读

2023-08-08 0 Comment

Paper：《GPT-4 Technical Report》的翻译与解读目录 Paper：《GPT-4 Technical Report》的翻译与解读 Abstract摘要 1、Introduction简介 2、Scope and Limitations of this Technical Report本技术报告的范围和局限 3、Predictable Scaling可预测的比例 3.1、Loss Prediction损失的预测 3.2、Scal 继续阅读

G1D29-Roberta智能蜜罐环境

2023-09-02 0 Comment

一、Roberta （一）特点对bert的一点点改进啦 1、动态遮掩 2、FULL-SENTENCE without NSP loss 3、Large mini-batch 4、A larger Byte-Pair Encoding （二）关于BERT中的NSP和MLM 参考：https://blog.csdn.net/qq_43658933/article/details/123545931 训练时有两个任务啦~ 继续阅读

擅长工具开发、爬虫采集技术、大数据统计处理！
座右铭：皇天不负有心人。

Search Results for: loss

ColossalChat：使用完整的 RLHF Pipeline复现ChatGPT 的开源解决方案

PyTorch之前向传播函数forward

Paper：《GPT-4 Technical Report》的翻译与解读

G1D29-Roberta智能蜜罐环境