Optimization算法 - 个人博客

查询到最新的12条

ChatGPT 使用强化学习：Proximal Policy Optimization算法（详细图解）

2023-09-08 0 Comment

ChatGPT 使用强化学习：Proximal Policy Optimization算法强化学习中的PPO（Proximal Policy Optimization）算法是一种高效的策略优化方法，它对于许多任务来说具有很好的性能。PPO的核心思想是限制策略更新的幅度，以实现更稳定的训练过程。接下来，我将分步骤向您介绍PPO算法。步骤1：了解强化学习基础首先，您需要了解强化学习的基本概念，如状态（state）、动作（action）、奖励（reward）、策略（policy）和价值函继续阅读

【人工智能大模型】一文彻底讲透——什么是 PPO（Proximal Policy Optimization，近

2023-08-24 0 Comment

文章目录什么是 PPO（Proximal Policy Optimization，近端策略优化）？PPO 简介PPO 算法流程PPO 的数学公式PPO 算法原理如何在实际应用中使用PPO算法？什么是近端优化？怎样进行近端优化的？什么是 KL 散度？ppo2.py 什么是 PPO（Proximal Policy Optimization，近端策略优化）？继续阅读

体验ChatGPT后，陷入沉思...

2023-09-20 0 Comment

1 前言最近 chatGPT 爆火网络，ChatGPT 到底是什么，今天就一起了解和体验一下。ChatGPT 是由OpenAI开发的一个人工智能聊天机器人程序，该程序使用基于GPT-3.5架构的大型语言模型并通过基于人类反馈强化学习进行训练。模型在Microsoft Azure的超级计算机上训练，并通过近端策略优化算法（proximal policy optimization）进行微调。这种策略优化算法比信任域策继续阅读

chatgpt教你练习前端算法

2023-09-11 0 Comment

今天想试试chatgpt关于代码算法这一块儿是否好用。判断质数上面的代码有一点小问题，当num为2时，返回的结果是错误的，我改进了一下，并优化了一点性能 // 判断是否是素数（质数） function isprime(number) {// 所有的负数，0，1都不是素数if (number <= 1) {return false;}// 素数总满足 6x 继续阅读

【MATLAB第42期】基于MATLAB的贝叶斯优化决策树分类算法与网格搜索、随机搜索对比，含对机器学习模型的

2023-07-19 0 Comment

【MATLAB第42期】基于MATLAB的贝叶斯优化决策树分类算法与网格搜索、随机搜索对比，含对机器学习模型的评估度量介绍网格搜索、随机搜索和贝叶斯优化是寻找机器学习模型参数最佳组合、交叉验证每个参数并确定哪一个参数具有最佳性能的常用方法。一、评估指标 1、分类 1.1 准确性 1.2 精度 1.3 召回 1.4 F1值 1.5 F0.5值 1.6 F2值 1.7 计算评估指标的功能 2、回归 2.1 平均绝对误差 2.2 均方误差 2.3 均方根误差二、基于F1值执继续阅读

算法成长之路------CF22A Second Order Statistics

2023-09-09 0 Comment

学习目标：算法学习-Day16 题库: 洛谷题库每天保持发布一篇Java或C算法题解！ 题目： 给定一个数组，输出其中第二小的整数（相等的整数只计算一次）。输入格式: 第一行，一个整数 n（1≤n≤100），表示数组长度。第二行，n 个绝对值小于 100 的整数。输出格式: 一行。如果该数组存在第二小整数，则输出继续阅读

Python自然语言处理实战：核心技术与算法

2023-09-10 0 Comment

Python自然语言处理实战：核心技术与算法，由机械工业出版社在2018-06-01月出版发行，本书编译以及作者信息为：涂铭，刘祥，刘树春著，这是第1次发行，国际标准书号为：9787111597674，品牌为机工出版, 这本书采用平装开本为16开，纸张采为胶版纸，全书共有281页，字数万字，值得推荐。此书内容摘要自然语言处理是一门融语言学、计算机科学、数学于一体的学科，比较复杂，学习门槛高，但本书巧妙地避开了晦涩难懂的数学公式和证明，即便没有数学基础，也能零基础入继续阅读

java实现LRU缓存淘汰算法的方法

2023-09-29 0 Comment

LRU算法：最近最少使用淘汰算法（Least Recently Used）。LRU是淘汰最长时间没有被使用的缓存（即使该缓存被访问的次数最多）。如何实现LRU缓存淘汰算法场景：我们现在有这么个真实场景，我在爬取某个网站时，控制该网站的代理IP并发数，太多会搞垮对方网站的对吧，要蹲号子的呢。这里我需要维护一个代理IP代理池，而且这些IP肯定不是一直都很稳定的，但是又不能取一个就丢一个，这样太浪费资源。所以我会将这些IP缓存起来，进行按需提取，采用LRU 继续阅读

使用cocos2dx实现碎片炸裂 P2（凹多边形的三角切割算法）（修订1）

2023-09-29 0 Comment

上一章虽然已经能够将纹理碎片化，但是固定一条边，然后依次匹配第三个顶点的作法是无法适用于凹多边形的。作为一个阿里眼里的菜逼，之前想着这个算法应该很简单，结果网上的各种转载也没找到个说清楚的文章，所以我将算法设计出来并实现了。本章将说一说如何“肢解”凹多边形。注意，这里仅仅是凹多边形，而不是形套洞，洞套形的套娃式复杂多边形，肢解那种多边形的算法相对更为复杂。而且最关键的继续阅读

基于改进多目标灰狼优化算法的考虑V2G技术的风、光、荷、储微网多目标日前优化调度研究（Matlab代码实现）

2023-08-17 0 Comment

💥1 概述多目标优化表示对具备多个目标函数的问题的优化。通常的，可以将其表述为最大化问题如下： 为了利用灰狼优化算法执行多目标优化，需要集成了两个新的部分[63]。第一个是外部存档，它负责存储到目前为止获得的非支配的 Pareto 最优解。第二个组成部分是领导者选择策略，有助于选择 α,β 和 δ 解决方案作为存档中狩猎过程的领导者。 （1）外部存档外部存继续阅读

什么是雪花算法？啥原理？

2023-08-17 0 Comment

1、SnowFlake核心思想 SnowFlake 算法，是 Twitter 开源的分布式 ID 生成算法。其核心思想就是：使用一个 64 bit 的 long 型的数字作为全局唯一 ID。在分布式系统中的应用十分广泛，且 ID 引入了时间戳，基本上保持自增的，后面的代码中有详细的注解。这 64 个 bit 中，其中 1 个 bit 是不用的，然后用其中的 41 bit 作为毫秒数&#xf 继续阅读

二分查找 - 数据结构和算法教程

2023-08-14 0 Comment

二分查找被定义为在排序数组中使用的一种搜索算法，它通过重复将搜索间隔分成两半来实现。二分查找的思想是利用数组被排序的信息，将时间复杂度降低到O（log N）。在数据结构中应用二分查找的条件数据结构必须排序。访问数据结构的任何元素都需要恒定的时间。二分查找算法在该算法中， 通过查找中间索引“mid”将搜索空间分成两半。将搜索空间的中间元素与键进行比较。如果在中间元素处找到键，则终止该过程。如继续阅读

擅长工具开发、爬虫采集技术、大数据统计处理！
座右铭：皇天不负有心人。

Search Results for: Optimization算法