数据集汇总 - 个人博客

查询到最新的12条

使用yolov5训练自己的数据集并测试效果

2023-08-04 0 Comment

1.源码下载链接 1.yolov5原模型以及权重文件链接：https://pan.baidu.com/s/1XlvHIxlzJEqp2wlRx5Fb1w 提取码：xtkj 2.训练自己数据集的完整代码链接：https://pan.baidu.com/s/1xdnah8ZLoT7E1YDm-RiGzQ 提取码：9261 2.训练过程 1.修改class_path为自己数据集的分类结果 2.修改权重文件的路径继续阅读

数据密集型应用存储与检索设计

2023-08-27 0 Comment

本文内容翻译自《数据密集型应用系统设计》，豆瓣评分高达 9.7 分。什么是「数据密集型应用系统」？ 其实我们平时遇到的大部分系统都是数据密集型的——应用代码访问内存、硬盘、数据库、消息队列中的数据，经过业务逻辑处理，再返回给用户。这本书并不是针对某个具体的数据库，而是自顶向下展开各项技术的共性和区别，把所有跟「数据」有关的知识点做了剖析、整理、总结。查询类型 On 继续阅读

OpenMMLab-AI实战营第二期——相关1. COCO数据集格式和pycocotools使用（目标检测方向

2023-09-11 0 Comment

文章目录 1. COCO数据集1.1 COCO数据集介绍1.2 COCO数据集格式1.2.1 常见目标检测数据格式1.2.2 COCO数据集文件结构及标注文件说明1.2.3 COCO的evaluation指标 1.3 其他 2. pycocotools2.1 pycocotools简介和安装2.2 基本使用 3. 图像的EXIF使用3.1 图像的EXIF3.1.1 基本介绍3.1.2 JEPG等格式说明3.1.3 EXIF属性和对应code3.1.4 EXIF中的key和value意义&# 继续阅读

Python采集抖音数据

2023-10-15 0 Comment

本文将从多个方面详细讲解如何使用Python采集抖音数据，希望本文能对初学者有所帮助。一、安装必要的包和工具在采集抖音数据之前，我们需要安装一些必要的包和工具。首先需要安装Python，建议安装最新版本的Python 3。在安装Python之后，我们需要安装一些第三方包，包括requests、pymongo、beautifulsoup4等。 pip install requests pip install pymongo pip install beaut 继续阅读

UPUPWANK集成环境智控平台的mysql数据库密码修改位置---潘万丁

2023-09-08 0 Comment

UPUPWANK集成环境智控平台的mysql数据库密码修改的文件我暂时还未找到，但是在控制界面看到修改账号和密码的位置： 继续阅读

Observability：如何把 Elastic Agent 采集的数据输入到 Logstash 并最终写入

2023-07-12 0 Comment

在之前的文章 “安装独立的 Elastic Agents 并采集数据 - Elastic Stack 8.0”，我们详述了如何使用 No Fleet Server 来把数据写入到 Elasticsearch 中。在今天的文章中，我们来详述如下使用 Elastic Agents 在独立（standalone）模式下来采集数据并把数据最终通过 Logstash 来写入到 Elasticsearch 中去。在今天的练习中，我继续阅读

Chatgpt-3 使用的提取数据集技术、数据集自动化处理和保证数据质量

2023-08-15 0 Comment

为了积累数据集，ChatGPT-3使用了一系列技术来从不同来源的文本中提取数据。其中最常用的技术包括： Web scraping：ChatGPT-3使用Web scraping技术从互联网上的网页中提取文本。它可以自动化抓取网页，并从中提取出需要的信息。数据库查询：ChatGPT-3使用数据库查询系统来收集从各种来源收集到的数据。这是一种常用的技术，在大型网站和应用程序中广泛使用。 API收集&#xff 继续阅读

多快好省地使用pandas分析大型数据集

2023-08-10 0 Comment

1. 简介 pandas虽然是个非常流行的数据分析利器，但很多朋友在使用pandas处理较大规模的数据集的时候经常会反映pandas运算“慢”，且内存开销“大”。特别是很多学生党在使用自己性能一般的笔记本尝试处理大型数据集时，往往会被捉襟见肘的算力所劝退。但其实只要掌握一定的pandas使用技巧，配置一般的机器也有能力hold住大型数据集的分析。图1 本文就将以真实数据集和运存16G 继续阅读

传统数仓如何转型大数据

2023-07-31 0 Comment

大家好，我是一哥，前几天建了一个数据仓库方向的小群，收集了大家的一些问题，其中有个问题，一哥很想去谈一谈——现在做传统数仓，如何快速转到大数据数据呢？其实一哥知道的很多同事都是从传统数据仓库转到大数据的，今天就结合身边的同事经历来一起分享一下。一、数据仓库数据仓库：数据仓库系统的主要应用主要是OLAP（On-Line Analytical Proces 继续阅读

zabbix 5.0所有依赖包_Zabbix“专家坐诊”第82期问答汇总

2023-08-14 0 Comment

Q：我所有的监控项都是通过自动发现获取的item和值，这个数据获取的时间是怎么控制的，现在感觉都是无序的，我想控制在每个整点的10分左右更新数据。A：zabbix获取数据是轮询的。有时候数据会出现采集超时的情况，时间上并不是很好控制。建议是从zabbix自身、数据库等方面进行优化，减小采集item的耗时，这样数据获取的时间基本都不会有大的差距。Q：那应该要怎么优化的能提继续阅读

大流量采集站进阶课程已发布

2023-07-03 0 Comment

2022.9.10日更新大流量进阶课程。录制这套课程之前就已经做好了录制计划，因为网站涉及的东西非常多，所以咱们这套大流量采集站采用阶段性录制。第一套课程重点讲的是稍微基础东西，比如做站前的准备工作，网站布局，关键词设置，关键词挖掘整理，网站数据填充等。进阶课程主要是讲，新上线的站点如何快速起站，网站优化逻辑，以及变现优化方面的问题。比如常见的网站上线没有蜘蛛抓取，网站页面优化逻辑，以及如何大批量为网站制作高质量页面，以及网继续阅读

Java Mp3转化WAV/PCM音频数据,解码详细解析,提取每一帧数据集合/比特流/播放，一行代码!

2023-09-17 0 Comment

导言解码过程Mp3结构MP3 文件一般分为三部分：ID3V2，Frame，ID3V1也属于帧，叫标签帧，Frame 部分叫数据帧，在MP3 文件内不一定有标签帧，但一定有数据帧.ID3V2解析开始处，长度为10字节，结构如下:标签头 public static int discard(int num){int result = 0, mask = 0 继续阅读

擅长工具开发、爬虫采集技术、大数据统计处理！
座右铭：皇天不负有心人。

Search Results for: 数据集汇总