查询到最新的12条

hdfs读写流程_必须掌握的分布式文件存储系统—HDFS

必须掌握的分布式文件存储系统—HDFS​mp.weixin.qq.comHDFS(Hadoop Distributed File System)分布式文件存储系统,主要为各类分布式计算框架如Spark、MapReduce等提供海量数据存储服务,同时HBase、Hive底层存储也依赖于HDFS。HDFS提供一个统一的抽象目录树,客户端可通过路径来访问文件,如hdfs://namenode:port/dir-a/a. 继续阅读

分布式存储系统的分类

分布式存储系统面临的需求比较复杂,大致可以分为三类: 非结构化数据:包括所有格式的办公文档、文本、图片、图像、音频、视频信息等。结构化数据:一般会存储在关系型数据库中,可用二位关系的表结构来对数据进行描述,数据的模式需要预先进行定义。半结构化数据:介于结构化数据和半结构化数据直接,HTML文档就属于半结构化数据。它一般是自描述的,与结构化数据的最大区别之处在于&#xff 继续阅读

分布式存储系统 之 数据备份

为了保证分布式存储系统的高可靠和高可用,数据在系统中一般存储多个副本。当某个存储节点出故障时,系统能够自动将服务切换到其他的副本,从而实现自动容错。 分布式存储系统通过复制协议将数据同步到多个存储节点,并确保多个副本之间的数据一致性。同一份数据有多个副本,仅有一个为主副本 Primary,其他的副本为备份副本 Backup,数据从主副本复制到备份副本。 复制协议分为两种:强同步复制 继续阅读

聊聊分布式存储系统中的心跳机制以及主节点下发指令给从节点

心跳( heartbeat )是分布式系统中常用的技术。顾名思义,心跳就是以固定的频率向其他节点汇报当前节点状态的方式。收到心跳,一般可以认为发送心跳的这个节点在当前的网络中状态是良好的。 同时分布式存储系统中经常会采用master-slave架构(也即主从架构),从节点通常会使用心跳技术向主节点汇报自身的健康状况,或者其他请求,主节点处理接收到的心跳信息,并响应给从节点一些操作指令,从节点收到这些操作指令后,会进行相应的操作。今天这篇文章就来分析总结一下这个实现方案。 一、 概述 先总结 继续阅读

分布式存储系统Minio简介

Minio 是一个基于Go语言的对象存储服务。它实现了大部分亚马逊S3云存储服务接口,可以看做是是S3的开源版本,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,而一个对象文件可以是任意大小,从几kb到最大5T不等。区别于分布式存储系统,minio的特色在于简单、轻量级,对开发者友好,认为存储应该是一个开发问题而不是一个运维问题。 Mini 继续阅读

Hadoop HDFS-分布式存储系统入门、配置、使用及架构原理分析

文章目录 一、HDFS简介1.1、为什么需要HDFS1.2、核心数据和行为数据 二、核心架构和读写流程2.1、核心架构组件NameNodeSecondary NameNodeDataNodeBlock 2.2、读数据逻辑2.3、写数据逻辑 三、基本命令使用四、分布式可靠性保障3.1、副本冗余3.2、机架策略3.3、心跳机制3.4、安全校验3.5、数据恢复 附:HDFS环境配置 一、HDFS简介 HDFS全称为Hadoop Distributed File S 继续阅读

这些常见的分布式存储系统,你是否都了解?

来源 | 清平の乐 来源 | CSDN博客,责编 | Carol 头图 | CSDN 下载自视觉中国 一、数据存储类型 一般情况下,我们将存储分成了4种类型,基于本机的DAS和网络的NAS存储、SAN存储、对象存储。对象存储是SAN存储和NAS存储结合后的产物,汲取了SAN存储和NAS存储的优点。 1.DAS DAS将计算、存储能力一把抓,封装在一个服务器里。大家日常用的电脑,就是一个DAS系统。 2. 继续阅读

聊聊数据存储系统Couchbase与Redis

背景 Redis 和Couchbase都是基于内存的数据存储系统。在它们各自的官方描述中,Couchbase是高性能,高伸缩性和高可用的分布式缓存系统;Redis是一个开源的内存数据结构存储系统。 Couchbase 介绍 2012年2月,CouchOne与Membase合并,Couchbase基于Membase与CouchDB开发了一款新产品。 CouchBase是一款开源的、分布式的、面向文档的NoSQL数据库,主要用于分布式缓存 继续阅读

Linux操作系统存储子系统核心技术之硬盘与RAID

Linux操作系统的存储子系统应该是Linux中最为复杂的子系统了。其实很多子系统都认为自己是最复杂的子系统,比如内存子系统和网络子系统也这么说。无论如何,存储子系统在Linux中是比较复杂的。今天我们就介绍一下Linux的存储子系统中的硬盘与RAID的相关内容,后面再写一篇关于LVM与文件系统的内容。 硬盘 在Linux的存储子系统中,最底层的就是硬盘了。这里的硬盘并不是指我们看到的硬盘硬件,而是指在Linux内部看到的硬盘设备,或者说是块设备。如 继续阅读

分布式存储系统之Ceph(理论详解)

目录 Ceph 简介 ceph的构成         ceph 集群基础:                  Monitor(ceph-mon):ceph 监视器                  Managers(ceph-mgr)的功能:                 Ceph OSDs(对象存储守护程序 ceph-osd):                  MDS(ceph 元数据服务器,ceph- 继续阅读

云计算、云服务器、云数据库和云存储基本介绍

云计算 是什么: 云计算即分布式计算 通过使用更高性能的机器 更多的机器 来达到相关服务的计算 云计算产品分类: 如建立一个网站:要搞服务器 安装服务器软件 以及编写程序 Iaas(架构即服务) 不用自己搞服务器 计算基础设施的利用,包括CPU、内存、存储、网络和其它基本的计算资源,用户能够在之上部署和运行任意软件:操作系统和应用程序 如 云服务器 云硬盘 Paas(软件即服务) 不用自己搞 继续阅读

Redis从入门到精通【进阶篇】之高可用主从详解

文章目录 0.前言1.详解1.1 主从复制概述1.2 主从复制原理1.2.1.全量复制1.2.2.增量复制1.2.3.详细描述1.3 更深入理解1.4 常见面试题 2. 总结3. Redis从入门到精通系列文章 0.前言 Redis是一个高性能的键值存储系统,广泛应用于Web应用、缓存、消息队列等领域。在实际应用中,为了保证Redis的高可用性,通常需要使用主从复制来进行数据备份和故障转移。本文将介绍Redis主从复制的概念、原 继续阅读