数据治理是什么?为什么要做数据治理?关于数据治理我们需要做什么? 数据治理无论是在数仓建设过程中还是数仓建设完成之后都是及其重要的,是数据部门基础建设的必经之路,是降本提效,形成企业数据资产的关键一环 一 数据质量管理 1.1 数据质量基本概念 ●数据质量管理(Data Quality Management),是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水 继续阅读
Search Results for: 数据质量等
查询到最新的12条
电力数据安全治理实践思路探讨
01电力数据安全实践背景 数字经济的快速发展根本上源自数据的高质量治理和高价值转化,近年来,国家层面相继推出促进数据高质量治理的政策法规,围绕加强数据安全保障、提高数据质量等方面,明确了相关规定和要求。作为重要数据持有者,电力企业数据安全对个人信息、行业、地区乃至国家安全具有重大意义,且电力行业数据具有总量巨大、类型复杂多元、价值潜力巨大等特点,致使数据安全治理较为复杂。 继续阅读
分布式计算之数据质量漫谈
一 概述 1 数据质量问题无处不在 基本上每个用数据的同学,都遇到过以下类似的问题。 表没有按时产出,影响下游,严重的甚至可能影响线上效果。 打点缺失,看了报表才发现数据对不上。 数据统计出来,uv大于pv,很尴尬。 数据产出暴增,本来1000万的数据变成了3000万。 字段里面的枚举值和注释里面 继续阅读
火山引擎 Dataleap 数据质量解决方案和最佳实践(一):数据质量挑战
什么是数据质量 广义上来说,数据质量的定义是数据满足一组固有特性(质量维度)要求的程度。业界通常有 6 个维度: 完整性:指数据的记录和信息是否完整,是否存在缺失的情况。数据缺失主要包括记录的缺失和记录中某个字段信息的缺失,两者都会造成统计结果不准确,所以说完整性是数据质量最基础的保障。在做监控时,需要考虑两个方面:数据条数是否少了; 继续阅读
主数据元数据 元数据的概念、分类及作用
导读:要从事大数据技术相关职业,首先就要掌握几个关键概念,元数据就是掌握大数据技术本质最重要的概念,可以说具有牵一发而动全身之作用,今天我们就重点介绍一下元数据的概念、分类及作用。 一、元数据的定义 元数据(MetaData)通常被定义为:关于数据的数据(Metadata),或者描述数据的数据(data about data),对数据及信息资源的描述性信息。元数据是所有数据中最重要的数据,也是整个银行业数据和计算机软件的基础。 如体检报告 继续阅读
想让 ChatGPT 帮忙进行数据分析?你还需要做......
近年,火出圈的 ChatGPT 掀起了久违的人工智能的热潮,如何更好地让人工智能真正为企业所用,也成了近期的热门话题。大数据和人工智能两者相辅相成,人工智能的训练以大量数据作为基础,而数据的价值则需要人工智能的充分挖掘。 在训练人工智能时,一般需要经过数据收集、数据清洗、特征提取、模型选择、模型训练、模型测试、部署等一系列步骤。在这一过程中,数据质量的高低对于人工智能的更新迭代极为重要。这也和 继续阅读
Chatgpt-3 使用的提取数据集技术、数据集自动化处理和保证数据质量
为了积累数据集,ChatGPT-3使用了一系列技术来从不同来源的文本中提取数据。其中最常用的技术包括: Web scraping:ChatGPT-3使用Web scraping技术从互联网上的网页中提取文本。它可以自动化抓取网页,并从中提取出需要的信息。 数据库查询:ChatGPT-3使用数据库查询系统来收集从各种来源收集到的数据。这是一种常用的技术,在大型网站和应用程序中广泛使用。 API收集ÿ 继续阅读
应用服务器与数据库服务器有哪些区别?
应用服务器本质上是一个中间件服务器,位于客户端浏览器和数据库服务器之间。应用程序是指通过各种协议向客户端公开业务逻辑的程序。它提供对业务逻辑的访问,供客户端应用程序使用。服务器使用这种业务逻辑就像调用对象的方法一样。应用服务器是您的应用的服务器,提供应用服务,或者它可以是您自己的网络应用服务器。 为什么要使用应用服务器?有什么好处? 当您需要与现有的数据库和服务器(如网络服务器)集成时,您应该使用应用服务器。它可以通过启用集中式方法来提供数据和代码完 继续阅读
王道计算机网络学习笔记(3)——数据链路层
前言 文章中的内容来自B站王道考研计算机网络课程,想要完整学习的可以到B站官方看完整版。 三:数据链路层 3.1:数据链路层功能概述 结点:主机、路由器 链路:网络中两个结点之间的物理通道,链路的传输介质主要有双绞线、光纤、微波。分为有线链路和无线链路 数据链路:网络中两个结点之间的逻辑通道,把实现控制数据传输协议的硬件和软件加到链路上就构成数据链路 帧: 继续阅读
数据预处理和模型架构是提高人脸识别模型准确率的关键
人脸识别技术作为计算机视觉领域的一项重要技术,被广泛应用于安全监控、身份验证、智能交通、人脸支付等领域。如何提高人脸识别模型的质量,是人脸识别技术研究的重要方向之一。下面将从数据预处理、模型架构、损失函数等方面来探讨提高人脸识别模型质量的方法。 一、数据预处理 数据在机器学习中占有至关重要的地位,数据预处理对于提高人脸识别模型的准确率非常重要。以下是一些常见的数据预处理方法: 1、图像增强 继续阅读
自然语言处理数据增强魔法书:轻松解锁NLP技巧与方法
❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈 (封面图由文心一格生成) 自然语言处理数据增强魔法书:轻松解锁NL 继续阅读
大数据和人工智能概念全面解析
一、大数据和人工智能 大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。根据麦肯锡全球研究所的定义,大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求,使数据能够从量变到质变,真正产生价值。随着大数据的发展 继续阅读