Hbase

article/2025/10/11 10:06:16

Hbase

  • 简介
    • hadoop的局限
    • HBase与NoSQL
    • HBase的数据模型
    • HBase的逻辑架构
    • HBase物理存储结构
    • 数据模型
    • Hbase基本结构(不完整版)

简介

hadoop的局限

hadoop主要实现批量数据的处理,并且通过顺序方式访问数据
要查找数据必须搜索整个数据库,如果要进行随机读取数据,效率较低

HBase与NoSQL

  • NoSQL是一个通用术语,泛指一个数据库并不是使用SQL作为主要语言的非关系型数据库。
  • 谷歌的三篇论文,GFS、Mapreduce、BigTable 解决海量数据的传输、计算和存储问题。
  • Hbase是BigTable的开源版本,是建立在HDFS之上,提供高可靠性,高性能,列存储,可伸缩,实时读写NoSQL的数据库系统。
  • 适合数据量特别大的,几十亿数据秒读取。少量数据优势不明显。也就是支持HDFS的随机写操作(下载下来,重新写再重新上传)。
  • Hbase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库系统。
  • Hbase也是apache的顶级项目。

HBase的数据模型

逻辑上,Hbase的数据模型同关系型数据库类似,数据存储在一张表中,有行有列,但从HBase的底层物理存储结构(K-V)来看,更像是一个多维的地图。

Hbase架构很难。

HBase的逻辑架构

在这里插入图片描述

Rowkey :行键,必须存在,系统自带。插入数据时必须带有rowkey,相当于mysql的主键。按照字典序(按位比较)存储。

竖着按照列族切分。office_info、peronal_info均为列族。 和mysql的第一个区别,将很多的列分为不同的列族放在不同的文件夹存储。每个列族(有几百个列)放在一个文件夹存储。

横着按照rowkey的数据量切分,横向的切片叫做region。
store:真正在hdfs里分布存储的数据块。

HBase物理存储结构

在这里插入图片描述TimeStamp:版本及时间戳(实现随机写操作完全依赖时间戳)HBase项目中windows和linux的时间必须调一致。
取时间戳最大的作为最新的数据。可以做到时间同步。

Type:删除操作类型为Delete,插入数据操作类型为Put。

数据模型

  1. Name Space
    命名空间,相当于database,每个命名空间下有多个表,HBase有两个自带的命名空间,Hbase和的default。Hbase存放Hbase内置的表,default是用户默认使用的命名空间。

  2. Region
    类似于关系型数据库的表概念。不同的是HBase定义表只需要声明列族即可,不需要声明具体的列(name:张三,而不需要定义name)。这意味着,往Hbase写入数据时,字段可以动态、按需指定。因此,Hbase能够轻松应对字段变更的场景。

  3. Row
    Hbase表中的每行数据有一个RowKey和多个Column(列)组成,数据按照rowkey的字典数据存储,并且查询数据时只能根据rowkey进行检索,所以rowey的设计十分重要

  4. Column
    Hbase中每个列都有Column Family(列族)和Column Qualifier(列限定符)指定。

  5. Time Stamp
    用于表示数据的不同版本,每条数据写入的时候,如果不指定时间戳,系统就会自动为其加上该字段,值为写入Hbase的时间。

  6. Cell
    由rowkey,column Family:Collumn Qualifier,tim Stamp)唯一确定的单元。cell中的数据时没有类型的,全部都是字节码形式存储。即不区分int float等数据类型,hbase自带字节工具类。

Hbase基本结构(不完整版)

在这里插入图片描述Hbase的数据存在hdfs文件系统,存在Linux磁盘中。
Region放在Region Server中。

  • RegionServer的作用:Data:get,put(增改),delete 。Region:SplitRegion、compactRegion

Master(元数据的入口,管理表结构,DDL)DML管理数据
zookeeper帮助管理,实现高可用。

Master宕机的时候一段时间内,不影响数据的增删改查。

  • Master作用:Table:create/delete/alter 。RegionServer:分配regions到每个RegionServer,监控每个RegionServer的状态

http://chatgpt.dhexx.cn/article/XFO4Oe94.shtml

相关文章

HBase介绍

第1章 HBase简介 1.1 HBase定义 HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。 1.2 HBase数据模型 逻辑上,HBase的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列。但从HBase的底层物理存储结构(K…

hbase数据库介绍,HBASE的特点,表结构逻辑视图,Row Key,列族,时间戳,Cell

HBASE数据库 1. Hbase基础 1.1 hbase数据库介绍 1、简介nosql hbase是bigtable的开源java版本。是建立在hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写nosql的数据库系 统。 它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的ran…

大数据工具——HBASE数据库(一)

一、HBASE基础概念 1.HBASE概念 HBASE是一个数据库----可以提供数据的实时随机读写。HBASE与mysql、oralce、db2、sqlserver等关系型数据库不同,它是一个NoSQL数据库(非关系型数据库) 2.HBase特性 - HBase的表模型与关系型数据库的表模型…

HBase详细总结

1 HBase 浅析 1.1 HBase 是啥 HBase 是一款面向列存储,用于存储处理海量数据的 NoSQL 数据库。它的理论原型是Google 的 BigTable 论文。你可以认为 HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。 HBase 的存储是基于HDFS的,HDFS 有…

HBase详细概述

本文首先简单介绍了HBase,然后重点讲述了HBase的高并发和实时处理数据 、HBase数据模型、HBase物理存储、HBase系统架构,HBase调优、HBase Shell访问等。 不过在此之前,你可以先了解 Hadoop生态系统 ,若想运行HBase,则需要先搭建…

JPG,PNG,BMP图片无损压缩软件

怎么压缩图片文件的大小呢?现在的科技发展迅速,手机或者摄像机拍摄的图片的像素很高,这样也就导致了图片比较大,我们想要将图片上传作为网站的头像或者其他网站平台都会对图片文件大小进行限制,今天教给大家一种压缩图…

深入前端图片压缩

前言 任何研究都不是凭空产生,至少博主是这样的。 在手机端拍照后图片很大,有的甚至有 10M 多。这个时候再去上传图片,可想而知,速度是很慢的。正因如此,便有了前端图片压缩这个需求。 图片格式 传统的图片格式有 gi…

html图片无损压缩,有损压缩和无损压缩的区别是什么

区别:无损压缩是可以完全还原的;而有损压缩还原后不能和原来文件一样,是有一定损耗的。有损压缩两种的基本机制(有损变换编解码和预测编解码);而无损压缩原理有行程编码、霍夫曼编码和算术编码等。 本教程操作环境:windows10系统、thinkpad t480电脑。 有损压缩是利用了人…

6种比较好的“在线图片无损压缩工具”+PDF转换工具

目录 第一:Tinypng 第二:Compressor.io 第三:Kraken.io 第四:Giftofspeed 第五: OptimiZilla 第六:Imagerecycle 第七:(PDF转换工具)ToePub 第一:Tiny…

Android图片无损压缩库ImageCompress使用(最新优化OOM问题的1.0.10版本)

转载请注明出处:https://blog.csdn.net/hh7181521/article/details/81014839 图片压缩一直是Android的一个痛点,相比较于iOS的效果,Android的压缩简直可以用惨不忍睹来形容! 开源库ImageCompress是基于libjpeg-turbo来进行图片的压…

无损压缩技术

一个视频经过有损压缩完成后,会再进行无损压缩,让视频进一步变小。 DCT 变化 DCT 变化的过程又叫量化,经过有损压缩后,数据分散在二维图标中的各个节点上,经过 DCT 变化,会将所有数据集中到某一块。 转换…

使用Tuimgs在线工具对图片无损压缩教程

正文: 图片体积压缩是很多设计师都不陌生的事情,在多数情况下,即使你并不是一位设计师,但是你也可能需要使用到图片压缩,就例如:我们需要存储一张图片到手机的时候,但是这张图片的体积实在是太大了,会占用…

图片无损压缩工具(报名照片压缩至30Kb以下

% 我姐报名的需求 (文中图片都是直接拖入博客编辑器的) 素材选用:邓紫棋照片一张 【排雷】吐槽一下知乎高赞答案提供的方法:右键编辑,重新设置大小 198赞,评论一堆尬吹 用此方法将上图压缩至27.7KB结果如…

图片无损压缩软件哪个好用:试试完全免费的JPG-C 图片批量修整压缩减肥工具吧 | 最新jpg批量修整工具下载

JPG-C是一款完全免费且非常实用的电脑批量图片无损压缩软件,基于Net开发,也叫jpg批量修整工具,第一个版本始于2013年4月份,区区几百KB的超迷你身材但是能力确不容小觑,用户可以根据自定的压缩级别以单个或批量的方式对…

win7查询计算机硬盘sn,电脑win7系统查询硬盘序列号的方法

近些年来,科学技术的迅猛发展,极大地推动了计算机网络技术的进步,计算机网络的日益发展,使人们的生活也发生着巨大的变化。下面是学习啦小编为大家整理的关于电脑win7系统查询硬盘序列号的方法,一起来看看吧! 电脑win7系统查询硬盘序列号的方法 方法一:我…

win7/win10下装centos7双系统

工具及材料 1、一台PC 2、一个U盘,8G以上 3、需要的文件:CentOS-7-x86_64-DVD-1511.iso(其他版本也可以如 1611) 4、需要的软件:USBwriter(优于UltraISO) 第一步:从windows硬盘分区中再划一个用于装centos的分区 我的电脑->右键->管理,然后 到这里…

计算机系统盘涨满怎么办,win7系统C盘突然就满了怎么办?win7系统盘突然爆满了三种解决方法图文教程...

最近,有win7系统用户反映,电脑的系统盘突然就爆满了,这该怎么办呢?大家可以释放C盘空间,下面脚本之家的小编和大家讲解win7系统盘突然就满了三种解决方法,一起来看看吧。 win7系统盘突然就满了解决方法一:移走虚拟内存文件到非系统盘 大家都知道,为了加快系统的运行,W…

win7修复计算机 正常启动不了怎么办,Win7系统无法正常启动怎么办

Win7系统开机自检之后,始终无法进入系统,重启也无法解决。不要紧,下面是学习啦小编给大家整理的一些有关Win7系统无法正常启动的解决方法,希望对大家有帮助! Win7系统无法正常启动的解决方法一 1.我们可以开机F8进入系统高级选项菜…

Win7系统文件缺失怎么修复

Win7系统文件缺失怎么修复?有些朋友的电脑经常会提示缺失某些文件,比较严重的连系统桌面都进不去,大家想要了解有什么方法可以修复系统文件缺失的问题。今天俺就给大家分享几个恢复系统文件的方法。 一、进入安全模式 在重启或者电脑开机的时…

关于Win7系统“U盘拒绝访问”解决问题

问题场景: 提示:U盘无损坏,不能显示容量,并且提示拒绝访问 在属性中有很明显的不能够更改操作组和用户组的权限,无法添加用户权限名称 解决方案: 1、在系统桌面上,按组合键(win键…