RH436 UNIT 1 CLUSTERS AND STORAGE

Unit Goal

1. 了解clusters分类;

2. 明白根据不同的环境选择不同的clusters

3. 熟悉课程实验环境

Unit Sections

1. cluster的定义

2. Storage设备

3. RedHat Storage模型

4. 熟悉课程实验环境

Hands-On Activities

None

Unit Test

配置你的实验环境

What is a Cluster

所谓的Cluster指的是计算机群(多台计算机)共同完成一个task,不同的task需求不同,也就需要不同的cluster支持,根据需求不同,将cluster分为下列三类:

1. 负载均衡集群(load-balanling):cluster中的所有node在同一时间,执行相同的任务,来自客户端的请求将随机分配到某个node中;

2. 计算机集群(computer cluster):HPC(High Performance Computing)高性能计算,将task分成几个大块分给不同的node去处理,等同于一个task可以享有多台node的CPU,MEM;

3. 高可用集群(HA cluster,failover cluster):用于保持服务的可靠性,也被称为故障转移cluster,双机;当处于Active的node出现故障时,将Passtive切换为Active保证service正常运行。

大部分开发公司所产品承载在client端或者web端,使用tomcat,Webphere 作为中间件,使用负载均衡集群;如果单node的模式可以承载业务,也可以使用高可用cluster;只有需要大量计算时,例如科学研究等方面,会用到计算机集群。

When to use HA Clustering

在选择cluster类型的时候,先确定自己的需求,需要高性能,failover,还是负载均衡。某些service不需要集群的支持,例如 dns ldap,因为使用主备的环境,在client端直接配置多个服务器也可以达到HA的效果;

例如nfs samba这样的服务没有内置的故障转移功能,则需要使用HA cluster。

what is a Cluster?

Please answer the following questions:

1. The major goal of a compute cluster is (C)

a. To equally distribute load between nodes

b. To keep services as available as can be

c. To perform large amounts of calculations

2. The major goal of a load balancing cluster is (A)

a. To equall distribute load between nodes

b. To keep services as available as can be

c. To perform large amounts of calculations

3. The major goal of a high availability cluster is (B)

a. To equally distribute load between nodes

b. To keep services as available as can be

c. To perform large amounts of calculations

4. Which of these service would be a candidate for inclusion in a HA cluster? (B,C)

a. DNS

b. NFS

C. FTP

D. Kerberos KDC

Storage TechnologiesDifferent Types of Data

如果你仔细观察,可以将数据类型分为以下几类:

1. System Data versus User Data 系统数据 vs 用户数据

2. Static Data versus Dynamic Data 静态数据 vs 动态数据

3. Current Data versus Archived Data 近期数据 vs 归档数据

4. Easy-To-Replace Data versus Hard-To-Replace Data 容易移动替换的数据 vs 难以移动替换的数据

5. Often Accessed Data versus Hard-To-Replace Data 经常访问的数据 vs 不经常访问的数据

6. System Specific Data versus Common Data 系统特殊数据 vs 普通数据

7. etc 配置数据

分析你的数据类型,从而通过分析结果选择合适的Storage Technologies。For example,现在有几百后者几千G的archived Data,内容基本上都是用户的历史数据,这些数据一年可能就被访问1,2次。并且在访问之前你有充分的时间做准备,访问可预知。那可以选择magnetic tape(磁带)或者a slower filer,这样做的意义要大于将这些Data 放入state-of-the-art,high throughput,low latency SSD。

另一个例子,你有一个database,访问量很大,每秒都有成千上万的交易记录,那么你需要使用raid array,需要使用 fast disks,而不能将data放在a single old ATA hard drive。

Storage Technologies

现在有很多类型的storage technologies可选择,有些速度比较快,有些则更可靠,安全或者便宜,有些目前流行或者已经被淘汰的:

% Paper 纸

% Flash-based storage 基于闪存式的

USB sticks

Flash card: compactFlash(CF),secure Digital(SD),etc

CF卡(Compact Flash)是1994年由SanDisk最先推出的。CF卡具有PCMCIA-ATA功能,并与之兼容;CF卡重量只有14g,仅纸板火柴般大小(43mm x 36m x m3.3mm),是一种固态产品

Secure Digital通常缩写为SD,作为一种记忆卡,全名应该是Secure Digital Memory Card,中文翻译为安全数码卡或直接称为SD卡,是一种记忆卡的标准

Solid-state drives(SSD) 固态硬盘

% Magnetic Tape 磁带

9-track reel tapes

DDS (Digital Data Storage on DAT)

DLT (DIgital Linear Tape)

LTO (Linear Tape-Open)

% Rotating Magnetic Platters 旋转磁盘

Hard disks (using various interconnects)

% Optical Storage 光驱

CD-ROM ,CD –R , CD-RW

DVD-ROM,DVD-R(W),DVD+R(W)

Blu-Ray discs:BD-ROM,BD-R,DB-RE 蓝光磁盘

当将数据承载介质连接cpmputer时,有多个选项,包括物理连接,使用的协议和存储硬件。实质上,这些特性大多都是绑定在一起的。某一介质所使用的协议和存储硬件连接方式都是固定的。

有很多种区分存储的方法,,首先我们可以将存储区分为 Direct Attached Storage (开放式系统直连式存储)简称DAS,和Shared Storage。DAS上的块直连到computer上,所以DAS只能连接一台computer。常见的DAS如SCSI,IDE/ATA,SATA和SAS。这些DAS设备的最大吞吐量有很大的差异,for example:SAS drive的最大吞吐量要高于SATA设备。

当storage是用来连接cluster的时候,往往需要shared storage;Shared Storage可以分为两种:Network Attached Storage(NAS) (网络附属存储)和Storage Area Network(SAN),两种storage最大的区别是访问data的方式,NAS使用network来访问(例如 NFS or CIFS),而SAN是storage和client建立area network。

访问SAN有多种方式,一些SAN使用Fibre Channel(光纤通道),使用Host Bus Adapters(HBA 主机总线适配器)和 Fibre switches(光纤交换机)形成光纤存储。另外一些SAN使用Ethernet network进行传输,使用iSCSI(internet SCSI)或者 FCoE(Fibre Channel over Ethernet 以太网光纤通道) 通信协议。

目前large storage arrays or filers通常一部分使用 NAS shared,一部分使用SAN驱动,还同时满足fibre channel based access,像iSCSI 和 FCoE。

Fibre Channel

Fibre Channel可以使用线速来进行分类,分为1Gbps to 16Gbps,20Gbps已经正在发展之中。Fibre Channel设备的价格要比Ethernet设备昂贵的多,通常Fibre Channel设备用于实现低延迟和高吞吐量的需求。

连接Fibre Channel设备有3种模式:

Point-to-point:使用fibre optic cable(光缆)(or through a Fibre Switch)将两台Devices直连。

Arbitrated Loop(仲裁环路):光纤信道网的基本配置模式,形成一个环路,网络数据包从一个设备传输到令一个设备直到到达目的地,这种配置比较简单但是单节点的故障会造成整个环路瘫痪。

可我,仍在旅行的路上徘徊。等待着每一辆经过的车,让我走到更远的地方。

RH436 UNIT 1 CLUSTERS AND STORAGE

相关文章:

你感兴趣的文章:

标签云: