상세 컨텐츠

본문 제목

RAID 란?

IT/전산 상식과 Tip

by 후즈테크 2020. 11. 14. 23:08

본문

반응형

RAID (Redundant Array of Independent Disks) 란?

 

소용량 저장장치 여러 대를 배열로 묶어서 대용량 저장장치를 만드는 기술로, 가격이 저렴하고 장애 발생시 복구 기능이 있어 서버 컴퓨터에서 널리 사용되는 기술이다. (*두산백과 참조)

 

당췌 무슨 말인지 모르는 분들을 위해 내용을 풀어 설명해보겠습니다.

 

앞서 NAS를 설명하며 RAID라는 기능에 대해 언급한 적이 있습니다.(NAS에도 사용되는 RAID)

  NAS란? 링크 : whosetech.tistory.com/22

 

NAS를 사용해 봅시다(자료 저장, 보관, 백업)

NAS를 사용해 봅시다 ^^ 개인 업무량이 많은 분이나 중요도가 높은 작업을 하는 분들을 보면 자료 보관이나 백업에 대해서는 방법을 잘 모르는 경우가 많은 걸 보게 됩니다. 중요자료를 보관하는

whosetech.tistory.com

 

1. 하드디스크(HDD)는 소모품이다.

컴퓨터에 대한 지식이 많지 않으신 분들도 PC 자료들이 하드디스크(HDD)에 저장된다는 내용은 알고 계실 겁니다.

그래서 USB나 일반 PC를 사용하다 해당 장치(HDD)가 고장이나면 우리는 거기에 저장된 DATA를 손실하게 됩니다.

 

일반적인 가정용으로 사용하던 장치였다면 잠깐의 불편함 뿐이겠지만, 업무용으로 사용하거나 회사 등에서 서버로서의 역할을 하고 있는 장치라면 해당 장치의 고장은 손실로 이어집니다.

 

여기서 드는 대부분 사람들의 의문은.... 난 한번도 DISK가 고장난 적은 없었던 것 같는데? 라는 생각입니다.

(하지만 우리는 자기도 모르는 순간에 다들 겪어봤다.....)

 

일반 개인적인 용도로만 사용할 경우, 장치를 사용하는 시간이 하루 중 5~6시간을 크게 넘지 않을 것이다. 그래서 PC를 2~3년 사용하였을 때에는 하드디스크(HDD)가 고장났던 경험을 가진 분은 적을 것이나, 사실 하드디스크(HDD)와 같은 저장장치는 소모품입니다. (사용 빈도가 높고 오래 되면 고장이 난다는 뜻이다. 원형 판에 기록하는 HDD와 전자 칩에 기록하는 SSD 모두 소모품입니다. 참고로 HDD의 경우 25만 시간 정도 사용가능하다라고 제품 설명서 등에 기술되어 있어......약 28.5년을 사용할 수 있을 것 같지만, 설명서 일뿐 실제 사용처에서는 대부분 5년을 넘기지는 못하는 것 같다.)

5년에서 10년정도 수없이 읽고 쓰기를 반복하면 녀석들이 지쳐서 (여러 가지 물리적인 원리가 있지만, 쉽게 말해서 지치는 것이 맞다.) 읽고 쓰는 능력이 퇴화되며 속도가 느려지고, 결국에는 읽고 쓸수 없는 부분인 불량섹터가 발생하게 됩니다.

이러한 불량 섹터가 발생하게 되면 사용중 블루스크린이 뜬다던지? 화면이 멈춘다던지 하는 증상이 일어날 것입니다.

반응형

 

2. 하드디스크(HDD)가 고장이 나면 복구 할 수 있나요?

그럼 하드디스크가 고장나면 안에 있는 DATA는 복구 할 수 있을까?

요즘은 복구 프로그램을 이용하여 일부 DATA를 복구 할 수 있는 기술들도 있다. 하지만 DATA를 100% 복구 가능하다고 말하는 곳은 없고, 복구를 위한 시간(이동시간 + 복구 작업 시간) 동안의 업무의 공백이 발생한다.

담당자 1명의 PC라면 손실이 적지만, 전체 직원이 사용하는 서버가 멈추게 된다면? 아마 그 손실은 추정하기 어려울 정도로 커질 것입니다.

 

 

3. RAID? 1차적인 DATA 손실 방지와 업무 안정성을 높히는 기술

이러한 손실을 막기 위해 HDD 를 2개 이상 사용하여 RAID라는 기술로 디스크를 묶어 주게 되면 DISK가 고장 나더라도 DATA 손실을 막을 수 있고, 정상적으로 서버 또는 장치를 운용할 수 있습니다. (확률적으로도 2개의 DISK가 동시에 고장나는 확률은 현저히 낮다.)

 

 

4. RAID의 종류? RAID는 어떻게 저장하는 건가요?

이러한 RAID에도 몇 가지 종류가 있는데, 각각의 구성에 따라 필요한 DISK의 갯수와 효율등이 차이납니다.

 

가장 쉬운 예로 2개의 DISK에 똑같은 데이터를 중복하여 저장을 했다면(RAID-1 / 미러링), 1개의 DISK가 고장 나더라도 DATA의 손실이 없고(1개는 정상이기 때문에), 서버 등도 정상 운용된다.(무정지) 별표 5개

 

명칭 HDD 갯수 허용 가능한
HDD 장애
볼륨 용량 효율
(HDD*갯수 대비)
RAID-0 >=2 0 1 X (HDD크기) 100%
RAID-1 2 1 최소 HDD 1개 용량 50%
3 2 33%
4 3 25%
RAID-5 >=3 1 (N-1) X (최소 HDD 1개 용량) (N-1/N) X 100%
3개 기준, 67%
4개 기준, 75%
RAID-6 >=4 2 (N-2) X (최소 HDD 1개 용량) (N-2/N) X 100%
4개 기준, 50%
5개 기준, 60%

 

 

 

RAID-0 : 속도 향상을 위한 기능데이터를 블록 단위로 나누고 나뉜 블럭을 여러 드라이브에 분배하는 "스트라이프" 제공, 데이터 중복을 제공하지 않으며Disk 장애 시, 복구 할 수 없음.

RAID-0



RAID-1 : 동일한 데이터를 모든 드라이브에 동시에 저장. 데이터가 중복 저장되어 1개라도 정상동작을 할 경우, 데이터가 정상적으로 운용 가능, 완전히 동일한 데이터를 모든 디스크에 저장하므로 효율은 가장 떨어짐(디스크가 늘어날 수록 효율이 낮아짐). RAID-1을 사용할 경우, 디스크 3개 이상 쓰는 경우는 드물며, 보통 2개를 사용함.

RAID-1



RAID-5 : 패리티 데이터(Parity Data)를 사용중인 디스크에 분산하여 저장하여 디스크가 1개 고장나도 정상 동작함. 데이터 중복을 제공하며, RAID-1 보다 용량적인 면에서 효율적임. 병렬로 묶게될 디스크 갯수가 늘어날수록 디스크의 용량적인 측면에서 효율성이 높아짐 (3개 사용 67%, 4개 사용 75%)

RAID-5


RAID-6 : 2개의 패리티 데이터를 저장하여, 2개의 디스크가 고장나도 정상동작하여 RAID-5보다 안정성면에서는 뛰어남(용량적인 측면에서는 낮음), RAID-5와 동일하게 디스크 갯수가 늘어날수록 디스크의 용량적인 측면에서 효율성이 높아짐(4개 사용 50%, 5개 사용 60%)

RAID-6

아래는 사용 빈도가 낮은 RAID 종류

RAID-3, RAID-4 : 데이터를 검증하는 패리티 데이터가 한 디스크에 집중되어 부하가 높음.

                      아래 그림을 보게 되면 디스크 번호를 0 ~ 4까지로 명시되어 있고,

                      패리티 데이터가 포함된 부분은 P라고 표시되어 있다.

                      RAID 3과 4는 데이터가 수정될 때마다 항상 4번 디스크도 수정되어야 하기 때문에 4번 디스크가 고장날 확률이 가장 높다(사용 빈도가 높기 때문에...DISK가 소모품임을 먼저 명시한 이유)

                      해당 문제를 개선하기 위해 RAID-5가 제안되었고, RAID3,4는 사용되지 않는다.

                      RAID 5는 패리티 데이터가 분산되어 있어 다른 디스크의 데이터가 수정되더라도 특정 디스크의 수정이 이뤄지지 않기 때문에 디스크 1개의 집중적인 과부하를 제거 할 수 있다.

 

 

RAID-10 : RAID-0과 RAID-1의 복합형

 

RAID-1E : 홀수개 일 때 RAID-1 적용하는 방식

 

등도 있으나, 사용 빈도가 낮으므로 더 자세히 알고 싶으신 분은 검색을 추천드립니다. ㅋㅋ

 

 

 

결론 : OS 등 필수적인 부분에서는 RAID-1(미러링) 사용

        데이터는 RAID-5 또는 6을 사용하되 용량이 우선시 될 경우 RAID-5, 안전성이 우선시 될 경우 RAID-6을 사용

 

 

 

5. RAID? 그렇게 좋으면 나도 쓰고 싶은데

여기서 먼저 짚고 넘어가야 할 부분은 RAID를 지원할 수 있는 컨트롤러가 해당 장치에 있어야 한다.....일반적으로 개인용 PC는 컨트롤러가 없기 때문에 RAID를 지원하지 않는다.(개인용 NAS를 권장하는 이유)

 * 하드웨어 RAID에 관한 내용이며, 펌웨어나 소프트웨어 RAID는 제외한다.

 

 

6. RAID만 사용하면 DATA가 안전한 건가요?

RAID는 DISK의 고장시, 1) 서비스의 중지 없는 운용상태 유지2) DATA의 1차적인 손실(HDD 고장)에 대한 DATA 손실 방지의 목적이 가장 뚜렷할 뿐, 랜섬웨어 등과 같은 바이러스에 감염되게 되면 RAID에 구성된 DISK의 DATA도 손실하게 된다. 그렇기 때문에 'RAID만 있으면 안전해' 가 아닌, 별도의 보안(방화벽, 백신, 스냅샷) 등과 같은 대처 방안이 필요하다.

 

 

끝~!

 

 

* 참고 : 실제 구성에서의 RAID 확인

 

1. NAS 에서 RAID5 구성(7.27TB * 4) - 해당 제조사의 경우 웹페이지형의 관리툴 지원

   : RAID 5는 1개의 패리티 디스크 사용으로 디스크가 3개 이상일 때 사용 가능하며, 전체 효율은 (N-1)* 1개 최소 용량 이다.  3* 7.27 = 21.81 TB

2. 서버에서 RAID-1 - 해당 사(HP)의 경우 프로그램을 통한 관리 페이지 지원

   : RAID 1을 2개의 디스크로 구성하였으며, 빨간색은 논리형 구성, 파란색은 물리적 구성이다.

    우리가 위에서 본 내용은 파란색에 해당하는 부분으로 2개의 300 GB의 디스크를 통해 RAID 280GB을 구성하였고, 

    빨간색의 논리적 드라이브 생성을 통해 C드라이브와 D드라이브에 각각 200GB, 약 80GB를 구성하였다.

    왜 300GB가 아닌 280인지는 구성에 대한 일부 손실로 빨간색의 논리 드라이브에서 괄호안에 표시된 부분으로 실제 용량은 214.75GB와 85.22GB 로 둘을 더 할 경우 300 GB가 된다.

반응형

관련글 더보기

댓글 영역