본문 바로가기
호기심_메모

Grid Computing

by 겸손, 빚진자, 늘 배우는 사람, 배운것을 실습해보는 사람 2015. 4. 2.
반응형

그리드 컴퓨팅 개념

그리드 컴퓨팅은 인터넷상에 연결된 수많은 컴퓨터를 가상의 단일 컴퓨터로 만드는 개념이다.

인터넷이 웹 서버에 연결된 수많은 클라이언트들이 접속하여 정보를 가져가는 개념이었다면,

그리드는 모든 컴퓨터들이 서로 연결되어 저장공간 데이터, CPU 등의 모든 가용 자원들을 공유하는 개념이다.

이렇게 하면 적은 비용으로 거대한 슈퍼컴퓨터를 만들 수 있게 되며

그리드로 연결된 슈퍼 컴퓨터는 암이나 백혈병 연구 유전자 분석 기상 예측 등 일반 슈퍼 컴퓨터로도 어려운 연산 작업을 저렴한 비용으로 대체할 수 있을 것이다.

즉, 그리드 기술은 하나의 작업을 지구상의 모든 컴퓨터와 모든 기계 장치의 연결을 통하여 구축되는 가상의 슈퍼컴퓨터를 통하여 처 리하는 것이다.

그리드는 전산분야에서 새롭게 부각되는 하나의 중요한 기술로서 대규모 자원공유, 혁신적인 애플리케이션, 고성능 등에 초점을 맞추고 있다는 측면에서 전통적인 분산 전산환경과는 구분된다.

   

그리드 컴퓨팅은 최소한 다음 세가지 특성을 , 만족하여야 한다.

- 분산 자원을 통합하여 제어할 수 있다.

- 표준화된 개방형 프로토콜과 인터페이스를 사용한다.

- 양질의 서비스를 제공한다.

   

그리드 컴퓨팅 관련 기술

그리드 컴퓨팅 개념은 슈퍼컴퓨팅 관점에서 접근하는 방식과 웹 기반 서비스 측면에서 접근하는 방식이 있다.

슈퍼컴퓨팅 관점에서 접근하면 클러스터와 병렬 프로그래밍과 같은 기술들이 비교 대상이 되고

웹 기반 서비스 측면에서 접근하면 현재 통합 서비스의 화두인 웹 서비스 기술과 접목된다.

   

(1) 슈퍼컴퓨터 관점

•클러스터

클러스터는 로컬 지역 내의 컴퓨터 여러 대를 네트워크를 이용해 동일한 시스템 환경에서 상호 연결하여 규모가 큰 하나의 가상화된 컴퓨터처럼 총체적인 서비스를 제공하는 독립적인 개체이다. 지금까지 클러스터는 미들급 슈퍼컴퓨터를 대체할 수 있는 기술로 인식되었는데 향후에는 그리드 컴퓨팅이 클러스터가 담당하는 업무를 대체할 수 있는 기술로 자리잡을 것으로 보인다.

   

•병렬 컴퓨팅

병렬컴퓨팅은 순차적으로 진행되는 계산 영역을 여러 개로 나누어 각각을 여러 프로세서에서 동시에 수행되도록 하는 것이며,

현재의 병렬 컴퓨팅 환경은 MPP와 분산 컴퓨팅으로 나누어 생각할 수 있다.

MPP(Messively Parallelized Pro- cessing)는 수백 개의 CPU를 하나의 시스템으로 구성하고 수백의 메모리를 공유 GB 혹은

분산하여 사용한다.

분산컴퓨팅은 MPP보다 작은 규모의 문제에 적합한데 보통 네트워크를 통해 메시지를 서로 전달하는 워크스테이션 클러스터의 경우가 이에 해당한다. 분산 컴퓨팅의 장점은 서로 이질적인 컴퓨터 시스템들을 묶어서 사용할 수 있다는 것이다.

   

• OGSI / OGSA

그리드 미들웨어의 표준으로 OGSA가 대두되고 있다.

OGSA 는 웹 서비스와 그리드 컴퓨팅 분야를 통합 및 활용 가능한 일 련의 규격 및 표준으로서 오픈 커뮤니티인 그리드포럼이 이끌어 , 가고 있다.

OGSA 그리드 컴퓨팅에 필요한 프로토콜을 정의하여 인터넷 을 통한 대규모 공동 작업과 응용 프로그램에 접근이 가능하도록 설계한다. OGSA 표준은 그리드 기술을 채택하는 기업을 지원하기 위해 개발되었으며 다음과 같은 역할을 수행한다.

   

- 분산된 이종 플랫폼에 걸쳐 자원을 관리

- 통합된 그리드 자원에 걸쳐 완벽한 QoS를 제공

- 자율 관리 솔루션의 공통 기반을 제공

- 개방형의 공개 인터페이스를 정의

- 산업 표준 통합 기술을 활용

- 기존 자원과 통합

   

그리드가 기존 분산 시스템과 차이점은 수용 가능한 시스템의 수가 무한대이며 이기종의 시스템을 기본으로 하며 컴퓨팅 자원 , , 의 동적인 추가와 삭제가 가능하다는 것이다 또한 컴퓨팅 액세 . , 스 등의 다양한 서비스를 지원하고 컴퓨팅 자원에 접근 및 사용 에 있어서 투명성을 제공하는 것이 큰 차이점이다 이러한 그리 . 드는 해석하는 문제 및 방법에 따라 계산 그리드, 데이터 그리드 , 액세스 그리드로 구분하고 있다.

   

•계산 그리드

지역적으로 분산된 대규모 계산 자원을 이용하여 거대 문제를 해석할 수 있는 것으로 초당 수억에서 수십억개의 미지수를 동시 에 해결할 수 있다 따라서 연구자들의 오랜 숙제이며 요구사항, 인 지구 생성 규명 실시간 항공기 설계 등을 가능하게 한다 ,

   

•데이터 그리드

바이오 분야와 같이 페타 바이트의 자료를 분산 저장하고 활용 하는 연구분야에 해당된다

   

•액세스 그리드

다수의 연구자가 가상현실 기반에서 동시에 협업연구를 수행하 는 것이다.

   

   

   

그리드 컴퓨팅 기반으로의 리눅스

가트너는 리눅스가 그리드 컴퓨팅의 기반이 될 수 있는 이유로 다음의 네 가지를 들고 있다.

   

1. OGSA(Open Grid Services Architecture)는 커뮤니티 참여와 코드 공유라는 오픈 소스 개념하에 만들어진 서비스 아키텍처이다.

IBM 과 그리드 개념의 선두 주자인 Ian Foster 에 따르면, 그리드의 장기적인 성공은 Open Standard,Open Software, Open Infrastructure, 기업용 도입을 가속화 하기 위한 그리드 서비스의 상업화라는4가지 요소에 의해 좌우된다. OGSA 의 기본이 된 Global Toolkit 도 커뮤니티 기반, 오픈 소스 아키텍처인 오픈소스 형 서비스와 소프트웨어 라이브러리이다. Globus 는 보안, 정보 검색, 자원 관리, 데이터 관리, 커뮤니케이션, 에러감지, Portability 같은 이슈들을 다룬다. 이러한 Globus 는 Linux 커널의 발전과 진화를 가져온 커뮤니티프로세스와 같은 형태임을 알 수 있다. 즉, 리눅스가 이와 같은 오픈 소스 프로세스를 통해 발전해 온 것을 볼 때, 그리드컴퓨팅 프로젝트와 리눅스는 매우 유사하다 할 수 있다.

   

2. 그리드 개념은 플랫폼의 OS 아키텍처와 긴밀하게 묶인 수직적이고 단일한 자원보다는

분산된 자원(distributed resource)의 관리에 기반을 두고 있다.

리눅스는 그리드 아키텍처와 같은 소형 하드웨어 사양의 단순한 어플리케이션 환경에서 높은 효율성을 갖는 OS로 명성을 쌓아왔는데, 이러한 특성이 분산된 환경의 그리드 컴퓨팅과 일맥 상통한다. 또한, 그리드 아키텍처는 수평적이며 분산된 컴퓨팅 자원을 이용 하면서 특정 어플리케이션 별로 구축이 될 수 있다. 이러한 특성으로 소규모의 분산된 시스템이 상품화 되면서 작고 저렴한 규모의 자원들이 부가적으로 구축될 수 있는데, 이는 단일한 대규모 시스템이 4~5년 후에 구형으로 전략하여 운영 예산이 많이 드는 것과 대조적이다.

   

3. 그리드 컴퓨팅은 버츄얼 형태의 수평적 확장이 가능한 구조이며, 개방형 네트워크 프로토콜을 사용한다.

그리드 네트워크의 도입 초창기는 대부분이 대학, 기술 실험실, Bio-Informatics 조직 등에서 과학적, 기술적인 컴퓨팅 환경으로 개발된 사례들이 주를 이룬다. 이들 중 대부분은 유닉스와 리눅스 같은 운영 체제에서 활용되어 왔다. 

예를들어, Tera Grid 는 3000개 이상의 인텔 프로세서를 리눅스 작동을 위해 운영하며, National ScienceFoundation 이 질병 진단, 치료법/의약품 개발, 대체 에너지 조사등과 같은 복잡한 과학적 연구 분야를 지원할 것이다.

   

4. 업체들의 추진력이 리눅스를 확산시키고 있다.

IBM 의 그리드 아키텍처 블록 다이어그램이 OGSA 프레임 워크를 따르면서 IBM 그리드 전략의 중심에 리눅스가 있음을분명히 하고 있다. Sun, HP, 후지쯔, Silicon Graphics, Microsoft 와 같은 업체들도 그리드에 대한 추진을 하고 있다. Sun 은 Linux 를 위해 활용 가능한 컴퓨팅 자원 리스트를 제공하는 Sun ONE Grid Engine을 출시하였으며, HP 역시 유틸리티 테이터 센터에 그리드 개념을 도입하여 리눅스나 HP-UX를 위한 온디멘드(On-Demand) 컴퓨팅을 지원하도록 하고 있다. 

   

그리드 컴퓨팅은 대규모 시뮬레이션, 원격 데이터 검색, 대용량 컴퓨팅과 같은 주로 대용량 연산을 위한 기술로 개발되며 발전해 왔다.

   

   

참고자료 : http://egloos.zum.com/cultima/v/3435476

http://gift.kisti.re.kr/data/IAC/files/KISTI_200412_KSJ_gridcomputing.pdf

   

728x90

'호기심_메모' 카테고리의 다른 글

[서술] OSI 7계층  (0) 2015.10.04
CAE 기술  (0) 2015.04.02
리눅스 파일을 윈도우에서 IDA로 원격디버깅  (0) 2015.03.25
VPN과 구간암호화  (0) 2015.03.25
ActiveX와 Html5  (0) 2015.03.25