아키텍트2010. 3. 8. 17:51

앞의 글에서 마이크로소프트의 모듈화 데이터센터에 대해서는 언급했었는데 이번 주에 발표된 내용을 조금 업데이트 하려고 합니다. 2010년 3월 4일, 마이크로소프트 데이터센터 총책임자인 Kevin Timmons가 발표한 내용입니다.

대부분의 회사가 겪고 있는 문제 중 하나는 IT 자원이 필요할 때 얼마나 빨리 제공 가능한가 하는 것입니다. 일반 회사의 경우는 IDC(인터넷 데이터센터)에 의존하고 있어서 느끼지 못할 수 있지만 IDC 자체는 공간, 전원 등의 이슈로 인해서 IDC를 새로 구축해야 할 경우가 발생하게 되죠. 이때 비용이 얼마나 발생하게 될까요? 당연히 땅을 구매해야 하고, 쿨링, UPS 등을 고려할 때 천문학적 금액이 소요됩니다. 마이크로소프트의 경우 IDC 1곳을 신규로 지을 때 4~5억불 (약 5천억) 정도를 쓰고 있었습니다.

그런데, 사실은 이렇게 막대한 투자가 바람직하지 않더라는 거죠. 자원이 필요할 때 소규모로 확보한 땅, 또는 빌딩에 컴포넌트화된, 즉 모듈화된 컨테이너를 장착한 후 전력과 네트웍을 연결하면 필요한 IT자원이 제공되는 것이 훨씬 더 비용 효율적, 그리고 빠른 시간에 IT 컴퓨팅 파워를 제공받을 수 있다는 거죠. 클라우드 컴퓨팅이 점점 더 회사의 가장 중요한 비즈니스 모델이 되면서 필연적으로 등장할 수 밖에 없는 이유이기도 합니다. 무한 확장이 가능한 컴퓨팅 파워를 제공하려면, 해당 요청사항을 감당할 수 있는 준비가 되어야 하는 것은 당연합니다.

현재 Chicago 데이터센터 1층, 그리고 Dublic 데이터센터에서 컨테이너 기반의 컴퓨팅 환경을 운영하고 있습니다.
2층은 전통적인 데이터센터로 운영되는 하이브리드 모형이죠.


하지만, 이후의 마이크로소프트 데이터센터는 순수하게 모듈화 데이터센터로만 구축될 것으로 보여집니다.
장점은? 비용이 저렴한 곳을 확보하여 어디든, 언제든 컴퓨팅 파워를 확보할 수 있게 된 것 ! 쿨링 등의 공조는 컨테이너 내부에 설계되어 있고 컨테이너 1대당 1,200대에서 2,100대까지의 서버를 장착할 수 있습니다. PUE (Power Usage Effectiveness) 역시 1.26에서 1.35 정도로 효율성이 뛰어난 것으로 알려져 있습니다. 일반 데이터센터가 2.1 정도 수준이니까 그린 IT에도 일조하는 것이죠.
(PUE는 낮을수록, 1에 가까울 수록 효율성이 높은 것입니다. 데이터센터에 유입되는 전기 중 IT장비가 사용하는 전기의 비율을 의미합니다.  PUE = 유입되는 전기 / IT장비가 사용하는 전기

Posted by 조이트리
아키텍트2010. 2. 1. 10:43

클라우드 컴퓨팅, 필요한 IT 자원을 소유하지 않고 빌려 쓰는 시대의 도래는 모두 느끼고 있습니다. 결국 그 자원을 보유하는 곳은 데이터센터이고, 데이터센터가 사용하는 막대한 전기는 화석연료(석탄)를 이용하고, 그 화석연료를 태우면서 발생하는 CO2가 지구온난화를 일으키고, 소 빙하기 어쩌고 하는 논란으로 이어지는 것을 보면 참 모든 것이 연결되어 있구나 하는 생각을 하게 됩니다.

하지만, IT 자원은 앞으로도 더욱 많이 사용될 것이고, 결국 데이터센터는 더 많이 필요하게 될 것이 분명합니다. 그런데 이 데이터센터가 소모하는 전기의 많은 부분이 쿨링, 즉 데이터센터에서 구동되는 서버들이 내뿜는 열을 식히는데 사용되고 있습니다. 에어컨으로 이 열을 식히려면 정말 정말 많은 전기가 필요합니다. 약 40% 정도를 사용한다고 하죠. 그런데, 재미있는 사실은 지금같이 추운 겨울에도 (무려 영하 15도로 떨어져도) 쿨링 장비는 계속 가동된다는 사실을 아시나요? 외부의 찬공기가 건물 내부로 유입되는 시설이 잘 갖추어져 있지 않기 때문입니다. 우리나라의 봄, 가을, 겨울 중 기온이 15도 이하인 날 수를 따져보면 몇 일 정도 될까요? 365일 중 적어도 150일 정도는 될 것 같은데요, 그렇다면 약 40% 정도는 외부의 온도를 내부로 유입시키면 쿨링 시설을 거의 사용하지 않아도 되고, 쿨링으로 인해 발생하는 전력소모의 40%, 보수적으로 반만 잡아도 20%를 절감할 수 있다는 결론을 내릴 수 있을 것 같습니다. 너무 비약이 심한가요?

마이크로소프트의 클라우드 컴퓨팅 전략 중 유럽, 중동 지역을 커버하는 아일랜드 더블린 데이터센터를 소개합니다. 더블린은 데이터센터를 위한 정말 최고의 입지입니다. 1년 365일 중 약 1달을 제외하고는 외부 기온이 데이터센터 쿨링을 위한 최적의 조건입니다. 그러니까 쿨링 시설을 1개월만 가동하면 되는 거죠.

우리나라는 여름이 덥긴 하지만 봄, 가을, 겨울의 날씨는 충분히 활용 가능하지 않을까요? 그린 데이터센터를 원한다면 계절을 활용하는 것부터 시작해야 할 것 같습니다.

Posted by 조이트리
아키텍트2009. 12. 2. 16:31

아주 신선한 아이디어 아닌가요? 과연 이것이 가능할까요? 가능하다면 정말 유용할 것 같지 않으세요?

첫째, 그린 IT에 대해서는 많은 사람이 관심을 갖고 있기 때문에 마케팅 효과를 얻는데 활용되는 경우가 많습니다. 데이터센터의 열로 가정용 난방을 한다? 이건 대단한 마케팅 효과를 얻을 수 있을 것 같네요. 지금 저도 대신 글을 적어주고 있잖아요?

둘째, 비용을 절감할 수 있다면, 체감하기 어려운 숫자만이 아니라 누가 보더라도 공감할 수 있다면, 이것 또한 더 대단한 것입니다. 바로 이 프로젝트를 진행하는 Academica의 Pietari Paivanen은 계획에 의하면 1년에 $561,000 (한화 약 6.7억)의 난방비를 절감할 수 있다고 밝혔습니다. 아래 사진은 핀란드, 헬싱키의 우스펜스키 사원 입니다. 바로 그 데이터센터가 이 사원의 지하에 건설 중입니다.

일반적인 데이터센터의 경우 실제 컴퓨팅 자원이 사용하는 전력은 50%를 넘지 못하는 경우가 대부분 입니다. 나머지는 교류를 직류로 전환하거나 서버에서 발생하는 열을 식히는, 즉 쿨링에 나머지 50%의 전력을 사용하는 거죠.

데이터센터가 지하에 만들어졌다는 이야기는 사실 처음 들어 보는데, 그 데이터센터에서 발생하는 열을 파이프로 연결해, 그 열을 가정용 난방으로 활용한다? 정말 이노베이티브 한, 디자인 Thinking을 잘 적용한 사례라고 생각합니다.

 

핀란드의 수도, 헬싱키의 우즈펜스키 사원 전경
출처) Reuters

Posted by 조이트리
아키텍트2009. 7. 13. 19:43

데이터센터 규제가 필요할까요? 필요하지 않을까요? 개인적으로 데이터센터 관련 비즈니스를 한 사람으로서 규제는 없었으면 좋겠습니다. 미국, 유럽에서는 데이터센터 관련하여 어떤 이야기가 진행되고 있을까요? 영국의 경우 온실가스 규제가 법제화되고 있는데, 데이터센터도 빠져나가기 쉽지 않을 것 같습니다.

2010년 4월에  Carbon Reduction Commitment (PDF)가 본격 발효될 것 같습니다.
앞의 글에서 PUE(Power Usage Effectiveness)에 대해 설명했었는데, 인터넷 회사의 경우 1.2 정도를 유지하고, 이중화 등이 필요한 기업 (금융권 및 기업군)은 2.0 정도의 값을 유지할 것을 가이드하고 있습니다.
PUE(Power Usage Effectiveness)는 쉽게 이야기하면 데이터센터에 들어오는 전원 중 IT 운영 (서버, 네트웍, 스토리지) 장비가 차지하는 비율을 의미합니다. 즉 100이 들어오는데 IT 장비가 50을 사용하면 100/50, 즉 2.0이 되는 방식이죠.

마이크로소프트와 구글 데이터센터가 현재 약 1.2 수준의 PUE 값을 유지하고 있는 것으로 보여집니다. 마이크로소프트는 데이터센터 Energy Efficiency를 효과적으로 유지하는 방법, 즉 베스트 프랙티스를 공개하여 화제가 되기도 했습니다.

미리 대비하지 않으면 결국 규제를 받게 될텐데, 우리나라는 언제 어떤 시기에 규제를 가하게 될지 알수 없습니다.
사전에 준비가 꼭 필요할 것 같습니다.
Posted by 조이트리
아키텍트2009. 7. 1. 11:01
마이크로소프트가 클라우드 컴퓨팅, 즉 서비스 비즈니스에 엄청난 노력을 하고 있고 Thought Leadership을 갖고 주도하고 있다는 사실은 다 알고 계시죠?

현재까지 클라우드 컴퓨팅을 위한 데이터센터가 미국 내에 집중되어 있었습니다.
하지만, 미국 이외의 지역에 서비스가 가능한 데이터센터, 제1호가 가동을 시작합니다.
아일랜드의 더블린에 30만 평방미터의 데이터센터가 오늘부터 가동을 시작하게 된 거죠.

아일랜드 데이터센터의 크기 보다 2배 이상 큰 (70만 평방미터) 규모의 Chicago 데이터센터가 7월 20일에 오픈 합니다.

이에 앞서 작년 9월에 47만 평방미터 규모의 센터를 Texas, San Antonio에 오픈했고, 2007년 4월에는 50만 평방미터의 데이터센터를 Quincy, Washington에서 이미 가동을 시작했습니다.
바로 이 센터들이 마이크로소프트의 공용 클라우드 Windows Azure, Azure Services Platform 서비스가 구동되는 곳이었는데
그 영역이 훨씬 더 커지게 된 것을 의미합니다. 애저 이외에도 Online, Live 서비스 역시 담당하고 있죠.

여기서 잠깐, 30만 평방미터면 어느 정도 크기 인지 잘 감이 안잡히시죠? 9만평 정도 되네요.
축구장 1개의 크기가 2,200평 정도 되니까 그 사이즈가 어느 정도인지 감이 잡히실 것 같습니다.

마이크로소프트의 "소프트웨어 플러스 서비스" 전략 아시죠? 내부 IT 조직에 의해 구동되는 소프트웨어가 서비스의 장점을 이용하고자 할 때 인증의 통합, 인터넷 서비스 버스, 워크플로우 통합 등이 필요하게 되는데 이런 역할을 Azure Services Platform이 가능하도록 하여 소프트웨어와 서비스가 서로 연결된 (Connected) 세상, 바로 이것이 궁극적인 소프트웨어 플러스 서비스가 실현된 모습이죠. 결국 그 중심에는 데이터센터가 있습니다. 그런 의미에서 데이터센터의 오픈은 엄청 중요한 의미를 갖고 있는 거죠.

더욱 관심을 갖고 볼 대목은 Chicago 데이터센터의 1층, 총 면적의 3분의 2 공간은 컨테이너 박스 개념의 조립식 데이터센터로 만들어 졌다는 것입니다. 이 컨테이너 박스는 에너지 사용이 최적화 되어 있어 그린 IT 구현이 가능합니다. 컨테이너 한대에 장착된 서버의 댓수가 1,800대에서 2,500대 까지 가능하기 때문에 몇 시간 안에 원하는 컴퓨팅 파워를 확보할 수 있게 되는것이죠. 클라우드 컴퓨팅의 무한확장 개념에 딱 들어맞는 데이터센터라고 이야기 할 수 있게 된거죠.

같은 크기의 전통적인 데이터센터보다 10배 이상의 서버를 수용할 수 있는 구조라고 하니, 세상이 많이 발전했죠?

Posted by 조이트리
아키텍트2009. 4. 22. 13:32

지구의 날을 축하하며 마이크로소프트가 데이터센터를 위한 10개의 베스트 프랙티스 공개했습니다.

 

현재 많은 데이터센터 관리자들은 예산 삭감, 비용 절감 등의 강한 압박을 받고 계신데, 그린 IT를 접목함으로 비즈니스에는 비용 절감 효과를 제시하고, 고객 및 정부에는 환경보호라는 가시적인 성과 창출이 가능하다고 생각합니다.

 

하지만, 어디서부터 시작해야 하는지, 그리고 어떻게 하면 좋은지 알기 쉽지 않습니다.  바로 이런 고민을 해결하기 위해 마이크로소프트가 쌓은 지식과 노하우를 데이터센터 산업에 종사하는 분들과 나누려고 합니다. 마이크로소프트의 글로벌 서비스를 제공하는 GFS(Global Foundation Services) 인프라 서비스 팀에서 제공한 10개의 베스트 프랙티스를 공유하려고 합니다. 서버, 칩 개발, 데이터센터의 전기 및 기계적인 엔지니어링, 전력 및 쿨링 아키텍처 디자인, 연구 개발 및 비즈니스 운영 및 관리를 포괄하여 전체적인 내용이 포괄되어 있습니다.

 

환경을 보고하고, 자원 최적화를 통해 핵심 전략과 목표와 잘 조율된 데이터센터를 구축 운영하는데 도움이 되길 기원합니다. 상세한 내용은 첨부의 문서를 참조하세요.

 

1.     Provide incentives that support your primary goals

핵심적인 목적 달성에 기여하는 인센티브를 제공하라

2.     Focus on effective resource utilization

효과적인 자원사용율 유지에 신경써라

3.     Use virtualization to improve server utilization and increase operational efficiency

서버 사용율을 높이고 운영효율성을 향상할 수 있는 가상화를 활용하라

4.     Drive quality up through compliance

컴플라이언스를 통해 품질을 향상시켜라

5.     Embrace change management

변경관리를 채택하라

6.     Invest in understanding your application workload and behavior

애플리케이션의 워크로드와 동작 방식을 이해하라

7.     Right size your server platforms to meet your application requirement

애플리케이션의 요구사항에 맞는 규모의 서버 플랫폼 사이징을 하라

8.     Evaluate and test servers for performance, power, and total cost of ownership

서버의 성능, 전력, 총 소유비용을 평가하고 테스트하라

9.     Converge on as small a number of stock-keeping units as you can

가능한 작은 단위를 모아라

10.   Take advantage of competitive bids from multiple manufacturers to foster innovation and reduce costs

여러 제조사로부터 경쟁입찰을 통해 혁신을 조성하고, 비용을 절감하라


Posted by 조이트리
카테고리 없음2009. 2. 3. 18:03

그림1은 1U 서버의 데이터센터 인프라 비용과 전력 비용을 보여줍니다. 2001년에는 인프라 비용과 전력 비용의 합이 1U 서버의 가격과 같았습니다. 2004년에는 인프라 비용이 1U 서버 비용과 같아졌습니다.
그런데, 2008년에는 에너지 비용 하나만으로도 서버 비용과 같아졌다는 것이죠.
바로 이 에너지 비용이 모든 TCO 계산에 포함되어야 하지만, 대부분의 회사는 인프라 비용, 에너지 비용은 별로 중요한 요인이 아니라고 생각하고 있기 때문에 정확한 값을 알고 있지 못한 것이 현실 입니다.

Image2-1

그림 1 - Christian Belady 2007년 2월, Electronics Cooling Magazine
http://www.electronics-cooling.com/articles/2007/feb/a3/

많은 회사들이 PUE를 적용하는데 적극적이지 않습니다. 이유가 뭘까요? 데이터센터의 효율성을 개선하면 할 수록 에너지 비용을 절감할 수 있는 방법을 찾는 것이 점점 더 어려워 집니다. 데이터센터 에너지 효율성을 어떻게 하면 개선할 수 있을까요? 큰 그림 안에서 해법을 찾을 수 있어야 할 것 입니다.

북미지역의 경우 PUE 값을 사용하는 사람, 회사의 수가 점점 증가하고 있습니다.하지만, 아직은 정말 낮은 비율이라고 할 수 있죠. 그 이유가 뭘까요?

1. 새로운 것에 대한 두려움
    - 데이터센터 관리자가 새로운 지표에 대해 막연한 두려움이 있을 수 있습니다. 리스크를 극히 싫어하는 문화라면
      변경하는 것을 하지 않겠죠. 하지만, 효율화 및 개선을 위해서는 변화가 필수적이죠. 변화는 고통을 수반하지만,
      데이터센터 효율화라는 큰 그림을 그리는데 가치가 있음을 보여주는 값이 바로 PUE 입니다.

2. 누가 측정해야 할까?
    - 어느 조직이 측정하는 것이 가장 바람직할까요? IT부서가 직접 성능을 측정하는 것에 대해 신뢰성이 떨어질 수
      있습니다. 따라서, 해당 값은 조작될 수 없도록 관리부서에 함께 실시간으로 통보되어야 합니다.

3. 인센티브는 어떻게?
    - 데이터센터 운영에 관한 지표를 가지고 있습니까? 에너지 효율화에 대한 지표가 있나요? 에너지 효율화와
      SLA(Service Level Agreement) 사이에 어떤 것에 우선 순위를 둘 건가요? 데이터센터 관리자의 보너스는 어떤
      지표를 기준으로 지급되나요? 각 부서의 전력 사용량에 비례해서 비용을 할당한다면 해당 관리자들은 적절한
      규모의 시스템을 구축하고, 전력을 최소로 사용하는 형태로 인프라를 구축할 거라고 생각합니다. 현재까지 
      전원 효율성에 대한 고려는 별로 하지 않고, 센터에서 차지하는 공간을 기준으로 비용을 책정합니다.

4. PUE는 간단한 지표
    - PUE는 간단한 지표로, 2개의 숫자만 있으면 됩니다. IT 장비를 가동하기 위해 필요한 전력 오버헤드의
      비율이기 때문에 PUE 2.0은 IT 장비 (서버,네트웍,스토리지)를 위해 1 와트가 사용될 때, 전력을 전송하거나
      열을 식히기 위해 1와트가 더 필요하다는 것을 의미합니다.

5. 완벽할 필요는 없음
    - 실시간으로 모든 데이터를 다 얻을 필요는 없다고 생각합니다. 총 전력 사용량, IT 장비를 위해 소요되는
      전력량만 알면 됩니다.

PUE에 대해 조금 더 알아보겠습니다.

기본적으로 PUE는 2.0 정도 되는 것으로 알려져 있습니다. 그렇지만, 데이터센터에 따라서 1.5가 될 수도 있고 3.0이 될 수도 있다는 것입니다. 그림1은 PUE 2.0 입니다.

그림2는 PUE 1.5, 그림3은 PUE 3.0의 그래프를 보여줍니다.Image2-2

그림 2 – PUE가 1.5일 때 인프라 비용에 미치는 효과, Christian Belady, Chris Malone,
“Metrics and an Infrastructure to Evaluate Data Center Efficiency” Proceedings of IPACK2007

Image2-3

Figure 3 - PUE가 3.0일 때 인프라 비용에 미치는 효과

PUE 값과 인프라 및 IT 장비 비용을 통해 위와 같은 그래프를 그려볼 수 있습니다. 위 값을 보시면 알겠지만, PUE 값의 증가에 따라 전체 인프라/에너지 비용이 급격히 증가하는 것을 보실 수 있습니다. 실제 피부에 와 닿지 않습니까? 이런 데이터를 가지고 관련자들에게 정보를 제공하면 인지도 및 PUE 적용이 늘어날 것으로 확신합니다. PUE가 향상된 다는 것은  OPEX(Operating Expenditure) 뿐 아니라 CAPEX(Capital Expenditure)를 줄일 수 있다는 것을 의미합니다.

또한 PUE 값이 얻어지면 다른 센터와의 비교가 가능해집니다. 한 센터에서 개선이 이루어지면 그 정보를 토대로 다른 센터 역시 개선할 수 있기 때문입니다. 모든 데이터센터가 똑같은 PUE를 갖거나 하는 일은 일어나지 않겠지만, 현재보다 더 나은 PUE 값을 얻기 위한 개선작업은 지속적으로 이루어질 수 있을 것 입니다. 기후 조건, 주변 환경에 따라 다른 PUE가 나올 것이기 때문에 여러 가지 항목이 고려되어야 합니다.

앞의 글에 이어서 PUE 관련 글을 적고 있습니다. 다음 글에서는 마이크로소프트의 PUE 적용 노력에 대해 정리해보겠습니다. 마이크로소프트 데이터센터, Global Foundation Service 총 책임자인 Mike Manos의 글을 가져왔습니다

Posted by 조이트리
카테고리 없음2009. 1. 30. 17:54

그린, 녹색성장 등에 대한 이야기가 점점 더 많이 들립니다. 미국 전체 전력의 약 2%를 데이터센터가 사용한다고 합니다. 우리나라는 정확한 통계 데이터가 없지만, 데이터센터 1개가 아파트 약 10,000 가구, 1가구를 4명으로 계산하면 약 40,000명 정도가 사용하는 전력을 소비한다고 하네요.

이 글에서는 데이터센터의 효율성을 보여주는 업계의 표준 지표, PUE(Power Usage Effectiveness)를 마이크로소프트가 어떻게 활용하고 있는지에 대해 정리해보려고 합니다. 데이터센터가 소비하는 전력양을 측정하고 모니터링하는 것은 환경에 대한 영향을 최소화하면서 어떻게 자원을 최대로 활용할 수 있는 방법을 제시해주는 중요한 방법이라고 생각합니다. PUE는 무엇인지, 그리고 이슈들에 대해 언급해 보도록 하겠습니다.

데이터센터의 여러 장치들을 한 번 생각해보세요? 그 중 그린이라고 자신있게 말할 수 있는 곳이 어디인가요?
데이터센터가 훨씬 더 에너지 효율적으로 보이도록 하기 위해서 현재 가지고 있는 장치보다 더 에너지 효율적인 것으로 바꿀 수 있겠죠. 대부분의 회사들이 바로 이렇게 장치를 교체하는 것으로 그린 IT를 구현하고 있고, 에너지 비용을 절감하려고 합니다. 하지만, 이러한 조치는 나무를 보고 숲은 보지 못하는 것과 같이 원하는 성과를 얻지 못하는 경우가 많습니다. (UPS, 쿨링, 공조, 네트웍장비, Firewall, 서버, 스토리지 등) 

대중화되기 위해서는 간단한 지표가 필요합니다. 데이터센터를 위해 PUE는 효율화를 알 수 있는 값입니다.
“즉, IT 장비 (서버,네트웍 장비,스토리지)를 구동하기 위한 에너지 오버헤드를 알려다오”, 이 값이 바로 PUE죠.

마이크로소프트는 이 PUE 값을 위한 활동을 The Green Grid 컨소시엄과 함께 수년간 진행해오고 있습니다. 마이크로소프트는 초기부터 지원해왔고, 현재도 산업 표준으로 적용되는데 많은 기여를 하고 있습니다.

데이터센터는 수천 가지 항목들이 연계되어 있는 아주 복잡한 시설물입니다.
마이크로소프트의 레거시 데이터센터를 가지고 25%의 전력 및 쿨링 개선을 위해 2년이라는 시간이 걸렸고, 개선이 가능한 많은 부분을 분석하였습니다.
PUE는 데이터센터가 사용하는 총 전력을 IT 장비(서버,네트웍 장비,스토리지)가 사용하는 전력으로 나눈 값입니다.

image001

PUE를 사용함으로, 에너지 효율성에 대한 히스토리를 갖게 된 것 입니다. 작년보다 올해 어느 정도 개선되었는지를 알 수 있게 되었다는 것은 큰 의미가 있습니다. 앞에서도 언급했든 데이터센터는 아주 복잡한 시스템이기 때문에 어떻게 운영되고 있는지에 대해 통찰하기가 어렵습니다. PUE값을 사용하면 큰 그림을 볼 수 있게 되고, 여러 가지 장치들이 어떻게 조화를 이루고 있는지를 확인할 수 있기에 의미가 있다는 거죠. 너무 상세한 부분을 보다 보면, 정작 중요한 부분을 간과하는 경우가 많이 있습니다.

PUE  같은 지표가 없으면 엔지니어들은 데이터센터 효율성이 얼마나 개선되었는지 측정할 수 없습니다.
데이터센터 효율화를 높이기 위해 어떤 것을 제일 먼저 하시겠습니까?
제일 쉬운 것부터 하면 될까요? 뜨거운 공기와 찬 공기가 흐르는 통로를 분리하는 방법, 서버룸의 온도를 높이는 방법, 에너지 효율적인 쿨링시스템의 도입 등? 생각날 때 마다 하나씩 적용하지 않고 전략적으로 접근할 수 있나요? 각각의 노력이 미치는 영향에 대한 측정 없이 적용하기 쉬운 작업들을 하나씩 하다 보면 어떤 작업이 어느 정도 효과 적이었는지 알 수 있는 방법이 있나요?

어떤 작업이 어떤 영향을 주었는지 모니터링할 수 있어야 합니다. 어떤 작업으로 인해 효율성이 좋아졌는지, 나빠졌는지를 확인할 수 있는 바로 그 척도가 바로 PUE 라는 것이죠.

PUE를 사용함으로 얻을 수 있는 또 하나의 이점은 전력 및 쿨링 인프라와 에너지 비용을 정확하게 연계하여 에너지 기반의 모델을 사용할 수 있다는 것입니다. 정확한 에너지 사용량에 대한 정보를 알려줌으로 각 사람들에게 그들이 취하는 행동이 어떤 영향을 주는지 생각할 수 있게 하고, 또한 재무 및 회계 부서에도 정확한 정보를 제공하여 향후 인센티브 등의 동기부여 수단으로도 활용 가능합니다.

다음 글에서는 요즘 같은 경제 상황에서 에너지 효율화가 왜 그렇게 중요한지에 대해 다루어보도록 하겠습니다.

이 글은, 마이크로소프트 데이터센터, Global Foundation Service 총 책임자인 Mike Manos의 글을 가져왔습니다.

Posted by 조이트리
아키텍트2008. 9. 23. 10:49

요즘 화두는 저탄소 녹색성장 입니다. 그렇다면 기업에서 탄소 배출량을 어디서 줄일 수 있을까요? 자동차를 하이브리드, 또는 전기자동차로 바꿀 수 있겠죠. 점심시간에 식사하러 갈 때 전기를 끄거나, 컴퓨터 전원을 Off 하거나 하이버네이트, Sleep 모드 등을 사용하는 방법도 쓸 수 있겠죠.

그렇지만, 가장 전원을 많이 사용하는 곳은 바로 데이터센터 입니다. 데이터센터의 전원을 줄이지 않고는 아무리 위에 나열한 일들을 효과적으로 수행하더라도 전기세, 탄소배출량은 획기적으로 줄어들지 않을 것입니다.
데이터센터가 전원을 빨아들이는 Source가 된 이유가 무엇일까요? 최근의 IT 시스템, 서버, 라우터, NAS 장치 등은 더 많은 트랜지스터가 칩에 장착되고, 칩이 더 많은 전기를 소비하는 고성능이기에 문제가 생긴다고 볼 수 있습니다. 더군다나 단위 업무가 요구될 때 마다 1U, 2U, 3U 정도의 소형 서버들이 무수히 많은 서버가 센터에 입고되었죠. 작은 서버가 이렇게 많은 전기를 사용하고, 공간을 차지할 거라고는 누구도 예측하지 못했죠. 실제로 각 서버들의 CPU 사용률은 10% 이내인 경우가 많은데 말이지요. 엄청난 낭비 입니다.

사실 이 소규모 서버들을 구동하기 위해 UPS, Generator, Air Conditioning, 전원 배분 등의 다양한 부가적인 장치들이 필요하게 되기에 비 효율은 엄청 큰 아픔을 남기는 거죠. 상당히 많은 기업이 전력, Cooling, 공간 부족으로 신규 서버 도입에 지장을 겪은 것을 봐 왔습니다. 이런 이유는 많은 데이터센터가 건물 자체에 대한 에너지 효율성을 측정 및 분석하지 않고 있습니다. "측정하지 않으면, 개선은 없다" 제일 기본은 현재 상황을 알고 있어야 합니다.

또한, 전력 사용에 관해 현재 이슈가 제기되는 근본적인 이유가 또 있습니다. 전기세를 납부하는 부서는 주로 센터시설팀이 담당합니다. 서버 도입은 IT 부서에서 진행하죠. 두 부서간의 연결고리가 없습니다. 잘 협의가 되는 회사도 있겠지만, 제가 아는한 그렇게 많지 않습니다. 따라서, 어느 정도나 전원 Capacity가 남아 있고 어디서 전원을 많이 사용하고 있는지에 대해 알기도 쉽지 않죠. "더이상 쓸 수 없습니다."라고 이야기 하기 전에는 잘 보이지 않습니다. 데이터센터의 전력 및 Cooliing을 컨트롤 하는 CIO는 IT 운영비용을 절감하고, 회사의 이익을 높이고, 경쟁사에 비해 비교 우위를 가져갈 수 있는데 말이죠.

데이터센터의 전력 소비량을 측정하고 비교하는 방법이 여러 단체에서 논의되고 있습니다. 그중 작년에 결성된 그린 그리드(Green Grid)가 대표적이며 데이터센터의 효율성과 생산성을 나타내는 지표를 발표하였습니다. 데이터센터의 총 소비 전력 대비 IT 장비가 사용하는 전력을 비교하여 데이터센터의 효율성을 알아볼 수 있는 것입니다.
"측정이 쉽고, 핵심을 나타내주는 지표"로 받아들여 지고 있고, 향후에는 Premium, Gold, Silver, Bronze 데이터센터등의 지표를 데이터센터에 부여하는 노력도 함께 진행되고 있습니다.

첫째, PUE(Power Usage Effectiveness) = 데이터센터 전체 전력 / IT 장비가 사용하는 전력
        만약 IT 장비에 1,000 watt가 필요할 때 데이터센터는 전체적으로 2,000 watt 보다는 적게 필요해야 한다. 
        즉, PUE가 2보다 적어야 한다고 규정하고 있습니다. 1.4 정도면 최적의 상태로 규정하고 있습니다. 

둘째, DCiE(Data Center Infra Efficiency) = IT 장비가 사용하는 전력 / 데이터센터 전체 전력 * 100 
        즉, 데이터센터의 효율성을 알 수 있는 겁니다. 위의 예를 보면, IT 장비에 1,000 watt가 필요한데
        데이터센터는 2,000 watt가 필요하다면, 해당 데이터센터는 50%의 효율성을 보이고 있다는 거죠

위 2가지 지표는 Global하게 받아들여지고 있는 지표 입니다. 국내 기업들도 한 번쯤 고려해볼만한 Metric 이라고 생각됩니다. 이렇게 측정되고 관리되면, 개선할 수 있고, 개선된 규모의 전력 및 탄소배출량을 통해 그린컴퓨팅 환경을 갖게 되는 것이 핵심 논리 입니다.

       
Posted by 조이트리
아키텍트2008. 9. 8. 16:47

과거에는 데이터센터 디자인을 할 때 물리적인 공간 비용, 즉 상면 비용이 핵심 고려사항 이었습니다. 하지만, 최근에는 전력 및 쿨링 비용의 급격한 상승으로 전력 및 쿨링의 효과적인 설계가 총 TCO를 줄일 가장 중요한 요인이라는 것이 밝혀졌죠.


※ 위의 그림에서 보듯 서버 숫자는 많이 늘었지만, 전체적인 전원 소비량은 그만큼 증가하지 않았음을 보실 수 있습니다.

비용 및 에너지 효율이 고려된 데이터센터 설계

마이크로소프트는 데이터센터를 24시간 구동되는 하나의 대형 컴퓨터로 보고 설계합니다. 컴퓨터는 사용자의 특정 목적에 맞게 설정되고 사용될 때 가장 잘 동작하는데, 똑같은 규칙이 데이터센터에도 그대로 적용됩니다. 데이터센터 사용자 및 특정 사이트의 조건에 가장 부합하는 리소스 효율적인 디자인이 요구되는 것인데, 마이크로소프트는 전력 배분, 쿨링 시스템, 서버 및 Rack/ 컨테이너 시스템 등 다양한 기술에 대해 분석 및 연구하고 있습니다.

여러 요소를 분석 및 평가하여 최적의 디자인 도출

최적의 환경을 만들기 위해 디자이너는 모든 비용 요소를 고려해야 합니다.
: 빌딩, 토지, 전력 장치, 쿨링 장치, 전기, 물, 네트웍 및 엔지니어 등

마이크로소프트는 데이터센터의 장소를 선정하기 위한 히트맵을 이용하기 위해 소프트웨어 를 사용합니다. 장소가 선택되면 시설의 전체 라이프사이클 동안의 총 소유비용을 낮추기 위한 빌딩 및 장치의 디자인에 대한 평가를 시작하죠. 조직의 여러 팀간에 Ownership을 분산시키기 보다는 장소 선택, 빌딩 디자인 및 운영에 대해서 하나의 단일 조직이 맡도록 합니다. 데이터 센터 및 TCO 절감에 대한 단일 책임을 부여하기 위해서 그렇습니다.

최대의 효율 및 성능을 위해 프로비저닝 최적화

잘 아시는 것처럼 대부분의 데이터센터는 처음 구축된 후 수년간 부분 가동됩니다. 데이터센터의 필요한 부분만 가동하는 것이 가능하다는 말이죠. 하지만, 정말 그렇게 되나요? Rack이 하나만 있어도 전체 데이터센터의 Cooling 시스템을 가동하고 있지는 않으신가요? 바로 이부분이 대부분의 데이터센터가 놓치고 있다고 생각합니다. 마이크로소프트는 데이터센터의 일부분만 가동이 가능하도록 데이터센터 인프라 설계를 모듈화 시켜 놨습니다. 아주 조금밖에 필요하지 않은데 100%의 인프라스트럭처를 모두 구동해야 한다면 비효율 적이겠죠?

또 다른 기술은 사용될 수 있는 지점의 전력을 다른 곳으로 보낼 수 있도록 전력 및 클링 시스템을 디자인한 것입니다. 고착된 전력은 사용되지 않고 낭비되어 결국 수십억원에 해당되는 비용이 사용되지 못하고 낭비되는 요인이 됩니다. 예를들면, 센터의 한 지점에서 특정양의 전력을 받아이도록 장치가 설치되어 있는데 그 장치가 해당 용량을 사용하지 않는 다면, 바로 이곳에서는 전기를 사용하지 않았지만, 다른 장치에서는 전기가 부족한 일이 벌어질 수 있다는 것입니다.

전기가 필요한 곳에서 사용할 수 있도록 하기 위해 마이크로소프트는 전력 및 쿨링 시스템에 재 설정되어 전력을 공유할 수 있는 유연한 디자인을 채택했습니다. 또 다른 방법은 가장 전기 및 전력 효율적인 곳에 하드웨어를 위치 시키는 것이죠. 때때로, 가장 이상적인 위치에 특정 장치를 위치하는 것이 불가능한 경우가 있지만 가능한 경우라면 물리적인 장벽을 제거하도록 설계되어 있습니다. 마이크로소프트의 비즈니스 유닛은 차지하고 있는 공간, 즉 상면 비용이 아니라 에너지(전기) 및 쿨링 비용을 포함한 운영 비용으로 과금을 합니다.

데이터 센터의 성능을 모니터링 및 제어

효율성을 높이기 위해 성능, 온도, 전력 사용량을 볼 수 있는 모니터링 시스템을 개발할 필요가 있습니다. 데이터센터 전체의 실시간 서버 온도, 쿨링 시스템의 정상 작동여부를 실시간으로 측정하는 것은 아주 중요합니다. 과도한 쿨링시스템 작동은 여러 데이터센터에서 에너지 낭비의 주요 원인입니다. 마이크로소프트는 쿨링 낭비를 줄이기 위해 아주 긴밀한 통제를 유지합니다. 게다가 데이터의 아카이브를 통해 운영 성능을 어떻게 향상 시킬것인지 포괄적인 이해를 할 수 있게 됩니다.

데이터센터 운영 Excellence를 조직 문화의 일부로 만듦

에너지 효율화 노력의 첫걸음은 Awareness(인지도)를 높이는 것이고, 모니터링, 리포팅, 데이터센터 효율화를 분석하는 것 등에 대한 책임감을 해당 팀에 부여하는 것입니다. 마이크로소프트는 데이터센터 지표를 만들어서 웹서비스를 통해 운영에 대한 값을 관련 주체들과 커뮤니케이션 하도록 되어 있습니다. 해당 의사결정권자들에게 보내져 향상 및 변화값등에 대해 공개되지 않게 에너지 효율화 및 데이터센터 성능 정보를 보내고 있습니다. 

Power Usage Effectiveness(PUE)를 측정

Power usage effectiveness (PUE)는 데이터센터 효율성을 향상하기 위해 사용되는 마이크로소프트의 지표 입니다. PUE는 외부 온도, 장비 변경, 서버의 부하 등의 값에 따라 지속적으로 변하는 값입니다. 모니터링 및 계측/관리가 없다면 PUE 값 변동에 대한 원인 및 효과를 판단하는 것이 불가능 합니다. PUE는 데이터센터 운영자가 다른 데이터센의 값과 비교하여 에너지 효율화를 위해 취해야 할 필요가 있는 것을 결정하여 빠르게 데이터센터의 효율성을 평가할 수 있도록 해줍니다.

온도 조절 및 공기흐름 분배를 위핸 최고의 기술 사용

온도 조절 및 공기흐름 분배를 향상시키기 위한 기술 목록

  • AC(교류) units을 뜨거운 통로에 연결하여 뜨거운 공기는뜨거운 통로로 흐르게 함
  • 0.8 ~ 1.0 미터 마루 위에 Uniform Static 공기 압력으로 디자인

뜨거운 공기와 찬 공기가 혼합되는 것 방지

뜨거운 공기와 찬 공기가 혼합되는 것은 비효율적입니다. 이런 비효율을 방지하면 쿨링 비용을 절감할 수 있게 되죠. 뜨거운 공기와 찬 공기의 혼합을 막는 기술로 구현 가능합니다.

  • 뜨거운 공기 및 찬 공기가 흐르는 통로를 각각 만듦

효과적인 절약 장치(Economizer) 사용

데이터센터의 장소 선정에 고려할 또 하나의 요소는 데이터센터를 쿨링, 즉 식히는데 절약 장치를 사용할 수 있는지 여부 입니다. 첫째는 물을 사용하는 방식, 둘째는 외부 공기를 사용하는 방식 입니다. 마이크로소프트는 2가지 방식 모두를 사용하고 있습니다.

산업계의 파트너들과 지식 공유 및 배움

마이크로소프트는 베스트프랙시트에 참여하고, 공유하고 있습니다.

  • The Green Grid
  • Climate Savers Computing
  • Environmental Protection Agency
  • Lawrence Berkeley National Labs
  • Society of Heating, Refrigeration, and Air-Conditioning Engineers
  • Association for Computer Operations Management.

위의 다양한 단체들은 산업계의 업체들이 지식을 공유하도록 촉진하고 있고, 다양한 데이터센터의 전략 및 베스트 프랙티스를 서로 교환하며 정보를 제공하고 있습니다.

에너지 효율적인 데이터센터 라이프 사이클로의 길

마이크로소프트는 산업계의 경험 및 많은 지식을 소유한 많은 분들을 통해 지식을 축적했고 이런 지식을 공유하는 것이 많은 분들에게 시간과 노력을 절감시킬 수 있다고 믿습니다.

마이크로소프트는 컴퓨터 사용자가 소프트웨어의 다양한 활용을 통해 환경을 향상시키기 위해 향상된 교육 및 가이드가 필요하다는 것을 알고 있습니다. 따라서, 정부 기관, 비 정부기관, 산업계 및 소비자등 환경에 직접, 간접으로 영향을 주는 모든 분들에게 베스트 프랙티스를 공유하는 노력을 지속하고 있습니다. 많이 활용하시기 바랍니

Posted by 조이트리