Information as a Service, Data as a Service라고도 부를 수 있을 것 같습니다. 웹 페이지, IT 시스템 등에서 가장 핵심이 되는 것이 무엇일까요? 아주 화려한 UI, UX, 프로그램 코드? 물론 다 중요하지만 핵심은 데이터 입니다. 알맹이가 없는 밤이 버려지는 것처럼 데이터가 없는 UI는 공허한 하나의 껍데기가 될 수 밖에 없는 것이죠.
데이터의 범위, 분류를 해보는 것은 너무도 방대한 일이기에 굳이 그렇게 하지 않겠습니다. 간단히, 신문사의 기사, 방송국의 뉴스, 영화, 또는 통계청의 각종 통계자료, 국세청의 데이터, 국방부에서 공개하는 데이터, 미국 NASA의 우주 사진 등 방대한 자료를 개별 회사, 또는 정부기관에서 가지고 있습니다. 그런데 문제는 각 조직이 보유하고 이는 데이터의 포맷이 다른 것이 현실입니다. 국방부에서 공개하는 데이터를 가지고 제가 어떤 조작을 해서 의미 있는 정보를 만들어보고자 할 때 어떤 특정한 포맷 없이 구성되어 있을 수 있고, XML로 구성되어 있거나 ATOM으로 구성되어 있을 수 있을 것 입니다. 즉, 각 조직이 어떤 파일 포맷을 갖고 있느냐에 따라 굉장히 성가시고 다루기 어려운 것이 사실 입니다.
또 다른 골치거리는 각 기관별로 찾아 다니면서 어떤 자료가 공개되어 있는지 찾는 것도 쉬운 일은 아니죠.
이럴 때 정부기관, 기업들의 데이터 중 공개 가능하거나 판매하고자 하는 정보가 마켓플레이스에 모두 모여 있다면 데이터를 서비스로 구매해서, 가공하여 또 그 데이터를 판매하는 일이 가능할 것 입니다. 이것을 Data as a Service라고 부르는데, 마이크로소프트의 클라우드 플랫폼, Windows Azure Platform과 SQL Azure를 이용하여 Code name Dallas가 발표되었습니다. 앞에서 설명한 것처럼 데이터, 이미지, 실시간 웹 서비스도 포함되어 있습니다. 한 장소에서 통합된 프로비저닝과 빌링 프레임웍이 포함되어 있다는 것도 주요한 특징입니다. Dallas API를 이용하여 개발자나 정보근로자가 어떤 플랫폼, 즉 웹, 모바일 등에 관계 없이 프리미엄 콘텐츠를 소비할 수 있습니다.
시나리오
1. 소비자나 비즈니스에 활용 가능한 차세대 킬러 애플리케이션을 만드는데 필요한 컨텐츠 확보 가능
2. 현재 애플리케이션이나 리포트의 품질을 향상시킬 수 있는 가치 있는 데이터를 찾아 구매 가능
3. 이종의 데이터 집합을 결합하여 비즈니스 성능과 프로세스를 향상 시킬 수 있는 통찰력 획득
4. Blob, 구조, 비구조적 데이터와 실시간 웹서비스를 API를 이용하여 가시적으로 탐색
5. 리포팅과 분석을 위해 마이크로소프트 오피스, SQL 서버 내부에 있는 제 3의 데이터를 쉽게 사용 가능
예를 들면, UN의 Energy Statistics 데이터베이스를 확인해보도록 하겠습니다. 215개 국가별, 지역별 소비량에 대해 확인할 수 있는 건데, 이 데이터가 지금 Dallas에 무료로 올라와 있습니다.
http://pinpoint.microsoft.com/en-US/PartnerDetails.aspx?PartnerId=12884901889&LocId=1249835483137
구독을 하면 아래와 같이 Dallas 창을 통해 원하는 데이터를 조회하거나 다운 받을 수 있습니다. 현재는 대부분 Free로 제공하고 있죠. UN의 WHO Data를 원하는 값, 예를 들면 대한민국의 2006년 기준 예상수명 값을 조회한 데이터 입니다. 82살이라고 나오네요. 이런 값을 전체적으로 가져와서 애플리케이션의 데이터로 활용하면 재미있는 Data 서비스를 만들 수 있지 않을까요? 향후에 상용화도 가능하겠죠. 이건 너무 무궁무진해서 생각하는 만큼 비즈니스가 될 것 같은데, 어떻게 생각하세요? 의료, 법률, 통계청 각종 통계 데이터, 기상청 날씨 데이터 등등 제가 그냥 생각하는 것도 만만치 않게 많네요. 이후에 재미있는 사례가 올라오면 좀 더 공유해보도록 하겠습니다.