Cloud 사업을 하다보니, 인공지능에 대해 접할 기회가 많다.
사실 많은 분들이 인공지능에 대해 묻는다.
인공지능은 정말 큰 개념이다. 묻는 분들의 관심사가 다르고, 영역도 다르다.
머신러닝, 딥러닝, 자연어처리, 컴퓨터 비전, 컴퓨터 감각, 자동추론, 지식표현, 인지컴퓨팅, 패턴인식 등
머신러닝과 인지컴퓨팅, 인공지능이지만 많이 다른 영역이다.
하지만, 본질은 똑같다. 막대한 컴퓨팅 기술을 통한 데이터 활용법이다. 데이터 활용법, 즉 내연기관과 같이 범용기술로 자동차든, 기차든, 오토바이든 필요한 영역에 가져다가 쓸 수 있다는 의미다.
어떤 기술에 관심이 생겼다는 것은, 해당 기술로 해결해야 할 문제, 필요가 생겼다는 의미다. 그 문제를 풀기에 가장 적절한 인공지능의 영역이 어떤 것인지를 먼저 판단해야, 해당 과제를 풀어낼 전문가, 전문기업을 알아낼 수 있다.
인공지능 기술을 활용한 Digital Transformation, 비용을 절감하고 싶은가? 생산성을 높이고 싶은가? 아니면 혁신 (better than before)을 이루어내고 싶은가?
여기서 오늘은 머신러닝에 대해 알아보자. 머신러닝은 컴퓨터가 데이터를 활용해 스스로 학습하는 기술이다.
머신러닝에는 지도학습, 비지도학습, 강화학습, 세 분야로 나눌 수 있다.
기본은 데이터다. 얼마나 많은 규모의 데이터를 보유하고 있는가?
지도학습 (Supervised Learning)에 대해 알아보자. (Stanford 대학교, Andrew Ng 교수 강의 참조)
A (Input) --> B (Response), 즉 입력값 A에 대해 결과값 B를 얻어내는 방식을 의미한다.
Email --> Spam (0/1), Email을 입력하면 Spam 여부를 판단하는 기계학습 모델이다.
Image --> Object (1, ...1000), 얼굴을 입력하면 일치여부를 확인하는 모델이다. Face Recogniton 등
Audio --> Text, Speech to Text (STT), 즉 음성을 텍스트로 전환하는 모델이다. 음성인식
English --> French, 영어를 입력하면 불어로 번역하는 번역기 모델이다.
Text --> Audio, Text to Speech (TTS), 즉 텍스트를 음석으로 전환하는 모델이다.
Ad, User --> Click 여부 분석 (0/1), 광고와 특정 사용자를 입력하면, 해당 사용자가 광고를 Click할 것인지 여부를 답으로 보여주는 모델이다. (구글, Facebook 등에서 활용하고 있다.)
Image --> Diagnose, 심장 또는 폐 사진을 넣으면 암 또는 질병 유무를 진단해주는 모델이다. 예측 모델
현재 가장 많은 Use Case가 나오고 있는 기술을 머신러닝 영역이다. 왜 지금 머신러닝이 주목받을까?
머신러닝을 위해서는 많은 데이터가 필요하고, 해당 데이터를 처리할 수 있는 컴퓨팅 파워가 필수적이다.
이전에는 존재하지 않았던 저렴한 비용으로 컴퓨팅 파워를 이용할 수 있는 기술, Cloud가 있음으로 인공지능도 함께 발전하게 되었다고 볼 수 있다.