agilesoda 800 4agilesoda.com/resources/file/agilesoda800.pdf · 2019-11-08 ·...

Strategy 2018:

(주)애자일소다, www.agilesoda.ai

정답 4, 3, 2, 3, 1, 2, 1, 4, 2, 1 입니다.

나는 인공지능 문화인? 인공지능(AI) 상식 테스트

1. 다음 중 인공지능과 관계없는 단어는?

① 텐서플로우 ② Turing test ③ 최대경사법 ④ 포아송 분포

2. Better than human. 인간과의 경기에서 이겨본 적이 없는 Machine은?

① Chinook ② Deep Blue ③ Galaxy ④ IBM Watson

3. 이세돌을 이긴 AlphaGo에서 “Go”의 뜻은 무엇인가?

① Deep Mind CEO ② 바둑의 일본말 ③ 알파고 CPU 명칭 ④ 구글의 별명

4. 인공지능 개발 오픈 프레임웍(Open Framework)이 아닌 하나는?

① H2O ② Keras ③ XML ④ Pytorch

5. 요즘 가장 Hot한 이미지 인식은 어떤 머신러닝 알고리즘을 이용한 것인가?

① CNN ② PCA ③ Clustering ④ GAN(Generative Adversiral Nets)

6. 머신러닝 프로그램에 가장 많이 이용되는 R 언어의 전신은?

① ForTran ② S ③ LISP ④ Cobol

7. 동적 객체지향 언어인 파이썬(Python)은 그리스 신화의 어떤 동물과 관련이 있나?

① 뱀(snake) ② 사자(lion) ③ 물소(water buffalo) ④ 콘돌(Condor)

8. 머신러닝에서 주로 쓰는 학습방법(training)이 아닌 하나는?

① 강화학습(RL) ② 지도학습법 ③ 비지도학습법 ④ 단계별(Stepwise) 선택법

9. 확률론 학파 중, 빈도주의(frequentist)와 달리 선험적 경험을 중시하는 학파는?

① R.A Fisher 학파 ② Bayesian(베이지안) ③ Taguchi 학파 ④ Karl Pearson 학파

10. Apache 재단이 개발한 분산 high performance distributed platform 명칭은?

① Spark ② Theano ③ Rstudio ④ Caffe

Contents

2018 인공지능(AI) Platform 전략

1. 인공지능 BASICS

알파고(AlphaGo)를 만든 천재들

머신러닝과 통계학의 차이점

기계를 학습(training)시킨다는 말의 의미

머신러닝으로 할 수 있는 것

2. 최신 인공지능 알고리즘 & 프레임워크

분야별 활용되는 주요 머신러닝 알고리즘

머신러닝 개발언어(Program Languages)

머신러닝 프레임워크(Frameworks)

3. 전사 인공지능 플랫폼 구축

AI 플랫폼 구축전략

국내외 인공지능 플랫폼 시장 현황 및 트렌드

4. 인공지능 전문기업, (주)애자일소다

4

7

10

12

15

17

18

22

25

27

4


알파고(AlphaGo)를 만든 천재들

2015.10월, 인공지능 알파고가 이세돌 9단을 4대1로 이겼다. 이 사건은 70년이 넘는 인공지능 역사

상 Top 10 이벤트로도 선정될 정도의 大사건이었다. 알파고는 영국에 소재하고 있는 DeepMind 회사

가 만든 인공지능 프로그램이다. 이 회사는 Google이 2014년에 7,500억원 ($6.5억)을 주고 인수한

회사이다.

13세 체스의 천재 Demis Hassabis

데미스 허사비스는 2010년 DeepMind라는 스타트

업을 설립했다. 이제 나이 41세(76년생)인데 모든

천재가 그랬듯이, 그도 이미 13살의 어린 나이에

체스(Chess) 게임의 마스터가 되었고 (정확히는 Elo

rating of 2300), 17살부터 비디오 게임 개발에

참여하기 시작했다.

Queens' College(Cambridge)와 University of Cambridge에서 컴퓨터공학을 전공했으며, Uni-

versity College London (UCL)에서 인지과학으로 박사학위를 받은 정통 영국인이다. 그로 인해

Deep Learning의 위력이 세상에 널리 알려지는 계기를 만든 천재이고 앞으로 어떤 위력을 발휘할지

두고 볼 일이다. 그래도 그는 인공지능 분야에서 가장 행복한 삶을 살아온 천재 이기도 하다. 적어도

지금부터 살펴볼 그들의 선배 과학자들에 비하면...

인공지능의 역사(history) = 천재(Genius)들의 역사

학문에서 누가 최초라는 말은 좀 애매하다. 머신러닝도 그렇다. 인공지능 역사를 살펴보면 1940~

1950년 사이에 학문적 기초가 다져졌고, 이 때부터 수 많은 천재들이 눈부신 역할을 했다. 오늘날

인공지능(Artificial Intelligence)라는 단어가 최초로 나온게 1956년 다트머스 학회(Dartmouth

Conference)에서였으나 실제 인공지능과 관련된 연구는 이미 1930년대부터 시작되었다.


5


말년이 비참했던 McCulloch & Pitts

워런 맥컬록(Warren McCulloch)과 월터 피츠(Walter Pitts)야 말로 인공지능의 시조라 불리워

진다. 두 사람은 수학과 임계논리(threshold logic) 알고리즘을 바탕으로 신경망을 위한 계산학 모델

을 만들었고 1943년, 역사적인 신경망(Neural Network) 논문인 “A Logical Calculus of Ideas

Immanent in Nervous Activity” 를 발표했다. Neural Network에 관한 최초의 수학적 정리로 알려

지고 있다.

천재 Pitts는 12살 때 도서관에서 3일 동안 당시

수학의 대부인 버트런드 러셀(Bertrand Russell)이

저술한 수학원리(Principia Mathematica)를 읽고

나름 문제점을 편지로 썼다. 이후 러셀이 그를 영국

으로 초청했고 두 사람은 그 후 지속해서 교류한다.

그러나 Pitts는 수학이 아닌 논리학자(logician)의

길을 택했고 결국 인공지능의 지평을 여는데 일조

했다.

그러나 Pitts는 말년에 부인에게 버림받고 결국 식도암으로 쓸쓸히 사망한다. 1969년 둘은 몇 개월

차이로 죽음을 맞이한 숙명적인 인연이었다.

다방면의 천재였지만 말년이 비참했던 Alan Turing

인공지능 역사에서 빼놓을 수 없는 인물이 바로 앨런 튜링(Alan Turing)이다. 튜링은 케임브리지

대학교에서 수학을 전공했으며 수학자, 컴퓨터 과학자, 논리학자, 암호학자, 철학 및 이론 생물학자

이기도 한 천재이다. 1945년 오늘날 범용 컴퓨터의 모델인 튜링머신을 창안했다.

얼마 전 영화 <Imitation Game>이 바로 튜링의 일대기를 그린 영화였다. 2차 세계대전 때 나치 독일

군이 군기밀 암호화에 이용하던 에니그마를 알고리즘 이론으로 해독하는 데 공헌을 했다.

그러나 튜링은 동성애자란 이유로

청산가리 독살로 최후를 맞이한 것

으로 알려지고 있고, 최근 영국정부

로부터 사면과 사과를 받은 불운의

천재이기도 하다.

Warren McCulloch and Walter Pitts

6


1955년에 작성된 일년 뒤 AI컨퍼런스 개최를 알리는

J.McCarthy 의 letter

인공지능 단어의 창시자, John McCarthy

맥카시는 인공지능이라는 단어 뿐 아니라 LISP 언어를 만든 장본이기도 하다. 1956년에 다트머스

학회에서 처음으로 인공지능(Artificial Intelligence)이라는 용어를 제안했는데, 그는 당시 AI를 이렇

게 정의했다. “the conjecture that every aspect of learning or any other feature of intelli-

gence can in principle be so precisely described that a machine can be made to simulate

it.”

그는 대공황기에 Boston의 가난한 이민 가정에서 자랐고,

그의 가족은 직업을 구하러 여기저기 전전하다 LA에 정착

한다. Caltec에 가서 중고 책자를 구해다가 집에서 혼자

수학을 독학한다. 가난했던 그는 생계를 위해 목수, 어부

그리고 발명가 등 잡다한 일을 한다. 지금의 수압식 과일

흡착기(Orange-squeezer)를 발명한 이력도 있다.

후에 Caltec에 입학해서 수학을 전공하고 24세에 Princeton에서 박사학위를 받는다. 1950년대

후반 이미 체스게임을 하는 IBM 머신을 개발하기도 한 대 천재이다.

Shannon, Minsky 등 ... 인공지능 분야를 미리 내다 본 천재들

수학자이자 전기공학자 그리고 암호학자였던 Information theory의 아버지로 불리는 Shannon.

그가 작성한 A Mathematical Theory of Communication 논문은 정보 이론의 시초가 되었다.

Rosenblatt는 1958년, “The perceptron : a probabilistic model for information storage and

organization in the brain” 라는 논문을 발표하였다. 기라성 같은 수많은 천재들이 초기의 인공지능

이라는 새로운 場을 여는데 기여했다.

7


머신러닝과 통계학의 차이점

가정(assumption)의 학문, 기존 통계학

통계학(Statistics)의 사전적 의미는 “the science of using information discovered from col-

lecting, organizing, and studying numbers” 이다. 이 기준에 의하면 최근 각광을 받는 Machine

Learning이나 Deep Learning도 통계학의 일부가 된다. 그러나 그렇게 생각하는 사람은 드물다.

왜냐면 서로 많이 다르기 때문이다. 무엇이 어떻게 다를까 ?

N개의 데이터가 주어졌다고 하자. 평균(mean)은 더하고 나누고, 분산(variance)도

이렇게 구하면 된다. 여기까지는 아무 고민과 불편이 없다.

그러나, 통계학자들 더 정확히는 실제 생활은 여기에 머물지 않았다.

“평균을 왜 쓰지? 중위값(median)이 더 좋지 않을까? 50개의 데이터를 가지고 평균을 구했는데, 이게

전체 평균을 대표하는 게 맞나?” 등등의 질문이 나온다.

이에 대한 답을 하려면 어떤 가정(assumption)이 필요하다. 즉, 표본이 어떤 모집단(population)

에서 뽑힌 것이고, 원래 그 모집단은 정규분포(Normal)를 따른다는 식의 가정 말이다. 이 ‘원래의’

정규분포를 모집단 분포(population distribution)라고 한다.

“(표본)평균이 모집단의 모평균과 비슷한 건가? 표준편차와 모분산은? 몇 개의 샘플(N)로 계산해야

모평균 또는 모분산에 근접하다고 볼 수 있나?” 통계학이 점점 복잡해진다.

이유는 있었다....

통계학의 학문적 토대는 대부분 컴퓨터가 없던 시절 완성되었기 때문이기도 하다.

8


분석 업무에 자주 쓰는 회귀분석의 경우 대표적인 가정(assumption)이

The model is linear (선형성)

The variance is constant (등분산성)

The errors have a Normal distribution (정규성)

The design matrix has very weak co-linearity (설명변수간 독립성)

그러나 Who knows? 현대 사회환경과 같이 복잡다단한 상황에서 자료의 등분산성, 선형성 등을

미리 가정하기는 쉽지 않다. 검정 통계량(test statistics)이 있기는 하지만, 정확히 확인할 길도 없다.

가령 고객의 금년도 구매금액을 예측하기 위해 다음과 같은 회귀모형을 가정해보자.

그러면 1~4번까지의 가정에 의해 아래와 같은 깔끔한 회귀식 추정치를 구할 수 있다.

머신러닝(Machine Learning)의 강점, 가정이 없다

머신러닝은 기본적인 가정이 별로 없다. 데이터가 비슷한 상태에서 나왔다는 정상성(stationarity)

정도이다. 물론 알고리즘에 따라서 그것도 무시할 수 있는 경우도 있다.

통계학과 머신러닝의 공통점은 추정값 또는 예측오차를 최소화 하는 기준으로 정답을 찾아간다. 이를

손실함수(loss function)라고 부른다. 즉, 잘못 예측하거나 추정값의 오차를 벌점(penalty)에 해당

하는 기준을 적용해서 답을 구한다. 찾는 방법은 양측이 다르다. 통계학은 가정에 따른 수학적 해(so-

lution)를 구하는 반면, 머신러닝은 컴퓨터 계산(grid search)에 의존하는 게 다르다.

잘봐~ 이게정규분포라는 건데..

......아이고 배고파라......

1

2

3

4

9


인공지능, 머신러닝의 계산은 비선형(non-linear) 접근

손실함수는 오차함수이다.

평균제곱오차(MSE, mean squared error) 식을 가장 많이 이용하며 다음과 같이 구한다.

즉, 잘못된 추정오류를 최소화 한다는 전략은 공통이다. 가정이 많은 통계학은 이 기준을 적용하면

최적 추정값을 아주 간결한 수식으로 정리가 가능하다. 그러나, 머신러닝은 별 가정이 없었기 때문에

계산하는 수밖에 없다. 이 과정을 소위 학습(training)시킨다고 한다.

머신러닝 알고리즘의 하나인 Neural Net은 설명변수(x)와 반응변수(y)를 다음과 같은 뉴런의 신경망

전달 메커니즘으로 문제를 도식화 하여 해결한다.

여기서 h 변수를 은닉층(hidden layer)이라 부르는데, 이는 실제 관측값이 아니라 모형의 설계에서

설정한 가상의 값(value)이기 때문에 붙여진 이름이다. 실제 문제해결에서 h는 활성화 함수(activa-

tion function)라는 f를 통해 값을 전달하는데, h1은 다음과 같이 표현된다.

문제를 쉽게 이해하기 위해 활성화 함수 f를 항등함수(identity function)로 가정하면

머신러닝은 계산에 의해 총 9개의 가중치(weight) 값을 ......

구하는 작업을 수행해야 한다.

10


기계를 학습(training)시킨다는 말의 의미

다차원의 파라미터 최적값을 찾자 ~

앞장의 회귀분석 모형에서 보듯이 설명변수가 달랑 2개인 경우에도 최소 9개의 가중치(weights)를

구해야 한다. Bias까지 고려하면 13개로 늘어나고 활성화 함수의 형태까지 바꿔 구한다고 생각하면

이건 보통 일이 아니다. 설명변수가 늘어나면 따라서 추정해야 하는 가중치 개수는 기하급수적으로

늘어난다.

요즘 유행하는 딥러닝(Deep Learning)은 Input 변수도 많고, 은닉층(hidden layers)도 많다.

또 초기값(initial values)을 어떻게 설정하느냐에 따라 계산의 결과가 달라질 수 있다.

Local maxima and Global maxima/minima의 함정

최적의 가중치는 손실함수를 최대/최소화 하는 점을 찾아야

한다. 결국 Mini-Max의 계산문제로 귀결된다.

왼쪽 그림에서 보듯이 기준을 잘 못 잡으면 전체구간에서 최소

값 지점인 C점을 찾아야 하는데, 잘못해서 A나 B지점에서 멈출

수 있다.

Local Maxima/Minima의 함정에 걸리지 않으며 Global Maxima/Minima 지점을 찾기 위한 계산

알고리즘이 많이 제기되었다. 대표적으로 다음 4가지가 이용된다. 각각의 변형 형태 방법론이 수없이

많이 개발되었다.

Hebbian Learning

Perceptron Rule

Gradient Descent

Back Propagation

11


Gradient Descent 방법론 (대표적인 컴퓨터 학습 방법론)

가장 많이 이용하는 것이 GD(경사하강법)이다. Gradient descent 방법은 다른 말로 steepest

descent 방법이라고도 부르며 이론은 간단하다.

가령 등산할 때 산 정상으로 가장 빨리 올라가는 방법은 경사가 가장 가파른 방향을 찾아 산을 오르면

되고, 반대로 가장 빨리 내려오려면 가장 가파른 내리막 길을 찾아 내려오면 될 것이다.

이처럼 산의 경사면의 크기를 나타내는 비탈정도, 즉 시간당 이동거리

의 크기를 그라디언트(gradient)라 부른다. 이는 최대/최소값을 구하

는 대상 함수의 일차 편미분 값을 말한다. 어떤 함수의 극대점을 찾기

위해 현재 위치에서의 gradient방향으로 이동해 가는 방법을 gradi-

ent ascent 방법, 극소점을 찾기 위해 gradient 반대 방향으로 이동

해 가는 방법을 gradient descent 방법이라 부른다.

이렇게 할 때 함정이 있다.

보통 정점일 때의 수학적 의미는 평지(=기울기 0)를 말한다. 즉, 경사하강법에서는 평지가 되는 지점

을 찾아야 하는데, 가령 걸리버 여행기에 등장하는 거인의 보폭을 생각하면 자칫 평지 지점을 놓칠 수

있다. 계속해서 평지 지점을 찾아 종일 헤맬 수가 있다. 머신러닝의 가장 큰 이슈가 바로 이 평지를

못찾고 계속해서 맴도는 경우를 말한다. 무한루프를 생각하면 된다. 학교 다닐 때 배운 뉴턴-랩슨

(Newton-Raphson) 방법론을 떠올리면 된다.

개선된 최적값 찾기 방법론

최근들어 경사하강법의 약점을 해결하기 위한 다양한 알고리즘들이 제시되었다. 대표적인 방법 몇

가지를 살펴보면

SGD(Stochastic GD) : 데이터의 일부만 가지고 계산하는 방법(속도 이슈 해소)

Adagrad : 시간에 따른 그라디언트 제곱값을 추적해 학습률을 조정

Adam : 파라미터 업데이트를 그라디언트의 평균과 분산으로부터 직접 추정하고 편향(bias) 조정

향을 추가

Adadelta : Adagrad를 개선하는 방법으로, 하이퍼파라미터에 덜 민감하고 학습률을 너무 빨리

떨어뜨리지 않도록 막음

이 외에도 많은 개선 알고리즘이 있으며 이들에 힘입어 딥러닝이 크게 개선된 것이다.

12


머신러닝으로 할 수 있는것

학습방법에 따른 머신러닝 구분

지도학습

비지도학습

강화학습

지도학습(Supervised Learning)

학습할 때 사전지식이 있는 경우

반응변수가 있는 회귀분석이나 또는 발신메일에 대해 수신/거절의 경우

처럼 처리결과 또는 고객반응 값이 명확히 제시되어 있는 데이터의 경우

분류문제, 회귀분석, 로지스틱 회귀, Back Propagation in NN

비지도학습(Unsupervised Learning)

결과값에 대한 구분이 없이 설명변수만 존재하는 경우(unlabeled)

아무런 기준 없이 데이터의 접근성을 확인해 분류하는 경우

클러스터링, 주성분분석, 상품연관성, k-means, Apriori

강화학습(Reinforcement Learning)

‘AlphaGo’ 와 같이 승패가 결정되는 게임에서 이기는 방향으로 학습

상태, 액션, 리워드(rewards)의 환경(environment) 체계 구성

Atari 게임, Dynamic decision, AlphaGo Zero

Supervised Learning

Algorithms

Unsupervised Learning

Algorithms

Reinforcement Learning

Algorithms

데이터

분석

음성,텍스트처리

이미지

인식

13


대표적인 분석방법

앙상블(Ensemble)

여러 가지 모형을 개별적으로 학습시키고, 각각의 조합에 의해 최종 의사결정

에 이용하는 기법Boosting, Bootstrapped Aggregation (Bagging), AdaBoost, Stacked Generaliza-

tion(blending), Gradient Boosting Machines (GBM), Gradient Boosted Regression

Trees (GBRT), Random Forest

회귀분석(Regression Analysis)

관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정

하는 분석 방법Ordinary Least Squares Regression (OLSR), Linear Regression, Logistic Regres-

sion, Stepwise Regression, Multivariate Adaptive Regression Splines(MARS),

Locally Estimated Scatterplot Smoothing (LOESS)

군집화(Clustering)

답이 주어지지 않은 데이터를 가지고 분석을 하고 분류함k-Means, k-Medians, Expectation Maximization (EM), Hierarchical Clustering

뉴럴 네트워크 분석(Neural Network)

신경망 구조에 의한 분류, 이미지 인식, 텍스트 마이닝, 선형모형 등의 분석Deep Boltzmann Machine (DBM), Deep Belief Networks (DBN) Convolutional Neural

Network (CNN), Stacked Auto-Encoders

차원축소 (Dimensional Reduction)

다차원 변수의 선형결합에 의한 차원 축소, 주성분분석 등Principal Component Analysis (PCA), Principal Component Regression(PCR),

Partial Least Squares Regression (PLSR), Sammon Mapping, Multidimensional

Scaling (MDS), Projection Pursuit, Linear Discriminant Analysis (LDA), Mixture

Discriminant Analysis (MDA)

Ensemble Algorithms

Regression Algorithms

Instance-based

Algorithms

Deep Learning

Algorithms

Dimensional Reduction

Algorithms

14

단순함이야말로 정교함의 극치이다- Leonardo Da Vinci -

“The most important part of machine learning is actually forgetting”-Naftali Tishby,

a computer scientist and neuroscientist at the Hebrew University of Jerusalem

15

2. 최신 인공지능 알고리즘 & 플랫폼

분야별 활용되는 주요 머신러닝 알고리즘

머신러닝 알고리즘은 수백 종류가 넘는다. 각기 알고리즘별 특징이 있기 때문에 처리하고자 하는

데이터 유형과 학습방식에 따라 선별적으로 골라서 이용해야 한다. 아래의 표는 각 응용분야별 자주

이용되는 알고리즘을 정리한 표이다.

머신러닝 전문가란 결국 알고리즘 선별과 Hyper-parameter(하이퍼파라미터)를 적절하게 변경해

가면서 학습시킬 수 있는 역량이 있어야 한다.


ADALINE

ART

Boltzmann Machine

Feature Map

Hamming Net

Multilayer Perceptron


Silicon Cochlea

Time-Delay Net

Viterbi Net

Cellular Automata

Connectionist Model

Neocognitron

CMAC Cerebellum Model


Topographic Map

Hopfield Model

Bidirectional Associative Memory

MADALINE


Boltzmann Machine

Cellular Automata

Counterpropagation Net

Hopfield Model

Winner-Take-All Net

응용분야 Types of Neural Networks Types of Neural Networks

패턴 분류

음성 인식

영상인식

응용분야

로봇 제어

연상 메모리

신호 처리

최적화 및

근사계산

16


한눈에 보는 뉴럴 네트워크 계보

17


머신러닝 개발언어(Program Languages)

머신러닝 분야에서 가장 많이 이용되는 프로그래밍 언어는 단연 파이썬(Python)과 R을 들 수 있다. R

은 GPL 하에 배포되는 S 프로그래밍 언어를 기반으로 하고 있으며, Python은 플랫폼 독립적이며

인터프리터식, 객체지향적, 동적 타이핑(dynamically typed) 대화형 언어이다.

1만개 이상이 패키지로 구성, 강력한 오픈 통계분석 언어

뉴질랜드 오클랜드 대학의 로스 이카하와 로버트 젠틀맨에 의해 개발된 R은 분석 및 그래픽기능이

우수하고 통계뿐 만 아니라 수치 해석까지도 지원한다. R은 사용자가 제작한 패키지를 추가하여 기능

을 확장할 수 있으며, 10,300개 이상의 패키지를 내려 받을 수 있다(2016년현재). 또한 R은 수학

기호를 포함할 수 있는 출판물 수준의 그래프를 제공하는 장점이 있다.

주요 특징(Key Characteristics)

1만여 개 이상의 최신 알고리즘 및 로직 들을 제공하는 패키

지 생태계

타의 추종을 불허하는 그래픽 및 차트 기능

기존 R의 가장 큰 문제점이었던 메모리 관리 / 속도 / 효율성

등은 최근 H2O 또는 Spark를 R interface를 통한 개선

쉽고 가장 강력한 머신러닝 개발 언어

파이썬은 1989년 프로그래머인 귀도 반 로섬에 의해 개발된 인터프리터 방식의 스크립트 언어이다.

다양한 플랫폼에서 사용 가능하며, 라이브러리(모듈)가 풍부하여 개발 생산성이 높아, C언어로 작성된

10 줄짜리 코드가 파이썬에서 한 줄로 처리가 가능할 정도이다.

주요 특징(Key Characteristics)

문법이 복잡하지 않아 직관적으로 이해하기 쉬움

파이썬은 R과 Java 간의 절충안으로, 전자의 정교함과 후자

의 속도 및 확장성을 동시에 충족

다른 사람이 작업한 소스 코드를 이해하기 쉬워, 공동 작업 과

유지 보수가 편리함

Ross Ikaha

Guido van Rossum

18


머신러닝 프레임워크(Machine Learning Framework)

시장에 머신러닝 프레임워크가 쏟아져 나오고 있다. 구글을 비롯하여 글로벌 포털 및 Big Vendor의

솔루션들이 오픈소스로 제공되고 있으며, 분석 알고리즘 측면에서 각각 다른 특성을 가지고 있어 상세

히 비교검토한 후에 적합한 프레임워크를 이용할 필요가 있다.

C 계열(C/C++/C#), Java, Python 그리고

Lua 진영으로 나눌 수 있다.

TensorFlow를 비롯해서 Python을 기반

으로 개발된 솔루션이 가장 널리 이용되고

있는 상황이다.

개발언어에 대한 진입을 용이하게 해주는 방

향으로 점차 쓰기 쉬운 방향으로 가고 있다.

텐서플로우(TensorFlow), 가장 인기있는 프레임워크

딥러닝 라이브러리인 TensorFlow는 머신러닝 및 딥러닝 연구를 수행하기 위해 Google Brain Team

에 의해 개발되었다. TensorFlow에서 구현하는 데이터 플로우 그래프는 계산과 데이터의 흐름을

노드(Node)와 엣지(Edge)를 사용한 방향 그래프(Directed Graph)로 표현한다.

노드는 수학적 계산, 데이터 입/출력, 그리고 데이터의 읽기/저장 등의 작업을 수행하며, 엣지는 노드

들 간 데이터의 입출력 관계를 나타낸다.

엣지는 다차원 데이터 배열(텐서)을 실어 나르는데, 여기에서 TensorFlow는 이름이 지어졌다고

한다.

TensorFlow가 Theano와 Torch보다 느리고 초기 배우기가 어렵다는 단점이 있으나, 방대한 커뮤

니티가 존재하고 확장성이 좋으며, 또한 C++ 및 R과 같은 다른 언어도 지원하며 딥러닝 모델을 직접

생성하거나 ‘Keras’ 와 같은 라이브러리에서도 직접 생성할 수 있다는 장점이 있다.

2015년 오픈소스로 공개되었고 ‘2세대 머신러닝 시스템’으로 불린다. Python 기반 라이브러리로,

여러 CPU 및 GPU와 모든 플랫폼, 데스크톱 및 모바일에서 사용할 수 있다.

19


최초의 딥러닝 프레임워크, 확장성과 다중 GPU지원 부족

Theano는 다른 딥러닝 프레임워크의 조상격으로 최초의 딥러닝 프레임워크라고 볼 수 있다.

Theano에 API 래퍼를 제공하는 하이레벨 라이브러리의 기본 플랫폼으로 자주 사용되며, 이를 통해

다른 많은 라이브러리에서 어려울 수 있는 다차원 배열을 비롯한 수치 계산에 매우 유용하다.

많은 양의 데이터가 포함 된 문제에 대해서도 수작업으로 구현된 C 구현에 필적하는 속도를 얻을 수

있는 장점이 있으나, 단점 중 하나는 다중 GPU 지원이 되지 않는 것이 있습니다.

Theano는 Python 기반이며 CPU 및 GPU의 수치 계산에 매우 유용함

Tensorflow와 마찬가지로 Theano는 저수준 프레임워크로, 딥러닝 모델을 직접 만들거나 그 위에

래퍼 라이브러리를 사용하여 프로세스를 단순화 할 수 있음

그러나 다른 확장 학습 프레임워크와 달리 확장성이 뛰어나지 않으며 다중 GPU 지원이 부족

직관적인 API, 비전문가도OK!

Keras는 Python으로 작성되었으며 TensorFlow, Theano 또는 CNTK를 기반으로 실행 가능한

라이브러리이다. 빠른 실험을 위해 하이레벨을 사용하기 때문에, 최소한의 코딩으로 구현이 가능하다

는 것이 가장 큰 장점이다.

직관적인 API를 제공하고 있기 때문에 딥러닝 비전문가라도 모델의 개발 및 활용이 가능하며, CNN,

RNN 모델 또는 이 들을 조합한 모델을 다양하게 구성 할 수 있습니다.

Theano와 Tensorflow는 매우 훌륭한 딥러닝 라이브러리이지만 직접 사용하여 모델을 만드는

것은 매우 저급 수준이기 때문에 어려울 수 있음

이러한 문제를 해결하기 위해 Keras는 효율적인 신경망 구축을 위한 단순화 된 인터페이스로

개발되었음

Keras는 Theano 또는 Tensorflow에서 작동하도록 구성 할 수 있음

Python으로 작성되었으며, 매우 가볍고 배우기 용이함

비교적 새로운 라이브러리임에도 불구하고 아주 좋은 문서를 가지고 있으며 몇 줄의 코드에서

Keras를 사용하여 신경망을 만들 수 있음

20


CNN(Convolutional Neural Networks)을 활용한 이미지 분류를 위해 개발

Caffe는 Berkeley Vision and Learning Center에서 개발된 딥러닝 프레임워크이다.

CNN(Convolutional Neural Networks)을 활용하여 이미지 분류를 위해 개발되었으며, 코드를

작성하지 않고도 사용할 수 있는 Model Zoo가 가장 잘 알려져 있다. 2017.4월 Face-Book은 Caffe

의 업그레이드 버전인 Caffe2를 공개하기도 했다.

표현, 속도 및 모듈성을 염두에 두고 개발된 Caffe는 Berkeley Vision and Learning Center

(BVLC)에서 주로 개발한 최초의 딥러닝 라이브러리 중 하나임

Python 인터페이스를 가지고 있는 C++ 라이브러리이며, CNN을 모델링 할 때 기본 애플리케이션

으로 찾음

주요 장점 중 하나는 Caffe Model Zoo에서 미리 훈련된 여러 네트워크를 바로 사용할 수 있다는

것임

Java기반 오픈소스 인메모리 머신러닝 플랫폼

H2O는 벤처기업(H2O.ai)에서 개발된 Java기반 오픈소스 인메모리 기계학습 플랫폼이다.

Spark의 ML Lib에서 제공하지 못하는 다양한 머신러닝 /딥러닝 알고리즘 지원하고 웹 인터페이스

(H2O Flow)를 제공하며, 또한 R, Java, Python, Scala등 다양한 API를 제공하기 때문에 기존에

사용하던 언어로 작업이 가능하며, 플랫폼 또한 Hadoop 환경으로 원활하게 확장 할 수 있다.

다양한 클러스터 환경에서 병렬 분산 처리를 통해 대용량 데이터에 대해서 최적의 효율로 계산이

가능하다.

Lua로 개발된 쉽고 용이한 프레임워크

스크립트 언어인 Lua 기반의 딥러닝 프레임워크로서 모델을 제작하는 과정의 단순화를 목표로

만들어졌다. 또한 GPU 처리를 위하여 C / C ++ 라이브러리와 CUDA를 사용한다.

Torch는 머신러닝, 신호 처리 등 분야에서 커뮤니티 주도 패키지의 대규모 생태계를 제공하며, 어떤

버전들은 페이스북, 구글과 같은 대형 회사에서 개발하여 사용하고 있다.

2017년 1월 Facebook에서 오픈한 PyTorch( Python으로 구현한 Torch API)가 큰 인기를 얻고

있다.

페이스 북, 트위터, 구글과 같은 Giants들이 사용하고 개발

최대한의 유연성을 달성하고 모델을 제작하는 과정을 매우 간단하게 만듦

최근 PyTorch라고 불리는 Torch의 Python 구현이 인기를 얻고 빠른 채택 추세임

21


전사 분석자원 통합관리 및 협업·공유

전사적 인공지능 분석 및 관리를 지원하는 강력한 솔루션 도입을 지원한다.

머신러닝 분석 결과를 Web 화면으로, 전사 또는 부서 내 공유 가능

100 여종 이상의 도표 및 그래픽 테이블 이용

R 코딩과 HTML 형태의 손쉬운 웹 화면 저작 프로그래밍

RStudio Server Pro [Open] or [Commercial]

R Studio의 강력한 편리 기능과 협업, 버전관리, 보안, 분산서버 환경의 자원관리를 더욱 효과적으로 이용

22


AI 플랫폼 구축전략

전사 인공지능 업무 전 프로세스 지원필요

최근 인공지능 플랫폼 구축 전략 Trend

빠르게 변화하는 환경에 즉시 대응하며 유연한 머신러닝 알고리즘 지원 및 분석자산의 통합관리

3. 전사 인공지능 플랫폼 구축인공지능 플랫폼은 사내 빅데이터 기반의 다양한 정보소스(정형/비정형)를 통합하여, 최신 인공지능

알고리즘을 이용하고자 하는 분석 수요를 지원하고, 통계모델 개발 이후 운영 프로세스에 신속히 반영

되도록 Agile한 통합 관리체계를 구축해야 함

Siloed 분석환경 혁신(공유, 자산화)

분석모델 및 알고리즘 버전 및 형상관리

오픈소스 S/W 기반의 머신(딥)러닝 분석 체계 지원

다양한 확장 패키지 사용을 위한 버전 관리체계확보

분산서버 환경을 지원하는 아키텍처 구성

CPU, GPU 기반의 병렬처리가 가능한 시스템 구성

23


분석모델 및 인공지능 알고리즘의 기업내 자산화

통계분석 모델이나 알고리즘의 기업 내 자산화를 위해 관리와 공유 2가지 필요. 관리측면에서는 모델

오브젝트와 모델개발 이력을 관리해야 하며, 공유를 위해서는 재사용, 모델 재현이 가능하도록 다양한

문서를 통합관리 해야 함

Data Scientist에 의해 개발된 결과물은 웹 서비스 형태로 Business Data Analyst에게 제공되고,

또한 운영계에 적용할 수 있도록 컨테이너 형태로 DevOps에게 전달함

1

24


GPU기반 분산서버 환경 구축

분산 환경 관리를 위해 GPU 분산 병렬 처리를 Code상으로 구현하여, 한 Session에 점유된 GPU job

은 다른 Session에서 자원 할당 할 수 없도록 해야 함. 리소스 관리 측면에서 Node, 과제, 사용자 별

자원 설정을 관리하여 운영, 개발 초기 구동시에 자원을 할당하는 체계를 구축해야 함

AI서비스 확장성을 고려한 관리방안

오픈 소스 분석 도구(R, Python) 등은 인터넷에 있는 패키지를 필요로 함. 따라서 패쇄망 환경에서

외부 패키지를 설치하는 방안으로 로컬 레파지토리를 구성하여 Cluster상의 모든 Node의 레파지토

리 목록에 로컬 레파지토리를 추가하여 설치

2

3

25


국내외 인공지능 플랫폼 시장 현황 및 트렌드

해외 시장 현황(Oversea market Situation)

AI PaaS(Platform as a Service)

구글 : 인공지능 영역에서 우위에 서기 위해 전용 프로세서 TPU(Tensor Processing Unit)를

개발, 이를 이용한 소프트웨어인 텐서플로우(TensorFlow)를 가동

마이크로소프트 : 8.22일 캘리포니아 쿠퍼티노에서 개최한 ‘핫칩스 2017(Hot Chips 2017)’

에서 딥러닝 가속 플랫폼‘ 브레인웨이브(Brainwave)’ 프로젝트를 발표

아마존 : Amazon Web Services(AWS)를 통해 AI Platform as a Service(PaaS)라 불리는

인공지능 플랫폼을 구축하는 등 시장 주도권 싸움이 본격화

Enterprise AI Sources and Actions(자료웎: Gartner, August 2017)

Direction & Trend

특정 도메인에 특화된 AI 알고리즘을 적용하여 대표 브랜드를 홍보 및 서비스하고 있으며, AI 통합

플랫폼(AI+분석환경+클라우드)을 지향하는 추세임

‘모바일 우선(Mobile First)’에서 ‘인공지능 우선(AI First)’으로 사업전략을 전환한 글로벌 IT기업

은 AI스타트업 인수합병 및 제휴를 통해 AI 플랫폼을 선제적으로 구축

주요 IT 기업들의 AI 현황 (자료 취합=키뉴스)

26


국내 시장 현황(Domestic market Situation)

‘플랫폼 서비스(AI as a Service)’ 를 목표(서비스 지향)

LG CNS : 빅데이터 분석 기간을 인공지능(AI) 기술로 대폭 줄인 빅데이터 분석 플랫폼 ‘답’

(DAP)을 출시

삼성 SDS : 대화형 AI 플랫폼 ‘브리티’를 출시 (음성·텍스트 기반 대화형 AI 브리티는 자연어로

대화하며 실적 조회 등 고객이 요청하는 업무를 지원하고 수행하는 지능형 비서). 자연어 이해와

추론 및 학습이 가능한 대화형 AI엔진을 적용한 것이 가장 큰 특징

SK C&C : IBM 왓슨을 국내에 서비스. 에이브릴이라는 새로운 브랜드로 AI플랫폼 시장을 공략

중임

네이버 : 클로바라는 AI 플랫폼을 보유. 스마트 스피커를 만들고, 다양한 모바일 앱을 만들고

있음. AI 기술을 클라우드에 올려 B2B 클라우드 서비스로 확장해 나가고 있음. 네이버 비즈니스

플랫폼(NCP)는 지난 6월 네이버 클로바, 자동통역엔진 파파고의 기술을 담은 API 상품을 네이버

클라우드 플랫폼(NCP)을 통해 출시

카카오톡 : B2B를 먼저 공략. 클라우드 기반으로 AI API를 제공하는 것은 아님. 비 클라우드 시대

의 B2B 비즈니스처럼 접근 (현대자동차와 손잡고 차량 인포테인먼트 시스템에 AI플랫폼 ‘카카오

아이’를 공급하고, 건설사와 손잡고 홈IoT를 이용한 스마트홈 시장에 진입). B2B 접근을 먼저

하고 B2C제품을 출시한다는 것이 카카오 전략의 차별점(최근 스마트스피커를 공개)

Hadoop 기반의 빅 데이터 플랫폼 전문 업체 : 클라우데라, 호튼웍스, 맵R 등 AI 알고리즘을 탑재

한 제품을 신속히 출시

27

4. 인공지능 전문기업, ㈜애자일소다

빅데이터, AI 플랫폼 인공지능, 머신러닝 분석

고객사의 기업가치(Value) 향상을 위해 ‘같이 고민하고 함께 노력

하는’ AI First 기업

인공지능기반 분석 S/W플랫폼인 SparklingSoDA위에 AID3(Design, Develop & Deploy)를 제공

하여 기업의 의사결정 최적화와 내재화를 지원합니다.


인공지능

전문 서비스

SparklingSoDA

실시간 빅데이터 인프라

구축

분석 플랫폼 구축

머신러닝 기반 시나리오

룰 엔진

Analytics Consulting

금융 / 제조 / 유통 / 통신

on-Site Consultion

DB 모델링/자연어 처리

SAS to R, ML 전환 등

Customized&On-site

Education service

기업 분석역량 고도화 및

내재화 지원

On-site Education

테마 주제형/R, ML 기본

역량 교육

Data Providing

국내 신용카드 전체 트래

픽의 25% 데이터 기반

약 700종의 타겟 마케 팅

지수 제공

On-demand Data 서비스

AIPlatform

AIConsulting

AIEducation

Big DataCommerce

28


Mega Trend에 대응, 애자일소다의 SparklingSoDA 출시

Big Giants 오픈소스 기반

국내 기업환경에 최적화

빅데이터 분석 성능 보장

분석가, IT 관리자 협업 지원

29


강력한 4개의 인공지능 플랫폼

SparklingSoDA는 기업의 정보 분석 환경과 도입 목적에 따라 유연한 적용이 가능하도록 4개의 플랫

폼으로 구성되어 컴포넌트 조립방식의 순차적 도입이 가능합니다.

Dev AI(모델분석) ModelOPS(모델 운영관리)

Data Dam(빅데이터, DB)Model_Repository(참조모델)

다양한 ML 플랫폼 지원

: H2O, TensorFlow, Spark, R

ML 분석 알고리즘 지원

: Deep Neural Network(DNN)/

Random Forest/GBM/SVM/k-means

및 Logistic Regression 등

모델의 배포 및 모니터링

모델의 버전관리 및 성능 비교 관리

모델 통합운영 관리를 위한 단계별 로그지원

으로 관리가 용이

업무별 분석 모델의 기업 자산화

(Corporate asset)를 위한 체계적인 관리

Big Data 저장 및 관리

정형, 비정형 데이터의 저장

Lamda Architecture를 통한 실시간 및 배치

기간 기반의 서비스

Node 장애에 대한 이중화를 지원하는 무정지

형 서비스

AI 분석을 위한 다양한 분석 모델 기본 내장

CPC(Customer-Product-Channel) 분석,

인공지능 적용 품질관리 등

경영예측, 고객분석, 상품판매 분석 , 채널분석

등

SparklingSoDA

30


R, Python, 텐서플로우 … Dev AI로 기업내 모든 분석 가능

국내 분석가 대부분이 선호하는 인공지능 플랫폼과 ML 알고리즘 이용을 지원합니다.

구글(Google)의 텐서플로우(TensorFLow)

H2O사의 H2O

아파치 Spark

다양한 분석 UI : R-Studio, Shiny, Python, Scala, Jupyter 등

활용 가능한 분석 알고리즘

딥러닝 - Deep Boltzmann Machine(DBM), Deep Belief Networks(DBN), CNN

앙상블(Ensemble) - Random Forest, GBM, Boosting, Bagging, AdaBoost

신경망(Neural Networks) - Perceptron, Back-Propagation, Hopfield Network

회귀분석(Regression) - Linear Regression, Stepwise, MARS, Logistic

분류(Decision Tree) - CART, ID3, C4.5, C5.0, CHAID, Conditional Decision Trees

클러스터링(Clustering) - k-means, K-Medians, Expectation Maximization, Hierarchical

Bayesian, PCA 등 Dimensionality Reduction, kNN etc.

최신 머신러닝 플랫폼 사용을 지원하고, 연동이 가능합니다.

각기 다른 알고리즘들이 SparklingSoDA 플랫폼

안에서는 유기적인 성능 발휘하도록 최적 튜닝

31


Source code Open, 표준모델을 수정해서 손쉽게 기업 내 적용 가능

고객, 상품, 판매분석 및 제조업의 스마트팩토리 분석까지 앞선 기업의 인공지능 분석 모델

500만 고객, 3천만건의 거래 데이터기반 기업분석 사례

제조업 스마트팩토리(Smart Factory) 적용모델

분석모델에 대한

“Source code 제공”

32


빅데이터 유통 서비스 (Data Enrichment Service)

부족한 기업 정보의 충실화(enrichment)를 위해 다양한 DataBase 소스를 통합하여 기업별 수요에

맞춘 빅데이터 유통서비스를 제공하고 있습니다.

150만개 Cell Index

주소지(우편번호), 성별, 연령별, 소득수준별로 전국민을 150만개의 미세한 Cell단위로 Lifestyle

활동정보를 지수(index)화 하여 제공

제공가능한 지수 및 DB유형

경쟁사대비 Cell별 점유율 변화

구매성향 지수

명품/해외여행/레저 등 The Rich Index

가맹점 종류별 구매 Trend 지수

Healthcare 지수

미용/성형 The Beauty Index

대출/론/현금서비스 지수

APT 분양정보 & 지수

보험료 납부 지수

통신비 수준 지수

커피(Coffee) 지수

스포츠(골프,아웃도어) 구매지수

e커머스 구매 지수

주유(Oil) 지수

이동(navigation) 패턴/지수

시네마 이용 지수

기타 On-demand 지수

개인정보

보호법

10%대의

시장 점유율고객접촉제한

김영균 이사

Email : [email protected]

HP : 010-9039-7296

임은희 부장

Email : [email protected]

HP : 010-4511-5202

CONTACT (영업문의)

agilesoda 800 4agilesoda.com/resources/file/agilesoda800.pdf · 2019-11-08 ·...

Documents

Transcript of agilesoda 800 4agilesoda.com/resources/file/agilesoda800.pdf · 2019-11-08 ·...