본문 바로가기
Security

이상 감지(anomaly detection) 알고리즘과 ML

by 올엠 2020. 11. 19.
반응형

이상 감지 알고리즘 역시 데이터 과학에서 많이 사용되는 알고리즘이다. 이상 감지 알고리즘은 다음과 같은 상황에 유리하다.

결제가 정상적인 것인지 알고 싶습니다.
비정상적인 인터넷 사용자를 알고 싶습니다.

 

Azure PCA 기반 알고리즘 설명

https://docs.microsoft.com/ko-kr/azure/machine-learning/machine-learning-algorithm-choice

 

기계 학습 알고리즘을 선택 하는 방법 - Azure Machine Learning

클러스터링, 분류 또는 회귀 실험에서 감독 및 자율 학습을 위한 Azure Machine Learning 알고리즘을 선택 하는 방법입니다.

docs.microsoft.com

위처럼 비 정상적인 행위를 찾아내는 것이 이상 감지 알고리즘이라고 할 수 있다.

이상 감지 알고리즘은 예기치 않은 상황이나 이벤트, 동작을 플래그로 지정하고 어디에서 문제를 찾아야 할지 단서를 줍니다. 예를 들어 결제 이상이라면, 국내에서 결제되던 카드가 갑자기 해외에서 결제가 되었다면 이상하다고 판단할 수 있는 자료를 제공해 준다.

 

대표적인 이상 감지 알고리즘은 3가지를 소개해 보겠다.

 

1. One-Class Support Vector(OC-SVM)

(지도학습) 정상적인 클래스, 모든 데이터를 하나의 클래스에 속하도록 합니다. 그리고 정상적인 클래스를 벗어난 예외 데이터 포인트를 탐지할 수 있는 모델

https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/one-class-support-vector-machine

 

ML Studio (classic): One-Class Support Vector Machine - Azure

Learn how to use the One-Class Support Vector Model module to create an anomaly detection model.

docs.microsoft.com

2. PCA 기반 이상 감지

(지도학습) 정형화된 분포에 속하는 대부분의 데이터의 경우 해당 분포에서 크게 벗어나는 지점이 의심 대상인 모델

https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/pca-based-anomaly-detection

 

ML Studio (classic): PCA-Based Anomaly Detection - Azure

Learn how to use the PCA-Based Anomaly Detection module to create an anomaly detection model based on Principal Component Analysis (PCA).

docs.microsoft.com

3. K-mean

(지도학습) 데이터를 클러스터와 같이 그룹화 하여 분류하는 모델

https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/k-means-clustering

 

ML Studio (classic): K-Means Clustering - Azure

Learn how to use the K-Means Clustering module to create an untrained K-means clustering model.

docs.microsoft.com

 

반응형

댓글0