머신러닝
-
만약 아래 그림처럼 Trained Model1과 Trained Model2가 있다고 가정해봅시다. 2가지 모델의 성능을 비교하기 위해서는 어떻게 하면 좋을까요? Acccuracy(정확도), Precision(정밀도), Recall(재현률), F1 Score를 사용하여 분석해볼 수 있도록 하겠습니다. 먼저 TP, TN, FP, FN이란 용어들에 대한 이해가 필요합니다. True Positive(TP) : 실제 True - 예측 True (정답) True Negative(TN) : 실제 False 예측 False (정답) False Positive(FP) : 실제 False 예측 True (오답) False Negative(FN) : 실제 True 예측 False (오답) 실제값과 예측값이 같을 경우(정답의..
모델의 성능 평가방법(2) - accuracy, precision, recall, F1 score만약 아래 그림처럼 Trained Model1과 Trained Model2가 있다고 가정해봅시다. 2가지 모델의 성능을 비교하기 위해서는 어떻게 하면 좋을까요? Acccuracy(정확도), Precision(정밀도), Recall(재현률), F1 Score를 사용하여 분석해볼 수 있도록 하겠습니다. 먼저 TP, TN, FP, FN이란 용어들에 대한 이해가 필요합니다. True Positive(TP) : 실제 True - 예측 True (정답) True Negative(TN) : 실제 False 예측 False (정답) False Positive(FP) : 실제 False 예측 True (오답) False Negative(FN) : 실제 True 예측 False (오답) 실제값과 예측값이 같을 경우(정답의..
2021.10.11 -
안녕하세요 오늘은 머신러닝 또는 딥러닝 모델의 성능 평가방법에 대해 알아보고자 합니다. 위 그림처럼 학습된 모델의 성능이 좋은지 안좋은지는 어떻게 알 수 있을까요? 학습된 모델의 성능을 평가하기 위해 Confusion Matrix를 많이 활용합니다. 아래그림처럼 MNIST데이터를 학습한 모델에게 여러가지 숫자를 보여준다고 가정해보겠습니다. 1~4까지의 숫자들을 각각 5번씩 보여주었다고 가정해보고 입력값(X)에 따른 모델의 예측값(Y)을 행렬로 정리해보겠습니다. 위 테이블을 보시면 학습된 모델에게 '1'을 5번 보여줬을때 2번 맞췄다는걸 알 수 있습니다. '2'는 5번, '3'은 3번 , '4'는 4번 맞춘걸 알 수 있습니다. 이렇게 학습된 모델의 입력값과 예측값을 정리한 테이블을 Confusion Mat..
모델의 성능 평가방법(1) - Confusion Matrix안녕하세요 오늘은 머신러닝 또는 딥러닝 모델의 성능 평가방법에 대해 알아보고자 합니다. 위 그림처럼 학습된 모델의 성능이 좋은지 안좋은지는 어떻게 알 수 있을까요? 학습된 모델의 성능을 평가하기 위해 Confusion Matrix를 많이 활용합니다. 아래그림처럼 MNIST데이터를 학습한 모델에게 여러가지 숫자를 보여준다고 가정해보겠습니다. 1~4까지의 숫자들을 각각 5번씩 보여주었다고 가정해보고 입력값(X)에 따른 모델의 예측값(Y)을 행렬로 정리해보겠습니다. 위 테이블을 보시면 학습된 모델에게 '1'을 5번 보여줬을때 2번 맞췄다는걸 알 수 있습니다. '2'는 5번, '3'은 3번 , '4'는 4번 맞춘걸 알 수 있습니다. 이렇게 학습된 모델의 입력값과 예측값을 정리한 테이블을 Confusion Mat..
2021.09.24 -
이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
주성분 분석, PCA(Principal Component Analysis) 쉽게 이해하기(2)이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
2021.09.18 -
오늘은 PCA분석, 주성분 분석에 대해 알아보고자 합니다. PCA(Principal Component Analysis)은 머신러닝에서 데이터의 차원 축소, 노이즈 제거 등 다양하게 활용되는 머신 러닝 기법입니다. 데이터 차원축소 이미지 주성분 분석 출처: https://ichi.pro/ko/pca-juseongbun-bunseog-leul-sayonghan-chawon-chugso-72444897482598 출처: https://datascienceschool.net/02%20mathematics/03.05%20PCA.html 딥러닝, 머신러닝에서 학습할 데이터의 차원을 줄이는 부분은 굉장히 중요한 요소입니다. 데이터의 차원을 줄임으로서 학습할 시간과, 데이터의 용량, AI 모델의 무게 등을 줄일 수 있..
주성분 분석, PCA(Principal Component Analysis) 쉽게 이해하기(1)오늘은 PCA분석, 주성분 분석에 대해 알아보고자 합니다. PCA(Principal Component Analysis)은 머신러닝에서 데이터의 차원 축소, 노이즈 제거 등 다양하게 활용되는 머신 러닝 기법입니다. 데이터 차원축소 이미지 주성분 분석 출처: https://ichi.pro/ko/pca-juseongbun-bunseog-leul-sayonghan-chawon-chugso-72444897482598 출처: https://datascienceschool.net/02%20mathematics/03.05%20PCA.html 딥러닝, 머신러닝에서 학습할 데이터의 차원을 줄이는 부분은 굉장히 중요한 요소입니다. 데이터의 차원을 줄임으로서 학습할 시간과, 데이터의 용량, AI 모델의 무게 등을 줄일 수 있..
2021.09.11 -
저번 포스팅에서는 KNN알고리즘의 이론에 대해 알아보았습니다. 오늘은 깃허브에서 KNN알고리즘을 활용해서 색상 분류를 적용시킨 알고리즘에 대해 알아보도록 하겠습니다. (출처:https://github.com/ahmetozlu/color_recognition) GitHub - ahmetozlu/color_recognition: Color recognition & classification & detection on webcam stream / on video / on single ima :art: Color recognition & classification & detection on webcam stream / on video / on single image using K-Nearest Neighbors..
KNN(K-Nearest Neighbor)과 색상 분류(2)저번 포스팅에서는 KNN알고리즘의 이론에 대해 알아보았습니다. 오늘은 깃허브에서 KNN알고리즘을 활용해서 색상 분류를 적용시킨 알고리즘에 대해 알아보도록 하겠습니다. (출처:https://github.com/ahmetozlu/color_recognition) GitHub - ahmetozlu/color_recognition: Color recognition & classification & detection on webcam stream / on video / on single ima :art: Color recognition & classification & detection on webcam stream / on video / on single image using K-Nearest Neighbors..
2021.08.29 -
오늘은 KNN(K-Nearnest Neighbor)에 대해 알아볼려고 합니다. K-최근접 이웃이라고 불리우며, 분류기(Classifier) 역할을 하고 있습니다. 알고리즘의 이름이 왜 K-Nearest Neighbor인지는 아래 내용을 보면 충분히 이해하실 수 있을겁니다. KNN 알고리즘의 경우, 거리를 계산하여 가장 인접한 K개의 데이터를 선정하여 Class 분류를 하게 됩니다. 위 그림을 보면 k=1일 경우 , 입력된 데이터(물음표)는 어느 클래스로 분류를 하게 될까요? Class A로 분류하게 됩니다. 조금 직관적인 예시 이미지로 보겠습니다. KNN알고리즘에서 k=3 일 경우, 가운데 있는 초콜릿은 어떤 초콜릿(화이트, 다크)으로 분류할까요? k=3 일 경우 다크 초콜릿이 더 많이 분포하고 있기때문..
KNN(K-Nearest Neighbor)과 색상 분류(1)오늘은 KNN(K-Nearnest Neighbor)에 대해 알아볼려고 합니다. K-최근접 이웃이라고 불리우며, 분류기(Classifier) 역할을 하고 있습니다. 알고리즘의 이름이 왜 K-Nearest Neighbor인지는 아래 내용을 보면 충분히 이해하실 수 있을겁니다. KNN 알고리즘의 경우, 거리를 계산하여 가장 인접한 K개의 데이터를 선정하여 Class 분류를 하게 됩니다. 위 그림을 보면 k=1일 경우 , 입력된 데이터(물음표)는 어느 클래스로 분류를 하게 될까요? Class A로 분류하게 됩니다. 조금 직관적인 예시 이미지로 보겠습니다. KNN알고리즘에서 k=3 일 경우, 가운데 있는 초콜릿은 어떤 초콜릿(화이트, 다크)으로 분류할까요? k=3 일 경우 다크 초콜릿이 더 많이 분포하고 있기때문..
2021.08.21 -
카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
선형회귀(Linear Regression) 연습카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
2021.08.13 -
이미지 프로세싱 쪽을 공부하다보면 자연스럽게 머신러닝을 접하게 됩니다. 특히 요즘처럼 스마트폰 카메라와 AI를 적용한 어플리케이션들이 나오면서 관심이 있는 분들은 관련 기술분야를 찾다보면 더 빠르게 접하셨을 겁니다. 이번 글은 이미지 프로세싱쪽을 개발하면서 봤었던 머신러닝 몇가지를 리뷰해보고자 합니다. 1) Face Detection 알고리즘 "Haar like-features" "Haar like-features"는 SW교육에 많이 활용했던 Face Detection 알고리즘 입니다. 그림에서 보이는 A,B,C,D와 같은 얼굴의 명암비 정보를 가지고 있는 여러 개의 검출기를 순차적으로 사용하여 사람의 얼굴위치를 찾아냅니다. 처음에는 간단한 검출기를 적용하고 점점 더 어려운 검출기를 적용하게 됩니다.(C..
ML(Machine Learning) 짧은 Review이미지 프로세싱 쪽을 공부하다보면 자연스럽게 머신러닝을 접하게 됩니다. 특히 요즘처럼 스마트폰 카메라와 AI를 적용한 어플리케이션들이 나오면서 관심이 있는 분들은 관련 기술분야를 찾다보면 더 빠르게 접하셨을 겁니다. 이번 글은 이미지 프로세싱쪽을 개발하면서 봤었던 머신러닝 몇가지를 리뷰해보고자 합니다. 1) Face Detection 알고리즘 "Haar like-features" "Haar like-features"는 SW교육에 많이 활용했던 Face Detection 알고리즘 입니다. 그림에서 보이는 A,B,C,D와 같은 얼굴의 명암비 정보를 가지고 있는 여러 개의 검출기를 순차적으로 사용하여 사람의 얼굴위치를 찾아냅니다. 처음에는 간단한 검출기를 적용하고 점점 더 어려운 검출기를 적용하게 됩니다.(C..
2021.08.05