기계학습
-
만약 아래 그림처럼 Trained Model1과 Trained Model2가 있다고 가정해봅시다. 2가지 모델의 성능을 비교하기 위해서는 어떻게 하면 좋을까요? Acccuracy(정확도), Precision(정밀도), Recall(재현률), F1 Score를 사용하여 분석해볼 수 있도록 하겠습니다. 먼저 TP, TN, FP, FN이란 용어들에 대한 이해가 필요합니다. True Positive(TP) : 실제 True - 예측 True (정답) True Negative(TN) : 실제 False 예측 False (정답) False Positive(FP) : 실제 False 예측 True (오답) False Negative(FN) : 실제 True 예측 False (오답) 실제값과 예측값이 같을 경우(정답의..
모델의 성능 평가방법(2) - accuracy, precision, recall, F1 score만약 아래 그림처럼 Trained Model1과 Trained Model2가 있다고 가정해봅시다. 2가지 모델의 성능을 비교하기 위해서는 어떻게 하면 좋을까요? Acccuracy(정확도), Precision(정밀도), Recall(재현률), F1 Score를 사용하여 분석해볼 수 있도록 하겠습니다. 먼저 TP, TN, FP, FN이란 용어들에 대한 이해가 필요합니다. True Positive(TP) : 실제 True - 예측 True (정답) True Negative(TN) : 실제 False 예측 False (정답) False Positive(FP) : 실제 False 예측 True (오답) False Negative(FN) : 실제 True 예측 False (오답) 실제값과 예측값이 같을 경우(정답의..
2021.10.11 -
안녕하세요 오늘은 머신러닝 또는 딥러닝 모델의 성능 평가방법에 대해 알아보고자 합니다. 위 그림처럼 학습된 모델의 성능이 좋은지 안좋은지는 어떻게 알 수 있을까요? 학습된 모델의 성능을 평가하기 위해 Confusion Matrix를 많이 활용합니다. 아래그림처럼 MNIST데이터를 학습한 모델에게 여러가지 숫자를 보여준다고 가정해보겠습니다. 1~4까지의 숫자들을 각각 5번씩 보여주었다고 가정해보고 입력값(X)에 따른 모델의 예측값(Y)을 행렬로 정리해보겠습니다. 위 테이블을 보시면 학습된 모델에게 '1'을 5번 보여줬을때 2번 맞췄다는걸 알 수 있습니다. '2'는 5번, '3'은 3번 , '4'는 4번 맞춘걸 알 수 있습니다. 이렇게 학습된 모델의 입력값과 예측값을 정리한 테이블을 Confusion Mat..
모델의 성능 평가방법(1) - Confusion Matrix안녕하세요 오늘은 머신러닝 또는 딥러닝 모델의 성능 평가방법에 대해 알아보고자 합니다. 위 그림처럼 학습된 모델의 성능이 좋은지 안좋은지는 어떻게 알 수 있을까요? 학습된 모델의 성능을 평가하기 위해 Confusion Matrix를 많이 활용합니다. 아래그림처럼 MNIST데이터를 학습한 모델에게 여러가지 숫자를 보여준다고 가정해보겠습니다. 1~4까지의 숫자들을 각각 5번씩 보여주었다고 가정해보고 입력값(X)에 따른 모델의 예측값(Y)을 행렬로 정리해보겠습니다. 위 테이블을 보시면 학습된 모델에게 '1'을 5번 보여줬을때 2번 맞췄다는걸 알 수 있습니다. '2'는 5번, '3'은 3번 , '4'는 4번 맞춘걸 알 수 있습니다. 이렇게 학습된 모델의 입력값과 예측값을 정리한 테이블을 Confusion Mat..
2021.09.24 -
이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
주성분 분석, PCA(Principal Component Analysis) 쉽게 이해하기(2)이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
2021.09.18 -
카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
선형회귀(Linear Regression) 연습카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
2021.08.13 -
머신러닝을 배우기 시작하면 꼭 한번 쯤은 공부하게 되는 선형회귀분석입니다. 머신러닝을 배우는 과정에서는 선형회귀외에도 Binary Classificaion, PCA분석, KNN 알고리즘 등 다양한 방법들이 있지만 오늘은 선형회귀에 대해 알아보고자 합니다. 아래 이미지가 잘 보이시나요? 선형회귀분석을 잘 설명하는 이미지라고 볼 수 있습니다. 파란색 점들이 데이터 일때, 파란색 데이터들이 어떤 형태로 이루어져 있는 것 처럼 보이시나요? 빨간색 선이 잘 보여주고 있죠? 마치 데이터들이 선형성(Linear)을 띄고 있다는 것을 알 수 있습니다. 선형회귀분석을 적용하고자 하신다면 기본적으로 데이터들이 선형성을 띄는것이 필요합니다. 반대로 말하자면 분석하고자 하는 데이터셋이 원형형태의 군집을 이루고 있거나, 방사형..
선형회귀(Linear Regression)머신러닝을 배우기 시작하면 꼭 한번 쯤은 공부하게 되는 선형회귀분석입니다. 머신러닝을 배우는 과정에서는 선형회귀외에도 Binary Classificaion, PCA분석, KNN 알고리즘 등 다양한 방법들이 있지만 오늘은 선형회귀에 대해 알아보고자 합니다. 아래 이미지가 잘 보이시나요? 선형회귀분석을 잘 설명하는 이미지라고 볼 수 있습니다. 파란색 점들이 데이터 일때, 파란색 데이터들이 어떤 형태로 이루어져 있는 것 처럼 보이시나요? 빨간색 선이 잘 보여주고 있죠? 마치 데이터들이 선형성(Linear)을 띄고 있다는 것을 알 수 있습니다. 선형회귀분석을 적용하고자 하신다면 기본적으로 데이터들이 선형성을 띄는것이 필요합니다. 반대로 말하자면 분석하고자 하는 데이터셋이 원형형태의 군집을 이루고 있거나, 방사형..
2021.07.15