AI
-
안녕하세요 오늘은 머신러닝 또는 딥러닝 모델의 성능 평가방법에 대해 알아보고자 합니다. 위 그림처럼 학습된 모델의 성능이 좋은지 안좋은지는 어떻게 알 수 있을까요? 학습된 모델의 성능을 평가하기 위해 Confusion Matrix를 많이 활용합니다. 아래그림처럼 MNIST데이터를 학습한 모델에게 여러가지 숫자를 보여준다고 가정해보겠습니다. 1~4까지의 숫자들을 각각 5번씩 보여주었다고 가정해보고 입력값(X)에 따른 모델의 예측값(Y)을 행렬로 정리해보겠습니다. 위 테이블을 보시면 학습된 모델에게 '1'을 5번 보여줬을때 2번 맞췄다는걸 알 수 있습니다. '2'는 5번, '3'은 3번 , '4'는 4번 맞춘걸 알 수 있습니다. 이렇게 학습된 모델의 입력값과 예측값을 정리한 테이블을 Confusion Mat..
모델의 성능 평가방법(1) - Confusion Matrix안녕하세요 오늘은 머신러닝 또는 딥러닝 모델의 성능 평가방법에 대해 알아보고자 합니다. 위 그림처럼 학습된 모델의 성능이 좋은지 안좋은지는 어떻게 알 수 있을까요? 학습된 모델의 성능을 평가하기 위해 Confusion Matrix를 많이 활용합니다. 아래그림처럼 MNIST데이터를 학습한 모델에게 여러가지 숫자를 보여준다고 가정해보겠습니다. 1~4까지의 숫자들을 각각 5번씩 보여주었다고 가정해보고 입력값(X)에 따른 모델의 예측값(Y)을 행렬로 정리해보겠습니다. 위 테이블을 보시면 학습된 모델에게 '1'을 5번 보여줬을때 2번 맞췄다는걸 알 수 있습니다. '2'는 5번, '3'은 3번 , '4'는 4번 맞춘걸 알 수 있습니다. 이렇게 학습된 모델의 입력값과 예측값을 정리한 테이블을 Confusion Mat..
2021.09.24 -
저번 포스팅에서는 KNN알고리즘의 이론에 대해 알아보았습니다. 오늘은 깃허브에서 KNN알고리즘을 활용해서 색상 분류를 적용시킨 알고리즘에 대해 알아보도록 하겠습니다. (출처:https://github.com/ahmetozlu/color_recognition) GitHub - ahmetozlu/color_recognition: Color recognition & classification & detection on webcam stream / on video / on single ima :art: Color recognition & classification & detection on webcam stream / on video / on single image using K-Nearest Neighbors..
KNN(K-Nearest Neighbor)과 색상 분류(2)저번 포스팅에서는 KNN알고리즘의 이론에 대해 알아보았습니다. 오늘은 깃허브에서 KNN알고리즘을 활용해서 색상 분류를 적용시킨 알고리즘에 대해 알아보도록 하겠습니다. (출처:https://github.com/ahmetozlu/color_recognition) GitHub - ahmetozlu/color_recognition: Color recognition & classification & detection on webcam stream / on video / on single ima :art: Color recognition & classification & detection on webcam stream / on video / on single image using K-Nearest Neighbors..
2021.08.29 -
오늘은 KNN(K-Nearnest Neighbor)에 대해 알아볼려고 합니다. K-최근접 이웃이라고 불리우며, 분류기(Classifier) 역할을 하고 있습니다. 알고리즘의 이름이 왜 K-Nearest Neighbor인지는 아래 내용을 보면 충분히 이해하실 수 있을겁니다. KNN 알고리즘의 경우, 거리를 계산하여 가장 인접한 K개의 데이터를 선정하여 Class 분류를 하게 됩니다. 위 그림을 보면 k=1일 경우 , 입력된 데이터(물음표)는 어느 클래스로 분류를 하게 될까요? Class A로 분류하게 됩니다. 조금 직관적인 예시 이미지로 보겠습니다. KNN알고리즘에서 k=3 일 경우, 가운데 있는 초콜릿은 어떤 초콜릿(화이트, 다크)으로 분류할까요? k=3 일 경우 다크 초콜릿이 더 많이 분포하고 있기때문..
KNN(K-Nearest Neighbor)과 색상 분류(1)오늘은 KNN(K-Nearnest Neighbor)에 대해 알아볼려고 합니다. K-최근접 이웃이라고 불리우며, 분류기(Classifier) 역할을 하고 있습니다. 알고리즘의 이름이 왜 K-Nearest Neighbor인지는 아래 내용을 보면 충분히 이해하실 수 있을겁니다. KNN 알고리즘의 경우, 거리를 계산하여 가장 인접한 K개의 데이터를 선정하여 Class 분류를 하게 됩니다. 위 그림을 보면 k=1일 경우 , 입력된 데이터(물음표)는 어느 클래스로 분류를 하게 될까요? Class A로 분류하게 됩니다. 조금 직관적인 예시 이미지로 보겠습니다. KNN알고리즘에서 k=3 일 경우, 가운데 있는 초콜릿은 어떤 초콜릿(화이트, 다크)으로 분류할까요? k=3 일 경우 다크 초콜릿이 더 많이 분포하고 있기때문..
2021.08.21 -
카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
선형회귀(Linear Regression) 연습카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
2021.08.13 -
머신러닝을 배우기 시작하면 꼭 한번 쯤은 공부하게 되는 선형회귀분석입니다. 머신러닝을 배우는 과정에서는 선형회귀외에도 Binary Classificaion, PCA분석, KNN 알고리즘 등 다양한 방법들이 있지만 오늘은 선형회귀에 대해 알아보고자 합니다. 아래 이미지가 잘 보이시나요? 선형회귀분석을 잘 설명하는 이미지라고 볼 수 있습니다. 파란색 점들이 데이터 일때, 파란색 데이터들이 어떤 형태로 이루어져 있는 것 처럼 보이시나요? 빨간색 선이 잘 보여주고 있죠? 마치 데이터들이 선형성(Linear)을 띄고 있다는 것을 알 수 있습니다. 선형회귀분석을 적용하고자 하신다면 기본적으로 데이터들이 선형성을 띄는것이 필요합니다. 반대로 말하자면 분석하고자 하는 데이터셋이 원형형태의 군집을 이루고 있거나, 방사형..
선형회귀(Linear Regression)머신러닝을 배우기 시작하면 꼭 한번 쯤은 공부하게 되는 선형회귀분석입니다. 머신러닝을 배우는 과정에서는 선형회귀외에도 Binary Classificaion, PCA분석, KNN 알고리즘 등 다양한 방법들이 있지만 오늘은 선형회귀에 대해 알아보고자 합니다. 아래 이미지가 잘 보이시나요? 선형회귀분석을 잘 설명하는 이미지라고 볼 수 있습니다. 파란색 점들이 데이터 일때, 파란색 데이터들이 어떤 형태로 이루어져 있는 것 처럼 보이시나요? 빨간색 선이 잘 보여주고 있죠? 마치 데이터들이 선형성(Linear)을 띄고 있다는 것을 알 수 있습니다. 선형회귀분석을 적용하고자 하신다면 기본적으로 데이터들이 선형성을 띄는것이 필요합니다. 반대로 말하자면 분석하고자 하는 데이터셋이 원형형태의 군집을 이루고 있거나, 방사형..
2021.07.15