Python
-
이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
주성분 분석, PCA(Principal Component Analysis) 쉽게 이해하기(2)이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
2021.09.18 -
오늘은 KNN(K-Nearnest Neighbor)에 대해 알아볼려고 합니다. K-최근접 이웃이라고 불리우며, 분류기(Classifier) 역할을 하고 있습니다. 알고리즘의 이름이 왜 K-Nearest Neighbor인지는 아래 내용을 보면 충분히 이해하실 수 있을겁니다. KNN 알고리즘의 경우, 거리를 계산하여 가장 인접한 K개의 데이터를 선정하여 Class 분류를 하게 됩니다. 위 그림을 보면 k=1일 경우 , 입력된 데이터(물음표)는 어느 클래스로 분류를 하게 될까요? Class A로 분류하게 됩니다. 조금 직관적인 예시 이미지로 보겠습니다. KNN알고리즘에서 k=3 일 경우, 가운데 있는 초콜릿은 어떤 초콜릿(화이트, 다크)으로 분류할까요? k=3 일 경우 다크 초콜릿이 더 많이 분포하고 있기때문..
KNN(K-Nearest Neighbor)과 색상 분류(1)오늘은 KNN(K-Nearnest Neighbor)에 대해 알아볼려고 합니다. K-최근접 이웃이라고 불리우며, 분류기(Classifier) 역할을 하고 있습니다. 알고리즘의 이름이 왜 K-Nearest Neighbor인지는 아래 내용을 보면 충분히 이해하실 수 있을겁니다. KNN 알고리즘의 경우, 거리를 계산하여 가장 인접한 K개의 데이터를 선정하여 Class 분류를 하게 됩니다. 위 그림을 보면 k=1일 경우 , 입력된 데이터(물음표)는 어느 클래스로 분류를 하게 될까요? Class A로 분류하게 됩니다. 조금 직관적인 예시 이미지로 보겠습니다. KNN알고리즘에서 k=3 일 경우, 가운데 있는 초콜릿은 어떤 초콜릿(화이트, 다크)으로 분류할까요? k=3 일 경우 다크 초콜릿이 더 많이 분포하고 있기때문..
2021.08.21 -
앞서 배운 선형회귀 분석을 Python으로 구현해보고자 합니다. 먼저 테스트할 데이터가 필요합니다. x,y 데이터 셋을 아래처럼 정의하겠습니다. import tensorflow as tf x_data = [1.,2.,3.,4.] y_data = [1.,3.,5.,7.] x와 y 데이터를 좌표에 찍어서 보면 데이터가 선형(linear)을 이루는것을 알 수 가 있습니다. 이제 이 데이터 셋에 가장 적합한 선을 찾을 수 있도록 해보겠습니다. H(x) = w*x라는 임의의 가설(Hypothesis)을 세우도록 하겠습니다. Python과 TensorFlow를 이용하여 아래처럼 작성해보겠습니다. W = tf.Variable(tf.random_uniform([1],-1.0,1.0)) b = tf.Variable(tf..
선형회귀 Python으로 구현하기앞서 배운 선형회귀 분석을 Python으로 구현해보고자 합니다. 먼저 테스트할 데이터가 필요합니다. x,y 데이터 셋을 아래처럼 정의하겠습니다. import tensorflow as tf x_data = [1.,2.,3.,4.] y_data = [1.,3.,5.,7.] x와 y 데이터를 좌표에 찍어서 보면 데이터가 선형(linear)을 이루는것을 알 수 가 있습니다. 이제 이 데이터 셋에 가장 적합한 선을 찾을 수 있도록 해보겠습니다. H(x) = w*x라는 임의의 가설(Hypothesis)을 세우도록 하겠습니다. Python과 TensorFlow를 이용하여 아래처럼 작성해보겠습니다. W = tf.Variable(tf.random_uniform([1],-1.0,1.0)) b = tf.Variable(tf..
2021.07.22