pandas
-
이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
주성분 분석, PCA(Principal Component Analysis) 쉽게 이해하기(2)이전 포스팅에선 주성분 분석의 개념에 대해 알아보았습니다. (이전 포스팅 바로가기) 이번 글에선 Python을 이용하여 PCA분석 예제를 테스트 해볼 수있도록 해보겠습니다. PCA는 Eigen Value값이 큰 Eigen Vector를 선택하여 차원을 축소하는 알고리즘입니다. 먼저 Pandas를 활용하여 테스트할 데이터 셋을 만들어 보도록 하겠습니다. (참조:https://github.com/minsuk-heo/python_tutorial/blob/master/data_science/pca/PCA.ipynb) import pandas as pd df.loc[0] = [1200, 1, 0, 0, 2, 'Skinny'] df.loc[1] = [2800, 1, 1, 1, 1, 'Normal'] df.loc[2..
2021.09.18 -
카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
선형회귀(Linear Regression) 연습카글(Kaggle)의 데이터셋을 활용하여 이전에 정리했던 선형회귀 모델을 실습하고자 합니다. 선형회귀 모델의 경우 앞서말 한 바와 같이 데이터의 선형성(Linear)을 뛰는 것이 중요합니다. 하지만 비선형적인(Non-Linear) 데이터들이 훨씬 많이 분포합니다. 이번 포스팅은 카글의 데이터셋을 활용해서 선형회귀모델을 적용시키는 것에 의미를 두고자합니다. 테스트용으로 사용할 데이터셋은 city_temperature.csv 파일입니다. 나라별 주요 도시의 평균온도가 나와있습니다. 저는 그 중 서울의 여름 온도를 사용하도록 하겠습니다. 혹시나 데이터가 필요하신분들은 하단 링크를 통해 다운받으시면 됩니다. https://drive.google.com/drive/folders/1LFNWWpE5QGzNIkkz4Y..
2021.08.13