AI
-
저번 글에서는 선형회귀 분석을 Python으로 구현을 해보았습니다. (Python 선형회귀 분석 바로가기) 이번엔 비용함수(Cost Function)에 대해 조금 더 자세히 알아가 보도록 하겠습니다. 아래 그림을 한번 보도록 하죠 저희 가설이 H(x) = w*x+b라는것을 알수있습니다. 실제 데이터셋에 맞는 선형회귀모델을 만들기 위해서는 저희 가설이 Y=2*x라는 값과 최대한 같아져야 하죠. x1, x2, x3 값이 주어 졌을때 H(x)의 값이 y의 값에 가까울 수록 잘 예측한 선형회귀 모델이 되는 것이죠. 아래와 같은 비용함수(Cost Function)을 보시면 x1,x2,x3 ....xn 을 입력하였을때의 가설과 실제 y 값의 차에 대한 평균인것을 알 수 있습니다. 비용함수가 가장 작은 w값이 실제 ..
비용함수(Cost Function)에 대해저번 글에서는 선형회귀 분석을 Python으로 구현을 해보았습니다. (Python 선형회귀 분석 바로가기) 이번엔 비용함수(Cost Function)에 대해 조금 더 자세히 알아가 보도록 하겠습니다. 아래 그림을 한번 보도록 하죠 저희 가설이 H(x) = w*x+b라는것을 알수있습니다. 실제 데이터셋에 맞는 선형회귀모델을 만들기 위해서는 저희 가설이 Y=2*x라는 값과 최대한 같아져야 하죠. x1, x2, x3 값이 주어 졌을때 H(x)의 값이 y의 값에 가까울 수록 잘 예측한 선형회귀 모델이 되는 것이죠. 아래와 같은 비용함수(Cost Function)을 보시면 x1,x2,x3 ....xn 을 입력하였을때의 가설과 실제 y 값의 차에 대한 평균인것을 알 수 있습니다. 비용함수가 가장 작은 w값이 실제 ..
2021.07.29 -
지난 글에 이어 모델 학습 및 평가를 해보겠습니다. # 모델링 데이터에서 X와 y를 분리 시킵니다 #- Scaling - 스케일링은 예를들어 집값의 범위는 100억~천만원 단위인데 BMI 값은 18~30이라 모델링할때 수치가 큰쪽으로 치우쳐 모델링이 잘 안되는것을 방지하기위해 설정한 범위 내의 값으로 변환 시켜줍니다. scaling model로는 StandardScaler를 씁니다. fit_transform()은 fit() 과 transform() 함께 수행하는 메소드 입니다. from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split X = df.loc[:, df.columns !..
Pima Indian Diabetes 데이터 Clustering & Classification (Part.2)지난 글에 이어 모델 학습 및 평가를 해보겠습니다. # 모델링 데이터에서 X와 y를 분리 시킵니다 #- Scaling - 스케일링은 예를들어 집값의 범위는 100억~천만원 단위인데 BMI 값은 18~30이라 모델링할때 수치가 큰쪽으로 치우쳐 모델링이 잘 안되는것을 방지하기위해 설정한 범위 내의 값으로 변환 시켜줍니다. scaling model로는 StandardScaler를 씁니다. fit_transform()은 fit() 과 transform() 함께 수행하는 메소드 입니다. from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split X = df.loc[:, df.columns !..
2021.07.24 -
앞서 배운 선형회귀 분석을 Python으로 구현해보고자 합니다. 먼저 테스트할 데이터가 필요합니다. x,y 데이터 셋을 아래처럼 정의하겠습니다. import tensorflow as tf x_data = [1.,2.,3.,4.] y_data = [1.,3.,5.,7.] x와 y 데이터를 좌표에 찍어서 보면 데이터가 선형(linear)을 이루는것을 알 수 가 있습니다. 이제 이 데이터 셋에 가장 적합한 선을 찾을 수 있도록 해보겠습니다. H(x) = w*x라는 임의의 가설(Hypothesis)을 세우도록 하겠습니다. Python과 TensorFlow를 이용하여 아래처럼 작성해보겠습니다. W = tf.Variable(tf.random_uniform([1],-1.0,1.0)) b = tf.Variable(tf..
선형회귀 Python으로 구현하기앞서 배운 선형회귀 분석을 Python으로 구현해보고자 합니다. 먼저 테스트할 데이터가 필요합니다. x,y 데이터 셋을 아래처럼 정의하겠습니다. import tensorflow as tf x_data = [1.,2.,3.,4.] y_data = [1.,3.,5.,7.] x와 y 데이터를 좌표에 찍어서 보면 데이터가 선형(linear)을 이루는것을 알 수 가 있습니다. 이제 이 데이터 셋에 가장 적합한 선을 찾을 수 있도록 해보겠습니다. H(x) = w*x라는 임의의 가설(Hypothesis)을 세우도록 하겠습니다. Python과 TensorFlow를 이용하여 아래처럼 작성해보겠습니다. W = tf.Variable(tf.random_uniform([1],-1.0,1.0)) b = tf.Variable(tf..
2021.07.22 -
머신러닝을 배우기 시작하면 꼭 한번 쯤은 공부하게 되는 선형회귀분석입니다. 머신러닝을 배우는 과정에서는 선형회귀외에도 Binary Classificaion, PCA분석, KNN 알고리즘 등 다양한 방법들이 있지만 오늘은 선형회귀에 대해 알아보고자 합니다. 아래 이미지가 잘 보이시나요? 선형회귀분석을 잘 설명하는 이미지라고 볼 수 있습니다. 파란색 점들이 데이터 일때, 파란색 데이터들이 어떤 형태로 이루어져 있는 것 처럼 보이시나요? 빨간색 선이 잘 보여주고 있죠? 마치 데이터들이 선형성(Linear)을 띄고 있다는 것을 알 수 있습니다. 선형회귀분석을 적용하고자 하신다면 기본적으로 데이터들이 선형성을 띄는것이 필요합니다. 반대로 말하자면 분석하고자 하는 데이터셋이 원형형태의 군집을 이루고 있거나, 방사형..
선형회귀(Linear Regression)머신러닝을 배우기 시작하면 꼭 한번 쯤은 공부하게 되는 선형회귀분석입니다. 머신러닝을 배우는 과정에서는 선형회귀외에도 Binary Classificaion, PCA분석, KNN 알고리즘 등 다양한 방법들이 있지만 오늘은 선형회귀에 대해 알아보고자 합니다. 아래 이미지가 잘 보이시나요? 선형회귀분석을 잘 설명하는 이미지라고 볼 수 있습니다. 파란색 점들이 데이터 일때, 파란색 데이터들이 어떤 형태로 이루어져 있는 것 처럼 보이시나요? 빨간색 선이 잘 보여주고 있죠? 마치 데이터들이 선형성(Linear)을 띄고 있다는 것을 알 수 있습니다. 선형회귀분석을 적용하고자 하신다면 기본적으로 데이터들이 선형성을 띄는것이 필요합니다. 반대로 말하자면 분석하고자 하는 데이터셋이 원형형태의 군집을 이루고 있거나, 방사형..
2021.07.15 -
- PROCESS - 데이터 탐색 -> 데이터 전처리 -> 데이터 클러스터링 -> 모델링 -> 성능 평가 이번에는 데이터분석의 입문용으로 좋은 pima indian diabetes 데이터로 군집화와 분류를 해보겠습니다. 코드는 git에 올려놨으니 참고하시면 되겠습니다. https://github.com/imtelloper/data-analysis-pimaindian-cls-clf.git 데이터 출처 : https://www.kaggle.com/uciml/pima-indians-diabetes-database ############ 데이터 컬럼 설명 ############ Pregnancies: 임신 횟수 Glucose: 포도당 부하 검사 수치 BloodPressure: 혈압(mm Hg) SkinThick..
Pima Indian Diabetes 데이터 Clustering & Classification (Part.1)- PROCESS - 데이터 탐색 -> 데이터 전처리 -> 데이터 클러스터링 -> 모델링 -> 성능 평가 이번에는 데이터분석의 입문용으로 좋은 pima indian diabetes 데이터로 군집화와 분류를 해보겠습니다. 코드는 git에 올려놨으니 참고하시면 되겠습니다. https://github.com/imtelloper/data-analysis-pimaindian-cls-clf.git 데이터 출처 : https://www.kaggle.com/uciml/pima-indians-diabetes-database ############ 데이터 컬럼 설명 ############ Pregnancies: 임신 횟수 Glucose: 포도당 부하 검사 수치 BloodPressure: 혈압(mm Hg) SkinThick..
2021.07.13 -
저는 풀스텍 웹앱 개발자입니다. 주로 React와 NodeJS를 사용합니다. 앞으로 날이 갈수록 모바일이나 웹 어플리케이션 서비스에 인공지능 기능이 더해져서 나오기 때문에 어떤 서비스를 기획하려고 하여도 경쟁력을 높이려면 인공지능을 도입해야 된다 판단하여서 좋은 기회로 참여하였습니다. 인공지능 노바투스 1기 교육생으로 참가했습니다. 총 교육 기간은 21년 2월 5일 ~ 21년 6월 25일까지이며 UNIST 인공지능 대학원 교수님들께서 매주 금요일마다 강의를 해주십니다. 하루에 8시간, 이론과 실습시간으로 나누어서 교육이 진행되는데요, 짧은 시간 내에 기업의 종사자가 인공지능을 배워서 기업 내 산업의 문제점을 해결할 수 있도록 교육을 하다 보니 인공지능에 대한 방대한 내용을 압축적으로 엑기스를 만들어서 강..
인공지능 노바투스(NOVATUS) 교육 후기저는 풀스텍 웹앱 개발자입니다. 주로 React와 NodeJS를 사용합니다. 앞으로 날이 갈수록 모바일이나 웹 어플리케이션 서비스에 인공지능 기능이 더해져서 나오기 때문에 어떤 서비스를 기획하려고 하여도 경쟁력을 높이려면 인공지능을 도입해야 된다 판단하여서 좋은 기회로 참여하였습니다. 인공지능 노바투스 1기 교육생으로 참가했습니다. 총 교육 기간은 21년 2월 5일 ~ 21년 6월 25일까지이며 UNIST 인공지능 대학원 교수님들께서 매주 금요일마다 강의를 해주십니다. 하루에 8시간, 이론과 실습시간으로 나누어서 교육이 진행되는데요, 짧은 시간 내에 기업의 종사자가 인공지능을 배워서 기업 내 산업의 문제점을 해결할 수 있도록 교육을 하다 보니 인공지능에 대한 방대한 내용을 압축적으로 엑기스를 만들어서 강..
2021.05.19 -
ValueError: Solver lbfgs supports only 'l2' or 'none' penalties, got l1 penaltygrid seacrh cv를 사용할때 파라미터들을 정리해야 합니다.이전의 도큐먼트를 참고하여 설정할 Logistic Regression 모델의 파라미터 입니다.Logistic Regression -> penalty : "l1", "l2", "elasticnet", "none" default "l2"하지만 param_lr = {"penalty":["l1", "l2", "elasticnet", "none"]} 위의 코드는 아래의 에러문구가 뜹니다.# ValueError: Solver lbfgs supports only 'l2' or 'none' penalties, go..
ValueError: Solver lbfgs supports only 'l2' or 'none' penalties, got l1 penaltyValueError: Solver lbfgs supports only 'l2' or 'none' penalties, got l1 penaltygrid seacrh cv를 사용할때 파라미터들을 정리해야 합니다.이전의 도큐먼트를 참고하여 설정할 Logistic Regression 모델의 파라미터 입니다.Logistic Regression -> penalty : "l1", "l2", "elasticnet", "none" default "l2"하지만 param_lr = {"penalty":["l1", "l2", "elasticnet", "none"]} 위의 코드는 아래의 에러문구가 뜹니다.# ValueError: Solver lbfgs supports only 'l2' or 'none' penalties, go..
2021.05.19 -
DataConversionWarning: A column-vector y was passed when a 1d array was expected.Please change the shape of y to (n_samples,), for example using ravel(). def fit_clasifiers(gs_clfs, X, y): for clf in gs_clfs: print(X.shape) clf.fit(X, y)#before#fit_clasifiers(gs_clfs, X_train, y_train)#afterfit_clasifiers(gs_clfs, X_train, y_train.values.ravel())show_gridsearch_result(gs_clfs) f..
DataConversionWarning: A column-vector y was passed when a 1d array was expected.DataConversionWarning: A column-vector y was passed when a 1d array was expected.Please change the shape of y to (n_samples,), for example using ravel(). def fit_clasifiers(gs_clfs, X, y): for clf in gs_clfs: print(X.shape) clf.fit(X, y)#before#fit_clasifiers(gs_clfs, X_train, y_train)#afterfit_clasifiers(gs_clfs, X_train, y_train.values.ravel())show_gridsearch_result(gs_clfs) f..
2021.05.19