TIL/머신러닝 13

머신러닝 - 다중 선형회귀 이론, 실습

다중선형회귀실제의 데이터들은 비선형적 관계를 가지는 경우가 많고, X 데이터가 압도적으로 많음.이를 위해서 X변수를 추가하거나 변형할 줄 알아야 함. 수치형 데이터연속형 데이터 : 두 개의 값이 무한한 개수로 나누어진 데이터 ex) 키, 몸무게이산형 데이터 : 두 개의 값이 유한한 개수로 나누어진 데이터 ex) 주사위 눈, 나이범주형 데이터순서형 자료 : 자료의 순서 의미가 있음 ex) 학점, 등급명목형 자료 : 자료의 순서 의미가 없음 ex) 혈액형, 성별> 범주형 데이터를 머신러닝 모델에 훈련시키려면 해당 데이터를 숫자로 바꿔야함.   이를 Encoding 과정이라 함. 다중 선형회귀 실습전 포스팅에서 실습했던 sklearn의 tips 데이터셋으로 다중선형회귀를 실습해보고자 한다. '성별' 컬럼을 X..

TIL/머신러닝 2024.08.12

머신러닝 - 선형회귀 실습

머신러닝 선형회귀분석 실습1. 사용할 라이브러리 설치2. 데이터 확인 (seaborn tips)3. 선형회귀 모델 훈련4. 모델 평가 1. 라이브러리 설치우선 사용할 라이브러리를 모두 importimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport numpy as npimport sklearn    # scikit-learn 말고 이렇게 적어야 함. 라이브러리가 없으면 pip install 라이브러리명  2. 데이터 확인실습에 활용할 데이터는 Seaborn 라이브러리의 tips 데이터 주제) 해당 데이터에 대해 total_bill (X) 당 얼마의 tip (Y)를 받을 수 있을 지 예측해보자. 모델을 훈련하기에 앞서, ..

TIL/머신러닝 2024.08.12

머신러닝 - 선형회귀 이론

AI : 인간의 지능을 요구하는 업무를 수행하기 위한 시스템Machine Learning : 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘Deep Learning : 인공 신경망을 이용한 머신러닝 머신러닝의 종류 Supervised Learning(지도 학습)Unsupervised Learning(비지도 학습)Reinforcement Learning(강화 학습)머신러닝 적용 분야금융 : 신용평가, 사기탐지, 주식 예측헬스케어 : 질병 예측, 환자 데이터 분석이커머스 : 고객 구매 패턴 분석, 추천 시스템, 가격 최적화, 장바구니 분석자연어처리 : 번역, 챗봇, 텍스트분석이미지 & 영상처리 : 얼굴인식, 이미지 생성1. 선형회귀 이론통계학에서 사용하는 선형회귀 식Y = B0 + B1X + eY는 ..

TIL/머신러닝 2024.08.08