🧑‍💻복습/파이썬

🧑‍💻복습/파이썬

파이썬 AI 머신러닝 회귀분석 미니프로젝트(제주도 퇴근버스 예측)

제주도 퇴근 버스 승객 예측. 머신러닝 프로젝트 코드리뷰 데이터를 살펴보는 과정. x data는 오전부터 점심시간 까지의 탑승 승객 수와 버스에 대한 정보 및 날짜정보이다. y data는 18~20ride 이다. 아래 이미지를 보면 유의미한 상관관계를 나타내는 부분을 확인해볼 수 있다. #1. 데이터 전처리 # 1. Data preprocessing # Read the dataset from a CSV file path = './' datasets = pd.read_csv(path + 'train.csv') # Extract the relevant features from the dataset x = datasets[['id', 'bus_route_id', 'in_out', 'station_code', ..

🧑‍💻복습/파이썬

파이썬 AI : Early Stopping, Optuna, QuantileTransformer, SelectFromModel을 활용한 모델 개선과 특성 선택

EarlyStopping_california [설명] EarlyStopping은 머신러닝 모델의 학습을 조기에 중단하는 기법 중 하나입니다. 이는 모델이 더 이상 성능 향상이 기대되지 않을 때 학습을 중지하여 시간과 리소스를 절약할 수 있습니다. EarlyStopping을 활용하면 모델이 과적합(overfitting)되는 것을 방지하고 일반화 성능을 향상시킬 수 있습니다. [코드] import numpy as np from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score from sklearn.datasets import fetch_california_housing import time from xgb..

🧑‍💻복습/파이썬

파이썬 AI GridSearchCV, Bagging, Voting에 대한 설명과 코드

1. GridSearchCV [설명] GridSearchCV는 사용자가 지정한 매개변수 그리드를 기반으로 모든 가능한 조합의 하이퍼파라미터를 탐색하여 최적의 조합을 찾는 과정을 자동으로 수행합니다. 매개변수 그리드 탐색, 교차 검증, 성능 평가 및 최적 모델 선택 등의 작업을 자동화하여 모델의 최적화된 성능을 얻을 수 있도록 도와줍니다. 이를 통해 사용자는 모델의 성능을 향상시키는 최적의 하이퍼파라미터 조합을 찾는 데 집중합니다. [코드] #그리드서치 import numpy as np from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split, KFold, StratifiedKFold from skl..

🧑‍💻복습/파이썬

파이썬 AI 프로젝트 적용 XOR 문제 해결과 주요 머신러닝 알고리즘 소개: SVM, Linear 모델, Tree 모델, Ensemble 모델, KFold, Feature Importances

1. XOR 문제의 해결 import numpy as np from sklearn.linear_model import Perceptron from sklearn.svm import SVC, SVR, LinearSVC, LinearSVR from sklearn.metrics import accuracy_score from keras.models import Sequential from keras.layers import Dense #1. 데이터 # MLP모델 구성하여 ACC=1.0 만들기 x_data = [[0,0], [0,1], [1,0], [1,1]] y_data = [0, 1, 1, 0] #2. 모델 model = Sequential() model.add(Dense(32, input_dim=2)) m..

우동한그릇
'🧑‍💻복습/파이썬' 카테고리의 글 목록