파이썬 25

6. Random Forests

● Random Forest → 여러 개의 트리를 사용하며, 각 구성 트리의 예측값을 평균하여 예측을 수행 from sklearn.ensemble import RandomForestRegressor # 랜덤 포레스트 회귀 모델 객체 rf_model 생성 rf_model = RandomForestRegressor() # 생성한 랜덤 포레스트 모델을 훈련 데이터 train_X와 그에 해당하는 타겟 값 train_y에 학습시키기 rf_model.fit(train_X, train_y) # 학습된 랜덤 포레스트 모델을 사용하여 검증 데이터 val_X에 대한 예측값 저장 rf_var_predictions = rf_model.predict(val_X) # 검증 데이터에 대한 랜덤 포레스트 모델의 예측값인 rf_var..

5. Underfitting and Overfitting

● Overfitting (오버피팅) → 모델이 훈련 데이터에 너무 과하게 적합화되어 훈련 데이터의 잡음이나 노이즈까지 학습하여 실제 데이터에서의 성능이 저하되는 현상 ● Underfitting (언더피팅) → 모델이 데이터의 다양성과 복잡성을 충분히 반영하지 못하고, 너무 간단한 모델을 사용하여 데이터의 패턴을 제대로 파악하지 못하는 상태 ☞ 언더피팅과 오버피팅 사이에서 최적의 균형점을 찾아야 함 ● 결정 트리 크기 비교하기 → 모델이 데이터의 다양성과 복잡성을 충분히 반영하지 못하고, 너무 간단한 모델을 사용하여 데이터의 패턴을 제대로 파악하지 못하는 상태 → 어떤 크기의 결정 트리가 가장 좋은 성능을 보이는지 확인 후, 최적의 모델 크기를 선택 → 'scores' dictionary : candid..

3. Your First Machine Learning Model

● 2단계 코드 복습 import pandas as pd iowa_file_path = '../input/home-data-for-ml-course/train.csv' home_data = pd.read_csv(iowa_file_path) ● 판매 가격에 해당하는 변수를 y라는 새로운 변수에 저장하기 → SalePrice는 우리가 예측하고자 하는 값으로서 출력 데이터에 해당됨 y = home_data.SalePrice ● 모델이 학습하기 위해 사용하는 입력데이터 입력 → 'LotArea', 'YearBuilt', '1stFlrSF', '2ndFlrSF', 'FullBath', 'BedroomAbvGr', 'TotRmsAbvGrd' 와 같은 주택 특징들이 있음 → 읽어온 데이터에서 우리가 예측에 사용하고자..

2. Basic Data Exploration

● 데이터 처리와 분석을 위한 라이브러리로 Pandas를 사용 → 대체로 pandas는 코드에서 pd로 줄여서 사용 import pandas as pd ● Kaggle notebook 사용법 https://www.youtube.com/watch?v=4C2qMnaIKL4 ● csv 파일 불러오기 → pandas library의 read_csv() 함수 이용 import pandas as pd iowa_file_path = '../input/home-data-for-ml-course/train.csv' # 파일 경로 home_data = pd.read_csv(iowa_file_path) # 파일 불러오기 ● describe() → 통계량을 요약해주는 메서드 home_data.describe()

[SWEA] 쉬운 거스름돈 (1970) Python

https://swexpertacademy.com/main/code/problem/problemDetail.do?problemLevel=2&contestProbId=AV5PsIl6AXIDFAUq&categoryId=AV5PsIl6AXIDFAUq&categoryType=CODE&problemTitle=&orderBy=INQUERY_COUNT&selectCodeLang=PYTHON&select-1=2&pageSize=10&pageIndex=2 SW Expert Academy SW 프로그래밍 역량 강화에 도움이 되는 다양한 학습 컨텐츠를 확인하세요! swexpertacademy.com t = int(input()) money = [50000, 10000, 5000, 1000, 500, 100, 50, 10] ..

SW Expert Academy 2023.05.24

BAEKJOON_1455 "뒤집기 II" PYTHON

[백준] 1455번 Python 파이썬 https://www.acmicpc.net/problem/1455 1455번: 뒤집기 II 세준이는 동전 뒤집기를 하려고 한다. 세준이는 동전을 N×M개 가지고 있다. 동전은 세로로 N개, 가로로 M개 크기의 직사각형에 차곡차곡 놓여져 있다. 동전의 앞면을 0이라고 하고 뒷면을 1이라고 www.acmicpc.net Greedy Algorithm을 이용하여 푸는 문제이다. 입력받은 행렬의 앞쪽부터 변경할 경우, 뒤쪽을 바꾸면서 앞쪽이 또 바뀔 수 있기 때문에 뒤쪽의 수부터 바꾸어 준다. n, m = map(int, input().split()) lst = [] result = 0 for _ in range(n): a = list(map(int, input().rstr..

[SWEA] 새로운 불면증 치료법 (1288) Python

https://swexpertacademy.com/main/code/problem/problemDetail.do?problemLevel=2&contestProbId=AV18_yw6I9MCFAZN&categoryId=AV18_yw6I9MCFAZN&categoryType=CODE&problemTitle=&orderBy=INQUERY_COUNT&selectCodeLang=PYTHON&select-1=2&pageSize=10&pageIndex=2 SW Expert Academy SW 프로그래밍 역량 강화에 도움이 되는 다양한 학습 컨텐츠를 확인하세요! swexpertacademy.com t = int(input()) for i in range(1, t+1): n = int(input()) number = [0,..

SW Expert Academy 2023.05.18

[SWEA] 두 개의 숫자열 (1959) Python

https://swexpertacademy.com/main/code/problem/problemDetail.do?problemLevel=2&contestProbId=AV5PpoFaAS4DFAUq&categoryId=AV5PpoFaAS4DFAUq&categoryType=CODE&problemTitle=&orderBy=INQUERY_COUNT&selectCodeLang=PYTHON&select-1=2&pageSize=10&pageIndex=2 SW Expert Academy SW 프로그래밍 역량 강화에 도움이 되는 다양한 학습 컨텐츠를 확인하세요! swexpertacademy.com j의 구간을 잘 못 설정하여 계속 인덱스 오류가 떴는데 마침내 해결하였다. t = int(input()) for i in ra..

SW Expert Academy 2023.05.17

[SWEA] 지그재그 숫자 (1986) Python

https://swexpertacademy.com/main/code/problem/problemDetail.do?problemLevel=2&contestProbId=AV5PxmBqAe8DFAUq&categoryId=AV5PxmBqAe8DFAUq&categoryType=CODE&problemTitle=&orderBy=INQUERY_COUNT&selectCodeLang=PYTHON&select-1=2&pageSize=10&pageIndex=2 SW Expert Academy SW 프로그래밍 역량 강화에 도움이 되는 다양한 학습 컨텐츠를 확인하세요! swexpertacademy.com t = int(input()) for i in range(1, t+1): n = int(input()) sum = 0 for ..

SW Expert Academy 2023.05.16