pandas(2)
-
[Kaggle] Titanic (데이터 전처리, Machine Learning)
Kaggle의 Competitions에서는 여러가지 주제의 데이터들을 가지고, 사람들과 데이터 분석, 모델 학습을 통해 경쟁을 할 수 있다.나는 오늘 처음으로 Kaggle을 사용해보아서, 비교적 쉬운 난이도의 데이터를 한 번 다뤄보았다. https://kaggle.com/competitions/titanic Titanic | NoviceKaggle profile for Titanicwww.kaggle.com영화 타이타닉을 주제로 만든 데이터이고, gender_submission.csv, test.csv, train.csv. 이렇게 총 3개의 파일이 들어있다. gender_submission.csv : 예시 제출 파일 test.csv : 예측 데이터train.csv : 모델 학습용 데이터과정을 생각해보자면..
-
Pandas 실습 - NASA 데이터 활용
Pandas로 실제 데이터들을 가공해보면서 익혀보았다.NASA에서 제공하는 아폴로 임무별 데이터들을 토대로 만들어 보았다. 2024년 부터 달탐사는 현재까지 진행 중이고, 앞으로 진행 예정인 작전에 도움을 줄 수 있도록 수집할 암석들의 종류와 갯수를 구해보는 작업을 진행하였다.NASA에서 제공하는 데이터 가져오기 https://curator.jsc.nasa.gov/lunar/samplecatalog/index.cfm Apollo Samples and Photo catalog curator.jsc.nasa.gov해당 사이트에서 필요한 컬럼을 체크하여, 데이터들을 csv 파일로 가져올 수 있다. 데이터 프레임 생성 및 정보 확인# 데이터 파일을 읽어오기rock_samples = pd.read_csv('./d..