728x90
반응형
역시 ML의 시작은 타이타닉 - (2) Preprocess 후 Tensorflow DataSet으로 전환
분명 전산학부 졸업 했는데 코딩 개못하는 조준호/AI, ML, DL 2024. 7. 20. 15:55역시 ML의 시작은 타이타닉 - (2) Preprocess 후 Tensorflow DataSet으로 전환

다음으로 데이터들을 불러와야 한다.  pd.read_csv() 위 함수를 사용하면 해당 경로에 있는 CSV 파일을 읽을 수 있다. CSV 파일은 "Comma-Separated Values"의 약자로 말 그대로 쉼표로 구분된 값들을 가진 파일 형식이다.  이런 식으로 헤더와 데이터 행으로 구성되어 있다.  원본 데이터는 예쁘지 않으니까 preprocess를 해야 한다. (데이터 정리 및 형식 통일, 노이즈 제거, 스케일 일치시키기 등을 한다.) df = df.copy() 위 코드를 통해 원래 데이터를 deep copy로 복사해 온다. def normalize_name(x): return "-".join([v.strip(",().\"'") for v in x.split(" ")])def ticket_n..

역시 ML의 시작은 타이타닉 - (1) Dependencies 가져오기
분명 전산학부 졸업 했는데 코딩 개못하는 조준호/AI, ML, DL 2024. 7. 20. 00:16역시 ML의 시작은 타이타닉 - (1) Dependencies 가져오기

프로그래밍 언어를 처음 배울 때 "Hello, World!"를 출력하듯, AI/ML을 처음 배울 때는 타이타닉의 생존자를 예측해야 한다. 언젠가 해야지 해야지 생각만 하다가 그냥 확 질러버렸다. 역시 Kaggle이 짱짱이다. 바로 이것을 해볼 것이다.https://www.kaggle.com/competitions/titanic Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 근데 Kaggle을 한 번도 사용해 본 적이 없어서 아래 튜토리얼을 봤다. 여기서 기본 Kaggle 사용법을 알 수 있다. (코딩하는 법은 안 나온다.)https://www.kaggle.com/code/alexisbcook/titanic-tutorial Titanic..

728x90
반응형
image