전체 글
-
[Concept] EDA, Pandas, Types of Data, MarkdownAI부트캠프 2020. 12. 28. 22:47
[section1-sprint1] EDA EDA : Exploratory Data Analysis (탐색적 데이터 분석) EDA가 왜 필요한가? - Useful to examine relationship among variables, identify problems(e.x. data entry error) - 사실 실험실에서 데이터를 다루면서 한번도 데이터 자체의 구조나 경향성을 먼저 파악한 다음 데이터를 분석한 적이 없었다. EDA에 대해 배우면서 colab을 이용하여 pandas library로 데이터 구조에 대해 파악하게 되었는데, 만약 이 과정이 있었다면 이전에 데이터를 다룰 때 데이터의 특성에 대해 잘못 파악하여 다시 코드를 작성해야 했던 수고로움을 덜 수 있었을 것이다. EDA는 '초기분석' ..
-
[Method] Pandas Excel 파일 불러오기, 데이터 확인 및 전처리AI부트캠프 2020. 12. 28. 18:43
[section1-sprint1] 1. Excel 파일 불러오기 (url 사용) excel 파일을 열어본 적도 없어서 처음부터 애를 먹었다. Assignment는 excel 파일 형식의 dataset을 불러와서 sheet를 확인하는 것으로 시작되었다. 파일을 열어보니 sheet 이름을 알 수 있긴 했지만, pandas 자체에서 sheet 이름을 불러오는 방법은 없을까? import pandas as pd fileUrl = "엑셀 파일 url" sheet1 = pd.read_excel(fileUrl, sheet_name='sheet_name1') sheet2 = pd.read_excel(fileUrl, sheet_name='sheet_name2') 처음에는 위처럼 파일을 직접 열어 sheet이름을 가져와 ..