Data Preprocess & EDA(1) - EDA(Exploratory Data Analysis)

2021. 1. 30. 10:26[AI]/Data Science Fundamentals

<Learned Stuff>

  • EDA
    • 수집한 데이터를 다양한 각도로 관찰하고 이해하는 과정 (시각화)
      • 시각화 같은 도구를 통해서 패턴 발견
      • 데이터의 특이성을 확인
      • 시각화를 통한 가설 검정

<New Stuff>

[df.head 와 print(df.head()) 의 차이]

  • df.head : <bound method NDFrame.head of ... 도 같이 출력됨

  • print(df.head()) : 위에 문구 출력(X)

 

[그래프 출력 시 <matplotlib.~~> 안 뜨게 하는 방법]

  • plot 함수 마지막에 ' ; ' 추가하면 됨 (ex. df.plot();)

 

[Export to csv]

df.to_csv('위치\파일이름.csv', index = False)
# (index = False) 써줘야 row index 추가로 생성 안됨
728x90