Applied Predictive Modeling(2) - Data Wrangling

2021. 3. 7. 15:38[AI]/Machine Learning

Learned Stuff

Key Points

  • Data Wrangling

New Stuff

[Data Wrangling]

  • Data를 사용하기 쉽게 변형하거나 알아보기 쉽게 Mapping하는 방법

 

Steps

  1. Gather
    • data를 얻는 과정
    • 필요에 따라 여러 data를 수집할 수도 있음

 

  1. Assess
    • 얻은 data가 clean 한지 안한지 확인하는 단계

 

  1. Clean
    • define / code / test 로 나뉨
    • 2 번 과정에서 발견한 문제점을 define 하고 code 로 clean을 한 뒤, 잘 clean 되었는지 test 하는 단계

 

  1. Reassess & Iterate
    • 추가적으로 clean 해야될 부분이 있다면 반복할 것

 

  1. Store (optional)
    • clean 한 data를 다시 사용하기 위해 저장하는 단계
728x90