[Pandas] Useful Tips

2021. 1. 2. 19:52[TIPs]/Useful Tips

[Slicing index of a specific column data]

man_index = df[df['gender']=='man'].index.tolist()
# 'gender' column 안에 'man'이라는 특정 data 전체 index를 list로 반환

 


[loc + groupby + count 응용]

# ex1

man_survival = df.loc[man_index].groupby('survived').gender.count()

# man_index 중 survived=0 과 survived=1 별로 count를 반환
# 이 때 man_survival이 list(?) 형식으로 표현되는 것 같음
# man_survival[0]은 man 중 survived=0 총 갯수
# man_survival[1]은 man 중 survived=1 총 갯수

# ex2

gender = df.groupby('gender').gender.count()

# gender[0] = gender['man']
# gender[1] = gender['woman']
# 어떤 식으로 표기하든 같은 값을 반환함

 


[Outlier 제거하기]

# ex) height라는 column의 0.05% ~ 99.5% 사이의 data 만 담기
new_df = df[(df['height'] >= np.percentile(df['height'], 0.05)) & 
        (df['height'] <= np.percentile(df['height'], 99.5))]

 

728x90

'[TIPs] > Useful Tips' 카테고리의 다른 글

[Statistics] Useful Tips  (0) 2021.01.06