[Pandas] Useful Tips
2021. 1. 2. 19:52ㆍ[TIPs]/Useful Tips
[Slicing index of a specific column data]
man_index = df[df['gender']=='man'].index.tolist()
# 'gender' column 안에 'man'이라는 특정 data 전체 index를 list로 반환
[loc + groupby + count 응용]
# ex1
man_survival = df.loc[man_index].groupby('survived').gender.count()
# man_index 중 survived=0 과 survived=1 별로 count를 반환
# 이 때 man_survival이 list(?) 형식으로 표현되는 것 같음
# man_survival[0]은 man 중 survived=0 총 갯수
# man_survival[1]은 man 중 survived=1 총 갯수
# ex2
gender = df.groupby('gender').gender.count()
# gender[0] = gender['man']
# gender[1] = gender['woman']
# 어떤 식으로 표기하든 같은 값을 반환함
[Outlier 제거하기]
# ex) height라는 column의 0.05% ~ 99.5% 사이의 data 만 담기
new_df = df[(df['height'] >= np.percentile(df['height'], 0.05)) &
(df['height'] <= np.percentile(df['height'], 99.5))]
728x90
'[TIPs] > Useful Tips' 카테고리의 다른 글
[Statistics] Useful Tips (0) | 2021.01.06 |
---|