본문 바로가기
ML/ML-함수관련

명목변수 내 인자 확인, 수, 갯수 - df.unique(), nunique(), value_counts()

by lucian 2022. 1. 4.

과일이란 컬럼안에 사과, 배, 귤 등등이 있다.

이 때 이 과일컬럼 내에 어떤 요소들이 있는지 확인하는 방법

df['과일'].unique()

결과로 사과, 배, 귤이 나온다. 범주형 변수에서 어떤 인자가 있는지 중복되지 않고 보여준다.

 

 

이제 고유한 인자들이 몇개인지를 확인할 때,

df['과일'].nunique()

결과로 3 이 나온다. 사과, 배, 귤로 총 3개인 것을 알 수 있다.

 

 

 

마지막으로 이 고유값들이 df안에 얼마나 들어있는지 확인할 때,

df['과일'].value_counts(ascending=True)
# ascending은 결과를 오름차순으로 보여준다.

이러면 사과는 몇개가 있고 배는 몇개, 귤은 몇개로 나타난다.

댓글