programing

데이터 프레임의 각 열에 있는 비-NaN 항목 수

muds 2023. 7. 30. 18:07
반응형

데이터 프레임의 각 열에 있는 비-NaN 항목 수

저는 방대한 데이터 프레임을 보유하고 있는데, 데이터 프레임에서 NaN이 아닌 항목의 수를 얻을 수 있는 짧은 방법(라이너 한 개 또는 두 개)이 있는지 궁금합니다.1000개에 가까운 열이 있기 때문에 한 번에 하나씩 이 열을 수행하고 싶지 않습니다.

df1 = pd.DataFrame([(1,2,None),(None,4,None),(5,None,7),(5,None,None)], 
                    columns=['a','b','d'], index = ['A', 'B','C','D'])

    a   b   d
A   1   2 NaN
B NaN   4 NaN
C   5 NaN   7
D   5 NaN NaN

출력:

a: 3
b: 2
d: 1

메소드는 비-값의 수를 반환합니다.NaN각 열의 값:

>>> df1.count()
a    3
b    2
d    1
dtype: int64

유사하게,count(axis=1)의 수를 반환합니다.NaN각 행의 값을 입력합니다.

NAN이 아닌 총 카운트 값을 합하려면 다음을 수행할 수 있습니다.

np.sum(df.count())

빈 문자열을 처리하는 경우에는 해당 문자열을 NA로 계산할 수도 있습니다.

df.replace('', np.nan).count()

또는 빈 문자열도 제거하려는 경우:

df.replace(r'^\s*$', np.nan, regex=True).count()

/ 및 : 메서드를 사용할 수 있습니다.

df.notna().sum()

출력:

a    3
b    2
d    1
dtype: int64

언급URL : https://stackoverflow.com/questions/29971075/count-number-of-non-nan-entries-in-every-column-of-dataframe

반응형