반응형
데이터 프레임의 각 열에 있는 비-NaN 항목 수
저는 방대한 데이터 프레임을 보유하고 있는데, 데이터 프레임에서 NaN이 아닌 항목의 수를 얻을 수 있는 짧은 방법(라이너 한 개 또는 두 개)이 있는지 궁금합니다.1000개에 가까운 열이 있기 때문에 한 번에 하나씩 이 열을 수행하고 싶지 않습니다.
df1 = pd.DataFrame([(1,2,None),(None,4,None),(5,None,7),(5,None,None)],
columns=['a','b','d'], index = ['A', 'B','C','D'])
a b d
A 1 2 NaN
B NaN 4 NaN
C 5 NaN 7
D 5 NaN NaN
출력:
a: 3
b: 2
d: 1
메소드는 비-값의 수를 반환합니다.NaN
각 열의 값:
>>> df1.count()
a 3
b 2
d 1
dtype: int64
유사하게,count(axis=1)
의 수를 반환합니다.NaN
각 행의 값을 입력합니다.
NAN이 아닌 총 카운트 값을 합하려면 다음을 수행할 수 있습니다.
np.sum(df.count())
빈 문자열을 처리하는 경우에는 해당 문자열을 NA로 계산할 수도 있습니다.
df.replace('', np.nan).count()
또는 빈 문자열도 제거하려는 경우:
df.replace(r'^\s*$', np.nan, regex=True).count()
/ 및 : 메서드를 사용할 수 있습니다.
df.notna().sum()
출력:
a 3
b 2
d 1
dtype: int64
언급URL : https://stackoverflow.com/questions/29971075/count-number-of-non-nan-entries-in-every-column-of-dataframe
반응형
'programing' 카테고리의 다른 글
조각을 사용하여 백스택 지우기 (0) | 2023.07.30 |
---|---|
passport.js RESTful 인증 (0) | 2023.07.30 |
런타임에 HttpModules를 프로그래밍 방식으로 등록 (0) | 2023.07.30 |
잘못된 조합의 데이터 정렬 및 최대 절전 모드 (0) | 2023.07.30 |
고급 MySql 쿼리: 다른 테이블의 정보로 테이블 업데이트 (0) | 2023.07.30 |