반응형

DataFrame 4

원래 변수는 그대로 유지하면서 mutate_at로 새 변수 만들기

원래 변수는 그대로 유지하면서 mutate_at로 새 변수 만들기 다음과 같은 간단한 예를 생각해 보십시오. library(dplyr) library(tibble) dataframe % mutate_at(vars(contains('oo')), .funs = funs(ntile(., 2))) # A tibble: 6 x 3 helloo ooooHH ahaaa 1 1 1 200 2 1 1 400 3 1 1 120 4 2 2 300 5 2 2 100 6 2 2 100 하지만 내게 필요한 건 이건 # A tibble: 8 x 5 helloo ooooHH ahaaa cat_helloo cat_ooooHH 1 1 1 200 1 1 2 2 1 400 1 1 3 3 1 120 1 1 4 4 2 300 2 2 5 5 2..

programing 2023.11.07

팬더 - 값 없음 필터링

팬더 - 값 없음 필터링 팬더를 이용해 데이터셋을 탐색하고 있습니다.데이터 프레임은 다음과 같습니다. 열에 값이 있는 행은 제외합니다.City. 그래서 해봤습니다. new_df = all_df[(all_df["City"] == "None") ] new_df 그런데 빈 데이터 프레임이 나왔습니다. 다른 값을 사용할 때마다 작동합니다.None. 이 데이터 프레임을 필터링하는 방법을 알고 계십니까?사용을 고려합니다.isnull()결측값을 찾아내다 all_df[all_df['City'].isnull()] 이 방법을 사용하여 다음 항목만 선택합니다.None도시 열에 대한 값: new_df = all_df['City'][all_df['City'] == "None"] 동일한 행을 가진 다른 모든 열을 보려면 이 작업..

programing 2023.10.03

데이터 프레임 팬더의 값 수를 기준으로 그룹화

데이터 프레임 팬더의 값 수를 기준으로 그룹화 저는 다음과 같은 데이터 프레임을 가지고 있습니다. df = pd.DataFrame([ (1, 1, 'term1'), (1, 2, 'term2'), (1, 1, 'term1'), (1, 1, 'term2'), (2, 2, 'term3'), (2, 3, 'term1'), (2, 2, 'term1') ], columns=['id', 'group', 'term']) 나는 그것을 그룹화 하고 싶습니다.id그리고.group그리고 이 id, group pair에 대한 각 항의 개수를 계산합니다. 그래서 결국 저는 다음과 같은 것을 얻게 될 것입니다. 저는 모든 줄을 순환하면서 제가 원하는 것을 이룰 수 있었습니다.df.iterrows()그리고 새로운 데이터 프레임을 만..

programing 2023.09.23

팬더 데이터 프레임에서 두 열의 값을 단일 열로 병합합니다.

팬더 데이터 프레임에서 두 열의 값을 단일 열로 병합합니다. 저는 T-SQL에서 Coalse와 유사하게 동작하는 방법을 찾고 있습니다.팬더 데이터 프레임에 드문드문 들어 있는 두 개의 열(A열과 B열)이 있습니다.다음 규칙을 사용하여 새 열을 만들고자 합니다. 열 A의 값이 null이 아니면 새 열 C에 해당 값을 사용합니다. 열 A의 값이 null이면 새 열 C에 열 B의 값을 사용합니다. 말씀드린 것처럼, 이는 MS SQL Server에서 Coales 함수를 통해 달성할 수 있습니다.나는 이것에 대한 좋은 피톤적인 방법을 찾지 못했는데, 그것이 존재합니까?combine_first 를 사용합니다. In [16]: df = pd.DataFrame(np.random.randint(0, 10, size=(1..

programing 2023.09.14
반응형