본문 바로가기
데이터 분석 도전기

파이썬 데이터 분석 시리즈 9편: 알아두면 유용한 Pandas 기능 - Part 3

by 프로 탈출러 2023. 6. 19.
반응형
파이썬 데이터 분석 시리즈 9편: 알아두면 유용한 Pandas 기능 - Part 3

파이썬 데이터 분석 시리즈 9편: 알아두면 유용한 Pandas 기능 - Part 3

이번 포스트에서는 Pandas의 데이터 정렬, 조건 필터링, 그리고 유용한 함수 적용 방법에 대해 살펴봅니다.

데이터 정렬

Pandas의 sort_values 메서드를 사용하여 데이터를 원하는 방식으로 정렬할 수 있습니다.

        
import pandas as pd

data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 24, 35, 32],
        'City': ['New York', 'Paris', 'Berlin', 'London']}
df = pd.DataFrame(data)

sorted_df = df.sort_values(by=['Age'])
print(sorted_df)
        
    
        
Output: 
   Name  Age       City
1  Anna   24      Paris
0  John   28   New York
3  Linda  32     London
2  Peter  35     Berlin
        
    

조건 필터링

Pandas 데이터프레임은 조건에 따라 행을 필터링하는 것을 쉽게 만들어 줍니다.

        
filtered_df = df[df['Age'] > 30]
print(filtered_df)
        
    
        
Output: 
    Name  Age    City
2  Peter   35  Berlin
3  Linda   32  London
        
    

유용한 함수 적용

Pandas는 apply 메서드를 사용하여 데이터프레임에 함수를 적용할 수 있습니다.

        
def aging(x):
    return x + 1

df['Age'] = df['Age'].apply(aging)
print(df)
        
    
        
Output: 
    Name  Age      City
0   John   29  New York
1   Anna   25     Paris
2  Peter   36    Berlin
3  Linda   33    London
        
    

이처럼 Pandas의 데이터 정렬, 조건 필터링, 함수 적용 기능은 데이터를 처리하고 분석하는 데 아주 유용합니다. 다음 시간에는 데이터 시각화에 대해 알아보도록 하겠습니다.

반응형
LIST