반응형
파이썬 데이터 분석 시리즈 9편: 알아두면 유용한 Pandas 기능 - Part 3
이번 포스트에서는 Pandas의 데이터 정렬, 조건 필터링, 그리고 유용한 함수 적용 방법에 대해 살펴봅니다.
데이터 정렬
Pandas의 sort_values 메서드를 사용하여 데이터를 원하는 방식으로 정렬할 수 있습니다.
import pandas as pd
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
'Age': [28, 24, 35, 32],
'City': ['New York', 'Paris', 'Berlin', 'London']}
df = pd.DataFrame(data)
sorted_df = df.sort_values(by=['Age'])
print(sorted_df)
Output:
Name Age City
1 Anna 24 Paris
0 John 28 New York
3 Linda 32 London
2 Peter 35 Berlin
조건 필터링
Pandas 데이터프레임은 조건에 따라 행을 필터링하는 것을 쉽게 만들어 줍니다.
filtered_df = df[df['Age'] > 30]
print(filtered_df)
Output:
Name Age City
2 Peter 35 Berlin
3 Linda 32 London
유용한 함수 적용
Pandas는 apply 메서드를 사용하여 데이터프레임에 함수를 적용할 수 있습니다.
def aging(x):
return x + 1
df['Age'] = df['Age'].apply(aging)
print(df)
Output:
Name Age City
0 John 29 New York
1 Anna 25 Paris
2 Peter 36 Berlin
3 Linda 33 London
이처럼 Pandas의 데이터 정렬, 조건 필터링, 함수 적용 기능은 데이터를 처리하고 분석하는 데 아주 유용합니다. 다음 시간에는 데이터 시각화에 대해 알아보도록 하겠습니다.
반응형
LIST
'데이터 분석 도전기' 카테고리의 다른 글
파이썬 머신러닝 시리즈 1편: 머신러닝이란? (0) | 2023.06.19 |
---|---|
파이썬 데이터 분석 시리즈 12편: 실제 데이터로 데이터 분석하기 (0) | 2023.06.19 |
파이썬 데이터 분석 시리즈 11편: 데이터 클린징과 전처리 (0) | 2023.06.19 |
파이썬 데이터 분석 시리즈 10편: 데이터 시각화 라이브러리 Matplotlib과 Seaborn 소개 (0) | 2023.06.19 |
파이썬 데이터 분석 시리즈 8편: 알아두면 유용한 Pandas 기능 - Part 2 (0) | 2023.06.18 |
파이썬 데이터 분석 시리즈 7편: 알아두면 유용한 Pandas 기능 - Part 1 (0) | 2023.06.18 |
파이썬 데이터 분석 시리즈 6편: Pandas를 이용한 데이터 분석 소개 (0) | 2023.06.18 |
파이썬 데이터 분석 시리즈 5편: 알아두면 유용한 NumPy 기능 - Part 3 (0) | 2023.06.18 |