반응형
파이썬 데이터 분석 시리즈 7편: 알아두면 유용한 Pandas 기능 - Part 1
이번 포스트에서는 Pandas 라이브러리에서 DataFrame의 생성, 선택, 필터링 방법에 대해 자세히 알아보겠습니다.
DataFrame 생성하기
먼저, pandas를 import하고, 간단한 DataFrame을 만들어봅시다.
import pandas as pd
data = {
'name': ['John', 'Anna', 'Peter', 'Linda'],
'age': [28, 24, 35, 32],
'city': ['New York', 'Paris', 'Berlin', 'London']
}
df = pd.DataFrame(data)
print(df)
Output:
name age city
0 John 28 New York
1 Anna 24 Paris
2 Peter 35 Berlin
3 Linda 32 London
DataFrame에서 데이터 선택하기
다음으로, 특정 열을 선택하는 방법에 대해 알아봅니다. 'name' 열을 선택해 봅시다.
names = df['name']
print(names)
Output:
0 John
1 Anna
2 Peter
3 Linda
Name: name, dtype: object
DataFrame 필터링하기
마지막으로, 특정 조건을 만족하는 행을 필터링하는 방법에 대해 알아봅니다. 'age'가 30 이상인 사람들만 선택해봅시다.
older_than_30 = df[df['age'] > 30]
print(older_than_30)
Output:
name age city
2 Peter 35 Berlin
3 Linda 32 London
이처럼, Pandas를 활용하면 다양한 방법으로 데이터를 생성, 선택, 필터링 할 수 있습니다. 다음 포스트에서는 더 다양한 Pandas 기능에 대해 알아보 겠습니다.
반응형
LIST
'데이터 분석 도전기' 카테고리의 다른 글
파이썬 데이터 분석 시리즈 11편: 데이터 클린징과 전처리 (0) | 2023.06.19 |
---|---|
파이썬 데이터 분석 시리즈 10편: 데이터 시각화 라이브러리 Matplotlib과 Seaborn 소개 (0) | 2023.06.19 |
파이썬 데이터 분석 시리즈 9편: 알아두면 유용한 Pandas 기능 - Part 3 (0) | 2023.06.19 |
파이썬 데이터 분석 시리즈 8편: 알아두면 유용한 Pandas 기능 - Part 2 (0) | 2023.06.18 |
파이썬 데이터 분석 시리즈 6편: Pandas를 이용한 데이터 분석 소개 (0) | 2023.06.18 |
파이썬 데이터 분석 시리즈 5편: 알아두면 유용한 NumPy 기능 - Part 3 (0) | 2023.06.18 |
파이썬 데이터 분석 시리즈 4편: 알아두면 유용한 NumPy 기능 - Part 2 (0) | 2023.06.18 |
파이썬 데이터 분석 시리즈 3편: 알아두면 유용한 NumPy 기능 - Part 1 (0) | 2023.06.18 |