[pandas] 데이터 추출
2023. 11. 22. 18:05ㆍ파이썬
728x90
다음과 같이 dataframe이 df라는 변수에 저장되어있을 때
import pandas as pd
a = {'A' : [1, 2, 3, 4, 5], 'B' : [10, 20, 30, 40, 50], 'C' : [100, 200, 300, 400, 500]}
df = pd.DataFrame(a, index = ['가', '나', '다', '라', '마'])
df

원하는 열 1개 추출하기
df['A]

-> Series 형태로 열이 추출됨.
df[['A']]

-> 대괄호 2개로 묶을시 DataFrame 형태로 추출됨.
원하는 열 여러개 추출하기
df[['A','C']]

-> 원하는 열 이름들을 순서대로 대괄호 2개로 감싸줘야 한다.
대괄호 1개로 묶을시 오류가 발생하여 출력이 안된다.
원하는 행 1개 추출하기
df.loc['가']

-> loc 함수를 사용하여 가져와야 한다.
원하는 행 여러개 추출하기
df.loc[['가','다','마']]

-> 열 추출과 마찬가지로 대괄호 2개로 묶어야 오류가 안난다.
열과 행 모두 추출
df.loc[['가','다','마'],['A','C']]

-> loc 함수를 쓰고, 첫번째 인자는 행을, 2번째 인자는 열을 지정해주면 된다.
728x90
'파이썬' 카테고리의 다른 글
| 리스트에서 특정 원소의 인덱스를 반환하는 함수 (0) | 2024.02.22 |
|---|---|
| format (0) | 2024.02.21 |
| pd.Series() (0) | 2023.11.22 |
| (파이썬) Modules and Packages (0) | 2022.11.30 |
| (파이썬) Dictionaries (0) | 2022.11.30 |