[pandas] 데이터 추출

2023. 11. 22. 18:05파이썬

728x90

다음과 같이 dataframe이 df라는 변수에 저장되어있을 때

import pandas as pd

a = {'A' : [1, 2, 3, 4, 5], 'B' : [10, 20, 30, 40, 50], 'C' : [100, 200, 300, 400, 500]}
df = pd.DataFrame(a, index = ['가', '나', '다', '라', '마'])
df

 

 

 원하는 열 1개 추출하기

df['A]

 

-> Series 형태로 열이 추출됨.

 

df[['A']]

 

-> 대괄호 2개로 묶을시 DataFrame 형태로 추출됨.

 

 

원하는 열 여러개 추출하기

df[['A','C']]

-> 원하는 열 이름들을 순서대로 대괄호 2개로 감싸줘야 한다.

대괄호 1개로 묶을시 오류가 발생하여 출력이 안된다.

 

 

원하는 행 1개 추출하기

df.loc['가']

 

-> loc 함수를 사용하여 가져와야 한다.

 

 

원하는 행 여러개 추출하기 

df.loc[['가','다','마']]

-> 열 추출과 마찬가지로 대괄호 2개로 묶어야 오류가 안난다.

 

열과 행  모두 추출

 

df.loc[['가','다','마'],['A','C']]

-> loc 함수를 쓰고, 첫번째 인자는 행을, 2번째 인자는 열을 지정해주면 된다.

728x90

'파이썬' 카테고리의 다른 글

리스트에서 특정 원소의 인덱스를 반환하는 함수  (0) 2024.02.22
format  (0) 2024.02.21
pd.Series()  (0) 2023.11.22
(파이썬) Modules and Packages  (0) 2022.11.30
(파이썬) Dictionaries  (0) 2022.11.30