In [1]:
from IPython.core.display import display, HTML
display(HTML("<style> .container{width:90% !important;}</style>"))
In [2]:
import pandas as pd
import seaborn as sns
In [3]:
# 예시 데이터 불러오기
df = sns.load_dataset('iris')
print(df.shape)
df.head()
Out[3]:
데이터프레임에서 특정 컬럼 정보만 불러오기¶
In [4]:
columns = ['sepal_length', 'sepal_width', 'species']
df[columns].head()
Out[4]:
In [5]:
# 이 방식에서는 한글이나 특수문자가 들어간 컬럼명을 쓸 수 없음
df.sepal_width.head()
Out[5]:
In [6]:
df['sepal_width'].head()
Out[6]:
정규 표현식으로 특정컬럼 불러오기¶
df.filter( regex = 'regex' )
- '\.' : 점( . )을 포함하고 있는 문자열
In [7]:
df.filter(regex='\,').head(3)
Out[7]:
- 'length$' : 특정문자열(length)로 끝나는 문자열
In [8]:
df.filter(regex='length$').head(3)
Out[8]:
- '_' : _ 를 포함하고 있는 문자열
In [9]:
df.filter(regex='_').head(3)
Out[9]:
- '^sepal' : 특정문자열(Sepal)로 시작하는 문자열
In [10]:
df.filter(regex='^sepal').head(3)
Out[10]:
- *'^(?!species$).' : 특정문자열('species')이 없는 문자열
In [11]:
df.filter(regex='^(?!species).*').head(3)
Out[11]:
- '^x[1-5]$' : 특정문자(x)로 시작하고 특정문자(1, 2, 3, 4, 5)로 끝나는 문자열
In [12]:
df.filter(regex='^x[1-5]$').head(3)
Out[12]:
df.loc[ ]와 df.iloc[ ] 비교¶
In [13]:
df.loc[2:5, 'sepal_width':'petal_width']
Out[13]:
loc와는 다르게 iloc로 검색을 했을 때 a:b 면 b-1행까지 검색을 함
iloc는 인덱스번호만 입력이 가능함
In [14]:
df.iloc[2:5:, 1:3]
Out[14]:
loc 를 통해 logic 조건으로 행을 지정하고, 컬럼명을 선택할 수 있음
In [15]:
df.loc[df['sepal_length']>3 , ['sepal_length','sepal_width']].head()
Out[15]:
'Python > Pandas Cheat Sheet' 카테고리의 다른 글
5. Handling Missing Data(결측치 다루기) (0) | 2019.10.16 |
---|---|
4. Summarize Data(자료 요약하기) (0) | 2019.10.16 |
2. Subset Observations(Rows) (행 데이터 다루기) (0) | 2019.10.09 |
1. Creating DataFrame(데이터프레임 만들기) (0) | 2019.10.09 |