본문으로 바로가기
반응형

데이터 프레임을 다루다보면,

 

특정 문자열이 데이터 안에 포함되어 있는지 알아봐야 할 때가 있다.

 

ex) 주소 데이터에서 아파트에 거주하는 사람을 알고 싶을때

 

address컬럼에서 '.Apt'만 뽑아내고 싶다면,

(주소의 양식이 .Apt가 아파트라고 해보자)

 

 

1. 우선적으로 address 컬럼을 lower()나 upper()를 통해 대/소문자 통일을 한 후,

df['Address_upper'] = df['Address'].apply(lambda x: x.upper())

2. .APT 가 포함된 행을 추출하면된다.

df['Address_upper'].str.contains('.APT')
반응형