반응형
데이터 프레임을 다루다보면,
특정 문자열이 데이터 안에 포함되어 있는지 알아봐야 할 때가 있다.
ex) 주소 데이터에서 아파트에 거주하는 사람을 알고 싶을때
address컬럼에서 '.Apt'만 뽑아내고 싶다면,
(주소의 양식이 .Apt가 아파트라고 해보자)
1. 우선적으로 address 컬럼을 lower()나 upper()를 통해 대/소문자 통일을 한 후,
df['Address_upper'] = df['Address'].apply(lambda x: x.upper())
2. .APT 가 포함된 행을 추출하면된다.
df['Address_upper'].str.contains('.APT')
반응형
'Skills > Python' 카테고리의 다른 글
[Python] 빠른 행/열 추출 take() 메소드 (0) | 2021.11.04 |
---|---|
[Python] 데이터 재구조화 (0) | 2021.11.04 |
[Python] 자료구조 순환하는 for문 (zip, enumerate) (0) | 2021.11.04 |
[Python] 기초 패키지 불러오기 (0) | 2021.11.03 |
[Python] json파일을 파이썬에서 불러오기 (0) | 2021.11.03 |