본문 바로가기

# Language/Python

[Python] 파이썬 Pandas DataFrame: str.contains 문자열 포함 조건

str.contains 문자열 포함 조건

문자열 필터

Dataframe을 사용하다가 특정 문자열을 포함하는 조건으로 데이터를 필터링 해야 할 때가 있다.
그럴때는 str.contains 함수를 사용하면 간단하게 진행할 수 있다.
 
조건절을 mask로 정의하면, 다음과 같이 사용할 수 있다.
 
mask =  (consumer_pd['contents'].str.contains('개인정보')) &(consumer_pd['label']=='N')

filtered_pd = consumer_pd[mask2]