IT/Python

[파이썬 - 크롤링] 텍스트를 포함하는 태그 찾기

멋진 선배 2025. 4. 23. 06:38
반응형
반응형

텍스트를 포함하는 태그 하나 찾기

soup.find('태그이름',string=re.compile('텍스트'))

 

텍스트를 포함하는 태그 여러개 찾기

soup.find_all('태그이름',string=re.compile('텍스트'))

 

텍스트로 시작하는 태그 여러개 찾기

soup.find('태그이름',string=re.compile('^텍스트'))

 

텍스트로 끝나는 태그 여러개 찾기

soup.find('태그이름',string=re.compile('텍스트$'))

 

 

import re

#텍스트를 포함하는 태그 한개
soup.find('a', string=re.compile('그레이'))

#텍스트를 포함하는 태그 여러개 찾기
soup.find_all('a', string=re.compile('그레이'))

#텍스트로 시작하는 태그 여러개 찾기
soup.find_all('a', string=re.compile('^삼성전자'))

#텍스트로 끝나는 태그 여러개 찾기
soup.find_all('a', string=re.compile('KR$'))

# 요소 내부에 다른 태그가 있을경우, 문자열 매칭이 제대로 동작하기 않음
soup.find_all('h4', string=re.compile('원'))

# (심화) 요소 내부에 다른 태그가 있을 경우
result = []
tags = soup.select('.product-price')
for tag in tags:
	if '원' in tag.contents[0]:
    	result.append(tag)
 result

 

반응형

반응형