반응형
반응형
텍스트를 포함하는 태그 하나 찾기
soup.find('태그이름',string=re.compile('텍스트'))
텍스트를 포함하는 태그 여러개 찾기
soup.find_all('태그이름',string=re.compile('텍스트'))
텍스트로 시작하는 태그 여러개 찾기
soup.find('태그이름',string=re.compile('^텍스트'))
텍스트로 끝나는 태그 여러개 찾기
soup.find('태그이름',string=re.compile('텍스트$'))
import re
#텍스트를 포함하는 태그 한개
soup.find('a', string=re.compile('그레이'))
#텍스트를 포함하는 태그 여러개 찾기
soup.find_all('a', string=re.compile('그레이'))
#텍스트로 시작하는 태그 여러개 찾기
soup.find_all('a', string=re.compile('^삼성전자'))
#텍스트로 끝나는 태그 여러개 찾기
soup.find_all('a', string=re.compile('KR$'))
# 요소 내부에 다른 태그가 있을경우, 문자열 매칭이 제대로 동작하기 않음
soup.find_all('h4', string=re.compile('원'))
# (심화) 요소 내부에 다른 태그가 있을 경우
result = []
tags = soup.select('.product-price')
for tag in tags:
if '원' in tag.contents[0]:
result.append(tag)
result
반응형
반응형
'IT > Python' 카테고리의 다른 글
[파이썬-크롤링] 네이버 증권 뉴스 크롤링 하기 (0) | 2025.04.24 |
---|---|
[파이썬 오류] IndentationError: unindent does not match any outer indentation level (0) | 2025.04.23 |
[파이썬 - 크롤링] 특정 텍스트와 정확하게 일치하는 태그 찾는 방법 (0) | 2025.04.22 |
[Python] 파이썬으로 지리 정보 시스템(GIS) 다루기 (0) | 2025.01.22 |
[Python] 파이썬을 이용한 소셜 미디어 데이터 마이닝 (0) | 2025.01.22 |