반응형
안녕하세요. 멋진 선배 입니다. 오늘은 Python 크롤링 중 웹사이트 파라미터 종류가 많을때 크롤링 하는 방법에 대해서 알아보도록 하겠습니다.
반응형
실습사이트
반응형
RISS 검색 - 국내학술지논문
이 검색어로 많이 본 자료
www.riss.kr
실습내용
반응형
- Search.do 뒤에 있는 파라미터를 변수로 처리해서 크롤링 하기
실습
반응형
1.해당 사이트에 접속 후 F12키를 눌러 개발자 도구로 간다.
2.Network 탭 -> Payload로 들어가서 각 속성을 쭉 드래그 해서 복사한다.
3.IDE(인텔리J)로 가서 param 변수에 속성을 넣은 후 null 값인 대상을 지워 준다.
4.최종 실행해 본다.
import requests
from bs4 import BeautifulSoup
# 파라미터 종류가 많은 경우 꿀팁
# 구글 개발자 도구에서 파라미터를 복사
# 딕셔너리로 만든다음 요청할때 같이 보냄
# 파라미터 종류가 많을 경우 꿀팁
param = {
'isDetailSearch': 'N',
'searchGubun': 'true',
'viewYn': 'OP',
'strQuery': '패션 인공지능',
'order': '/DESC',
'onHanja': 'false',
'strSort': 'RANK',
'iStartCount': 0,
'sflag': 1,
'isFDetailSearch': 'N',
'pageNumber': 1,
'resultKeyword': '패션 인공지능',
'icate': 're_a_kor',
'colName': 're_a_kor',
'pageScale': 100,
'isTab': 'Y',
'query': '패션 인공지능'
}
response = requests.get("https://www.riss.kr/search/Search.do", params=param)
html = response.text
soup = BeautifulSoup(html, 'html.parser')
반응형
'IT > Python' 카테고리의 다른 글
[Python - 크롤링] 셀레니움 설치/환경 설정 및 주요 명령어 정리 (0) | 2025.05.01 |
---|---|
[Python-크롤링] 웹사이트 파라미터 종류가 많을때 크롤링 하는 방법 2단계 (1) | 2025.05.01 |
[Python - 크롤링] 네이버지식인 데이터 크롤링 1단계 (0) | 2025.04.28 |
[Python - 크롤링] 네이버 증권 뉴스 엑셀파일 저장하기 (0) | 2025.04.25 |
[Python - 크롤링] 한국 주식 종가 갖고 오는 프로그램 코드 (0) | 2025.04.25 |