Notice
Recent Posts
Recent Comments
Link
«   2025/08   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
Archives
Today
Total
관리 메뉴

Star_project

웹 스크레핑과 크롤링의 차이점 본문

코딩테스트/Python

웹 스크레핑과 크롤링의 차이점

star빛 2022. 4. 11. 00:11

크롤링이 기본적으로 모든 데이터를 가져오는 거라면 웹 스크래핑은 크롤링으로 생각하기도 하고, 짧은 범위로는 특정 정보만을 추출하는 걸 의미한다. 참고로 다음은 웹크롤링에 대한 정의이다.

웹크롤러가 하는 작업을 웹 크롤링(web crawling) 혹은 스파이더링(spidering)이라 부른다.

검색 엔진과 같은 여러 사이트에서는 데이터의 최신 상태 유지를 위해 웹 크롤링한다.

웹크롤러는 대체로 방문한 사이트의 모든 페이지의 복사본을 생성하느 데 사용되며, 검색 엔진은 이렇게 생성된 페이지를 보다 빠른 검색을 위해 인덱싱한다.

또한 크롤러는 링크 체크나 HTML 코드 검증과 같은 웹 사이트의 자동 유지 관리 작업을 위해 사용되기도 하며, 자동 이메일 수집과 같은 웹 페이지의 특정 형태의 정보를 수집하는데도 사용된다.

출처 : Python을 활용한 자동화 스크립트 강의

'코딩테스트 > Python' 카테고리의 다른 글

sys.stdin=open() map(int, input().split()) list(map(int, input().split()  (0) 2022.06.02
python 백준 1000  (0) 2022.05.01
python 백준 10171  (0) 2022.05.01
객체 이해  (0) 2022.04.14
시각 코테 문제  (0) 2021.10.20