간단한 파이썬 웹사이트 크롤링(스크래핑) 예제 코드

간단한 파이썬 웹사이트 크롤링(스크래핑) 예제 코드

Presta
쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물

20-01-24
2,815 회
0 건

아래 코드는 engadget.com의 최신 기사 타이틀을 가져오는 간단한 파이썬 크롤링 코드입니다.

# engadget 스크래핑

from bs4 import BeautifulSoup

from pprint import pprint

import requests

#웹 페이지를 열고 소스코드를 읽어오는 작업

html = requests.get("https://www.engadget.com/")

soup = BeautifulSoup(html.text, 'html.parser')

html.close()

# 제목 영역 추출

data=soup.findAll('span',"th-underline")

title_list = [ t.text for t in data]

title_list = [item.strip() for item in title_list if str(item)] # 줄바꿈 태그 삭제

pprint(title_list)

Data

번호	제목	글쓴이	조회	날짜
42	파이썬 강좌 사이트, 파이썬 관련 사이트 리스트 정리 Presta 6,723 0 01-24	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	6,723	01-24
열람	간단한 파이썬 웹사이트 크롤링(스크래핑) 예제 코드 Presta 2,816 0 01-24	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	2,816	01-24
40	파이썬 장고 웹 호스팅 가격 비교, Python, Django 호스팅 Presta 3,350 0 01-24	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	3,350	01-24
39	리눅스 로그파일 분석에 대한 정리 Presta 1,909 0 11-08	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,909	11-08
38	리눅스 디렉토리 구조, 파일 의미 정리 Presta 1,774 0 11-08	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,774	11-08
37	리눅스 패키지관리 명령어 rpm, yum 사용법 정리 Presta 1,761 0 11-07	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,761	11-07
36	리눅스 파일압축 명령어 사용법 정리 Presta 1,390 0 11-07	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,390	11-07
35	리눅스 파일관리 명령어 사용법 정리 Presta 1,813 0 11-07	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,813	11-07
34	리눅스 디렉토리관리 명령어 사용법 정리 Presta 1,089 0 11-04	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,089	11-04
33	Cygwin 패키지 관리자 apt-cyg 사용법 옵션 Presta 1,568 0 10-01	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,568	10-01
32	Cygwin에서 리눅스 프로그램 패키지 추가 설치하는 방법 Presta 3,965 0 09-30	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	3,965	09-30
31	윈도우에서 리눅스 명령어와 프로그램을 사용할 수 있는 Cygwin 설치, 사용법 Presta 4,480 0 09-30	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	4,480	09-30
30	내사이트에 특정 아이피 접속 차단하기 – 블루호스트 IP 차단기 Presta 2,579 0 09-29	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	2,579	09-29
29	윈도우 cmd를 대체하는 ConEmu 최신버전 설치와 사용방법 - Console Emulator Presta 5,020 0 09-29	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	5,020	09-29
28	스마트서프 Smartsupp 웹사이트 라이브채팅 프로그램 Presta 1,468 0 09-22	Presta 쪽지보내기 메일보내기 자기소개 아이디로 검색 전체게시물	1,468	09-22
1 2 3

접속자집계

오늘 : 67
어제 : 58
최대 : 471
전체 : 131,604