일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- DART
- 자바
- C로 시작하는 컴퓨터 프로그래밍4판
- Flutter
- Web
- Python
- CSS
- 日本語
- jsp
- 디지몬
- 반다이몰
- 연습문제
- java
- 単語
- 건담베이스
- 건담
- Spring
- nico
- springboot
- rails
- 인프런
- 一日一つメソッド
- ruby
- メソッド
- vscode
- html
- rails7
- 비즈니스일본어
- 일본어
- javascript
Archives
- Today
- Total
목록크롤링 (1)
AR삽질러
Python - 웹 크롤링
웹 크롤링 웹(WWW, Web)에 있는 데이터들을 가져오는 기술을 크롤링이라고 한다. 웹 페이지들은 하이퍼링크를 이용하여 하이퍼텍스트 공간을 자유롭게 이동할 수 있다. 이렇게 웹에 연결된 문서들로부터 필요한 정보를 자동, 반자동으로 수집하는 것을 웹크롤링(Web Crawling)이라고 한다. 이때 수집하는 역할을 처리하는 컴퓨터 프로그램을 웹크롤러, 웹봇 등 다양한 이름으로 불린다. 웹 페이지의 HTML구조를 분석하여 (HTML 파싱) 필요한 정보만을 추출할 수 있는데 이 때 유용하게 사용하는 라이브러리가 BeautifulSoup이다. 이 라이브러리 설치 명령은 "pip install beautifulsoup4"이다. 1. 투믹스 웹툰 제목 가져오기 import requests from bs4 impor..
Python
2023. 12. 9. 14:46