Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- MFA
- UsernamePasswordAuthenticationFilter
- MSA
- vuejs
- stopPropogation
- openapi3
- cloud native
- REACT
- gradle
- Spring Security
- Spring REST Docs
- vue
- axios
- SWAGGER
- Filter
- Spring Batch
- SpringRESTDocs
- Flyway
- SpringBoot
- Crawling
- preventdefault
- Pender
- AuthenticatoinProvide
- JavaScript
- cheerio
- T-OTP
- tasklet
- Reduxpender
- OpenStack
- 리액트
Archives
- Today
- Total
목록puppeteer (1)
Miracle Morning, LHWN
8. puppeteer 을 이용한 동적 Crawling
네이버 블로그를 크롤링하는 과정에서 cheerio 로는 크롤링이 제한되는 상황이 나왔다. 첫 로딩된 HTML 에는 해당 element 가 display:none; 상태로 있었고, 특정 버튼을 눌러야 해당 element 가 나타났다. 다만, cheerio 를 이용한 크롤링은 DOM (Document Object Model: 웹 페이지에 대한 인터페이스) 이 계속 변하는 SPA (Single Page Application: 단일 페이지 어플리케이션) 에서는 사용할 수가 없어 puppeteer 를 추가적으로 사용하였다. cheerio 와 puppeteer 의 차이 cheerio 는 jQuery 를 이용해서 웹 페이지를 parsing 하고, 데이터 구조의 결과물을 탐색 및 조작할 수 있도록 도와주는 Node..
IT 기술/[React] Project
2021. 6. 1. 14:39