Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- Reduxpender
- REACT
- SpringRESTDocs
- SWAGGER
- openapi3
- T-OTP
- Spring REST Docs
- Flyway
- axios
- preventdefault
- OpenStack
- 리액트
- UsernamePasswordAuthenticationFilter
- MSA
- Filter
- JavaScript
- MFA
- SpringBoot
- vuejs
- Pender
- AuthenticatoinProvide
- cloud native
- stopPropogation
- gradle
- vue
- tasklet
- cheerio
- Spring Batch
- Crawling
- Spring Security
Archives
- Today
- Total
목록nodejs (1)
Miracle Morning, LHWN
8. puppeteer 을 이용한 동적 Crawling
네이버 블로그를 크롤링하는 과정에서 cheerio 로는 크롤링이 제한되는 상황이 나왔다. 첫 로딩된 HTML 에는 해당 element 가 display:none; 상태로 있었고, 특정 버튼을 눌러야 해당 element 가 나타났다. 다만, cheerio 를 이용한 크롤링은 DOM (Document Object Model: 웹 페이지에 대한 인터페이스) 이 계속 변하는 SPA (Single Page Application: 단일 페이지 어플리케이션) 에서는 사용할 수가 없어 puppeteer 를 추가적으로 사용하였다. cheerio 와 puppeteer 의 차이 cheerio 는 jQuery 를 이용해서 웹 페이지를 parsing 하고, 데이터 구조의 결과물을 탐색 및 조작할 수 있도록 도와주는 Node..
IT 기술/[React] Project
2021. 6. 1. 14:39