티스토리 뷰
Synology Docker Jupyter Notebook에서 크롤링(Crawling)하기 위한 Chromedriver 사용 방법
04310 2019. 1. 4. 16:111) Putty를 사용해 SSH 접속
2) root 권한 획득
3) 실행중인 docker 컨테이너에 root로 접속
실행중인 컨테이너 확인 sudo docker ps -a
접속 docker exec -u 0 -it 컨테이너ID bash
4) 해당 화면에서 크롬 설치
wget https://dl.google.com./linux/direct/google-chrome-stable_current_amd64.deb
sudo apt-get install libxss1 libgconf2-4 libappindicator1 libindicator7
==> 오류나면 sudo apt-get update 실행 후 다시
==> 오류나면 sudo apt --fix-broken-install 실행
sudo dpkg -i google-chrome-stable_current_amd64.deb
5) 크롬드라이버 linux 버전을 다운로드 받는다.
6) Synology에 WinSCP로 접속하여 @docker 하위 폴더 중 jupyter 컨테이너로 들어간다.
7) 해당 컨테이너 내에서 /usr/bin에 chromedriver를 넣는다.
8) Selenium에서 크롬 옵션을 다음과 같이 부여하여 크롤링한다.
option.add_argument("headless");
option.add_argument("no-sandbox");
option.add_argument("disable-dev-shm-usage");
이유는 모르겠지만 일부 사이트는 Connection Refuse Exception이 발생한다.
하지만 메이저 사이트 Google Amazon 등은 문제없이 작동한다.
'IT꿀팁' 카테고리의 다른 글
Docker Jupyter Notebook 세팅방법 (0) | 2019.01.18 |
---|---|
Package openjdk-7-jdk is not available 발생시 (0) | 2019.01.06 |
[오피스] OFFICE 2019 설치하기! #오피스 2019 설치 (13) | 2018.09.26 |
[Adguard] 카카오톡 PC 광고 차단하기 (신버전 추가) (69) | 2018.09.19 |
학생용 Office 2016 Pro Plus 및 VIsio Pro 2016 함께 설치하는 방법 (4) | 2018.09.08 |
- Total
- Today
- Yesterday
- 유레카
- 싱글호퍼
- 화렵
- 알리 커피머신
- 맥널티
- 알리
- 미뇽
- gemilai
- 블로워
- 에스프레소
- 아브대장
- 호퍼
- ITOP3605
- 중국 커피머신
- 커피머신
- X54
- 믕믕공방
- 스페셜리타
- 펌프
- 블로우업호퍼
- 말코닉홈
- 가변압
- 블로우업 호퍼
- CRM 3605
- 싱글도징
- 블로우업
- 잔량
- 엔코
- CRM3605
- OPV
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |