※ 요약

필자는 요새 파이썬으로 웹 크롤러를 개발하고 있는데, 동적 웹 페이지를 크롤링 하기 위해서는 selenium과 함께 phantomjs가 필요하다는 것을 알게 되었다. 이번 포스트에서는 윈도우에서 phantomjs를 내려 받는 방법을 알아보고 다음 포스트에서는 리눅스에서 내려받는 방법을 알아보도록 하겠다.


※ phantomjs란

팬텀js는 인터페이스가 없는 headless 브라우저다. 웹사이트의 소스코드를 메모리에 불러오고 페이지의 자바스크립트를 실행하지만 그래픽을 전혀 렌더링 하지 않으며, 파이썬의 셀레니움 라이브러리와 함께 사용하면 자바스크립트와 쿠키, 헤더, 스크린샷 등 강력한 웹 크롤러를 만들 수 있게 된다.



※ 다운로드 주소


※ 다운로드 방법

아래는 상기의 링크로 이동한 화면이다. Download라고 써져있는 초록색 버튼을 클릭 하도록 한다.



최상단에 Windows(윈도우)라고 써져 있고 바로 아래에 phantomjs-2.1.1-windows.zip이라는 파일이 있다. 이 파일을 다운로드 받아 사용하면 되겠다.


참고로 *.zip파일을 풀면 phantomjs.exe파일이 하나 있는데, 위치는 놓고 싶은데 놓으면 되며, 윈도우+파이썬에서는 아래와 같이 로드하여 사용하면 된다.




+ Recent posts