Application/Python

[Python] 웹 크롤링 (selenium)

devsalix 2023. 4. 3. 17:10
728x90

selenium을 통해서 웹 크롤링 하는 법을 간단히 소개해 드리겠습니다

 

우선 java se를 다운로드하여 설치를 진행합니다

 

https://www.oracle.com/kr/java/technologies/downloads/#jdk20-windows

 

Download the Latest Java LTS Free

Subscribe to Java SE and get the most comprehensive Java support available, with 24/7 global access to the experts.

www.oracle.com

 

설치 진행 후 환경 변수를 지정합니다

 

 

시스템 속성에 들어가신 후 환경 변수 창을 활성화하고

 

사용자 변수에 JAVA_HOME 변수를 지정합니다

 

 

이후 시스템 변수에 설치된 java 폴더의 bin 폴더를 추가합니다

 

 

그리고 powershell 영역에서 pip install selenium을 설치합니다

 

> pip install selenium

 

마지막으로 아래와 같이 코드를 작성하면 selenium을 사용하실 수 있습니다

 

from selenium import webdriver

class WebCrawling:
    
	def GetPageList(self, url):
		driver = webdriver.Chrome("./chromedriver")

		driver.get(url)
		driver.implicitly_wait(30)

		print(driver.title)

		self.driver.quit()

 

 

 


제 글이 도움이 되셨다면 댓글 & 공감 부탁드려요 😀

 

 
728x90
반응형