Python+selenium+Googleでwebスクレイピング

selenium + Pythonでのスクレイピングを始めるにあたって、その備忘録です。

スクレイピング環境

Python

Pythonのインストールはこちらの記事をご覧ください。

selenium

seleniumはpipでインストールしました。

pip install selenium

これだけです。

Chrome(chromedriver)

こちらは、seleniumからChoromeを操作するのにchromedriverが必要になるので、こちらからドライバをダウンロードしました。

WebDriver API

seleniumのWebDriver APIはこちらにあります。

WebDriverの使い方(少々)

まずは読み込み

from selenium import webdriver

ブラウザを開く

webdriver.Chrome(DRIVER_PATH)

ここ、ドライバのパスなので注意してください。(あたりまえですが、そのままじゃ動きません)

もちろんこの時

driver = webdriver.Chrome(DRIVER_PATH)

としてくださいね。

webサイトを開く

driver.get("https://thinkport.net")

webサイトを閉じる

driver.quit()

ブラウザを終了する

driver.close()

つづく〜

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください