如何用google app script登入網頁執行爬蟲(How to use google app script crawler web with login)
上一次我們介紹了如何用google app script登入網頁執行爬蟲,而這次我們要進階運用cookie偽裝登入網站爬蟲!那廢話不多說我們開始吧!
程式碼解析
1 | function fetch() { |
心得說明
由於這次分幾個階段,從登入頁面、設定登入資料、從登入驗證後存取cookie、將cookie帶入到資料頁面,再從資料頁面獲取資訊!雖然程式碼看起來很複雜,其實這部份是基本的登入驗證流程,我測試的網頁在登入驗證部分有相關的網址揭露,所以讓我登入時比較容易一些,而最難的是設定cookie那,其實我不確定我抓的cookie是否都能套用,但後來用網頁解析一步一步跑其實就可以查出些蛛絲馬跡!相信大家都能好好去練習,爬自己想要的網站!
下週主題「freestyle」!