Novelpia硬摳文本

前言先消毒一下,此方法完全是用於學習用途,以及推廣作品之意,並無任何惡意盜取轉載之意,並不提倡使用此方法進行非法文本盜取,以及變賣。

說明 : 此方法只能一話一話摳,並不支援多話抓取,多話抓取會涉及模擬客戶端接口並透過api進行請求,容易被懷疑為可疑活動IP,因此有風險,並不是我懶(?。

Novelpia硬扣文本方法

先到那本小說的目錄,並點擊f12檢查工具

進入章節後畫面如上圖所示

之後點擊檢查視窗左上角的元素檢查器,如下圖

在左邊的區域快速搜尋到<div onclick….>這一塊元素,如下圖

選中後,在右邊的檢查器區塊按下右鍵選擇copy中的copy element複製整個元素區塊,如下圖

之後將複製的元素區塊貼到隨便一個去除html格式的工具或網站,便能得到乾淨的文本,但通常廣泛網站不會做特別處理,頂多用去除格式的函式庫工具進行去除,因此容易有多餘的東西包含在內,尤其是novelpia這種專為干擾爬蟲做特化的網站更容易,因此自己有做了一個工具,針對novelpia常用的干擾用多於元素進行處理,因此不會有多餘的標籤或元素在內文裡,而且往後若有新的阻擋型多餘標籤,我也能夠靈活對程式碼進行修改。以下為演示



將複製的元素輸入,如下圖

點擊清理後,選擇欲保存的位置

之後便能得到乾淨的文本,如下




這是工具的下載連結,想用比較乾淨的清理可以下載https://drive.google.com/file/d/1ecbX_8j-Vh3bmSmF-mpzi_czMGC8uMmG/view?usp=sharing

你的回應