by 优雅小鼠
2025-10-20 13:48
前言先消毒一下,此方法完全是用於學習用途,以及推廣作品之意,並無任何惡意盜取轉載之意,並不提倡使用此方法進行非法文本盜取,以及變賣。
說明 : 此方法只能一話一話摳,並不支援多話抓取,多話抓取會涉及模擬客戶端接口並透過api進行請求,容易被懷疑為可疑活動IP,因此有風險,並不是我懶(?。
Novelpia硬扣文本方法
先到那本小說的目錄,並點擊f12檢查工具
進入章節後畫面如上圖所示
之後點擊檢查視窗左上角的元素檢查器,如下圖
在左邊的區域快速搜尋到<div onclick….>這一塊元素,如下圖
選中後,在右邊的檢查器區塊按下右鍵選擇copy中的copy element複製整個元素區塊,如下圖
之後將複製的元素區塊貼到隨便一個去除html格式的工具或網站,便能得到乾淨的文本,但通常廣泛網站不會做特別處理,頂多用去除格式的函式庫工具進行去除,因此容易有多餘的東西包含在內,尤其是novelpia這種專為干擾爬蟲做特化的網站更容易,因此自己有做了一個工具,針對novelpia常用的干擾用多於元素進行處理,因此不會有多餘的標籤或元素在內文裡,而且往後若有新的阻擋型多餘標籤,我也能夠靈活對程式碼進行修改。以下為演示
將複製的元素輸入,如下圖
點擊清理後,選擇欲保存的位置
之後便能得到乾淨的文本,如下
這是工具的下載連結,想用比較乾淨的清理可以下載https://drive.google.com/file/d/1ecbX_8j-Vh3bmSmF-mpzi_czMGC8uMmG/view?usp=sharing