Java系列文章
[Java]手把手帶你實作PTT爬蟲(2)-文章內容及儲存
前言 上一篇教學實作了一個簡單的爬蟲並成功的爬到了 PTT 的文章列表 這次就繼續將 PTT 文章內容給爬回來然後儲存到電腦上 必備知識 1. 上一篇所列的知識 2. 多型 3. 介面 4. 執行緒 5. 檔案處理 獲取文章內容 這邊就直接放出程式碼了,大多都是上一篇說明過的部分 在 ptt.crawler.Reader 中加入以下 Method public String getBody(Article article) throws IOException { /* 如果看板需要成年檢查 */ if (article.getParent().getAdultCheck()) { runAdultCheck(article.getUrl()); } /* 抓取目標頁面 */ Request request = new Request.Builder() .url(Config.