What is httrack?
HTTrack 是一款免費且開源的離線瀏覽工具,能將整個網站從網路下載到本機目錄,遞迴建立所有資料夾結構,並取得 HTML、圖片及其他檔案。
主要功能包含:
- 網站鏡像(Mirroring):完整複製一個網站的結構與內容到你的電腦上,讓你可以離線瀏覽。
- 保留原始結構:下載後會自動重建相對連結,離線瀏覽時可以正常點擊頁面之間的超連結。
- 斷點續傳:如果下載中斷,可以從上次中斷處繼續。
- 支援多種協定:支援 HTTP、HTTPS 和 FTP 協定。
- 過濾功能:可以設定規則來篩選要下載的檔案類型(例如只抓圖片、排除影片等)。
解題
打開題目
使用httrack下載整個網站原始碼
httrack http://saturn.picoctf.net:50025
使用grep搜尋picoCTF
grep -R picoCTF

取得flag
picoCTF{1nsp3ti0n_0f_w3bpag3s_ec95fa49}
提交flag

補充常用方式
基本操作
| 需求場景 | 指令範例 | 說明 |
|---|---|---|
| 基本整站鏡像 | httrack "http://www.example.com" -O "./my_site" |
將整個網站下載到 ./my_site 目錄 |
| 更新已有的鏡像 | httrack --update |
在專案目錄下執行,僅下載有變動的檔案 |
| 續傳中斷的任務 | httrack --continue |
從上次中斷處繼續下載 |
檔案過濾
| 需求場景 | 指令範例 | 說明 |
|---|---|---|
| 只抓特定副檔名 | httrack "URL" "+*.jpg +*.png -*.zip" |
+ 表示包含、- 表示排除 |
| 只抓 HTML 骨架 | httrack "URL" --skeleton |
僅下載 HTML 結構,不抓圖片等資源 |
| 排除特定路徑 | httrack "URL" "-*/admin/*" |
排除 /admin/ 路徑下的所有頁面 |
| 只抓文件類檔案 | httrack "URL" "+*.pdf +*.doc +*.docx -ad*" |
僅下載 PDF 與 Word 文件 |
深度與速度控制
| 需求場景 | 指令範例 | 說明 |
|---|---|---|
| 限制抓取深度 | httrack "URL" -r3 |
最多遞迴 3 層連結 |
| 限制連線數 | httrack "URL" -%c10 |
同時最多 10 條連線 |
| 限制頻寬 | httrack "URL" -A50000 |
限速約 50 KB/s,避免對目標伺服器造成負擔 |
| 設定每次請求間隔 | httrack "URL" -%s |
加入延遲,降低伺服器負載 |
進階選項
| 需求場景 | 指令範例 | 說明 |
|---|---|---|
| 使用代理伺服器 | httrack "URL" -P proxy:port |
透過指定的 Proxy 進行下載 |
| 自訂 User-Agent | httrack "URL" -F "Mozilla/5.0" |
偽裝瀏覽器標頭,避免被阻擋 |
| 包含外部連結 | httrack "URL" --%e0 |
下載外部網域的連結資源 |
| 設定最大檔案大小 | httrack "URL" -M100000000 |
限制總下載量(單位:bytes) |
| 只抓取站內連結 | httrack "URL" --stay-on-same-domain |
不跟隨外部網域的超連結 |
過濾規則速記
| 符號 | 意義 | 範例 |
|---|---|---|
+ |
包含(允許下載) | +*.png |
- |
排除(禁止下載) | -*.zip |
* |
萬用字元 | +*/images/* |


說些什麼吧!