憋了好几年终于能稍微憋出点小玩意发布一下,希望有人能看到甚至能用上

自己用py写了一个扒站的工具,具体不多说,直接放出github地址

https://github.com/paperen/website-clone

扒站小能手

说明

  • -h or --help 说明
  • -u or --url 站点网址(site url)
  • -d or --dir [可选]保存本地目录,默认为站点域名(which directory to save files[op tion])

例子(example)

py clone.py -u paperen.com

clone -u paperen.com -d test (windows下)

截图如下

在命令行下面执行 http://paperen.com/file/184

爬取完毕后会自动打开浏览器访问已爬取的页面 http://paperen.com/file/185

查看源码可以看到css与js、还有图片(包括css里面的background路径)均已修改为本地相对路径 http://paperen.com/file/186

默认会在py代码目录生成站点文件夹,你可以通过-d参数调整生成的目录 http://paperen.com/file/187

同时已打包生成exe,直接命令行下

clone -u paperen.com -d test

注意:请确保-d参数的路径已存在 http://paperen.com/file/188

晚安~