求个比较奇怪的批处理解决方案
是这样的,因为某些原因,我要另存大概6万个网页。这个操作过程是这样:
点击网页“下一页”按钮,鼠标右键另存为,保存为html,然后重复。
现在有两个问题,第一个问题是,点击“下一页”后,加载需要一定的时间,时间不固定,10秒-20秒的样子;第二个问题是,保存为html时需要对文件名进行更名,因为默认都是同一个名称。
大概就是这样,手动存6万个不知道要弄到猴年马月去了,求批处理解决方案!
按键精灵
其实这种需求都是自己写个页面抓取程序来的最快…… 绕指流光 发表于 2014-9-2 16:08
按键精灵
其实这种需求都是自己写个页面抓取程序来的最快……
不会写呢……
按键精灵似乎不能解决改名的问题啊 python几行就搞定了…… 网址有没有规律? httrack
给个网址 按键精灵6万个也不知道到什么时候了
python或者找个现成的爬虫吧 有些链接是js跳转,没有直接显示的超链接,不知道python怎么处理。 紧那罗 发表于 2014-9-2 21:11
按键精灵6万个也不知道到什么时候了
python或者找个现成的爬虫吧
嗯,似乎写爬虫要简单点。
不过操作上其实很简单,就是不断点击下一页,另存,下一页,另存,本以为可以有个简单的解决办法的,不会写爬虫啊
页:
[1]