sniper53 发表于 2014-9-2 16:03

求个比较奇怪的批处理解决方案

是这样的,因为某些原因,我要另存大概6万个网页。
这个操作过程是这样:
点击网页“下一页”按钮,鼠标右键另存为,保存为html,然后重复。
现在有两个问题,第一个问题是,点击“下一页”后,加载需要一定的时间,时间不固定,10秒-20秒的样子;第二个问题是,保存为html时需要对文件名进行更名,因为默认都是同一个名称。
大概就是这样,手动存6万个不知道要弄到猴年马月去了,求批处理解决方案!

绕指流光 发表于 2014-9-2 16:08

按键精灵

其实这种需求都是自己写个页面抓取程序来的最快……

sniper53 发表于 2014-9-2 16:11

绕指流光 发表于 2014-9-2 16:08
按键精灵

其实这种需求都是自己写个页面抓取程序来的最快……

不会写呢……
按键精灵似乎不能解决改名的问题啊

maremoto 发表于 2014-9-2 16:37

python几行就搞定了……

暗铁 发表于 2014-9-2 18:29

网址有没有规律?

chachi 发表于 2014-9-2 19:34

httrack

aithinkso 发表于 2014-9-2 20:45

给个网址

紧那罗 发表于 2014-9-2 21:11

按键精灵6万个也不知道到什么时候了
python或者找个现成的爬虫吧

dahuatttt 发表于 2014-9-3 09:07

有些链接是js跳转,没有直接显示的超链接,不知道python怎么处理。

sniper53 发表于 2014-9-3 10:54

紧那罗 发表于 2014-9-2 21:11
按键精灵6万个也不知道到什么时候了
python或者找个现成的爬虫吧

嗯,似乎写爬虫要简单点。
不过操作上其实很简单,就是不断点击下一页,另存,下一页,另存,本以为可以有个简单的解决办法的,不会写爬虫啊

白左 发表于 2014-9-3 12:12

页: [1]
查看完整版本: 求个比较奇怪的批处理解决方案