找回密码
 立即注册
搜索
查看: 2096|回复: 10

[网络] 求个比较奇怪的批处理解决方案

[复制链接]
     
发表于 2014-9-2 16:03 | 显示全部楼层 |阅读模式
是这样的,因为某些原因,我要另存大概6万个网页。
这个操作过程是这样:
点击网页“下一页”按钮,鼠标右键另存为,保存为html,然后重复。
现在有两个问题,第一个问题是,点击“下一页”后,加载需要一定的时间,时间不固定,10秒-20秒的样子;第二个问题是,保存为html时需要对文件名进行更名,因为默认都是同一个名称。
大概就是这样,手动存6万个不知道要弄到猴年马月去了,求批处理解决方案!
回复

使用道具 举报

     
发表于 2014-9-2 16:08 | 显示全部楼层
按键精灵

其实这种需求都是自己写个页面抓取程序来的最快……
回复

使用道具 举报

     
 楼主| 发表于 2014-9-2 16:11 | 显示全部楼层
绕指流光 发表于 2014-9-2 16:08
按键精灵

其实这种需求都是自己写个页面抓取程序来的最快……

不会写呢……
按键精灵似乎不能解决改名的问题啊
回复

使用道具 举报

     
发表于 2014-9-2 16:37 | 显示全部楼层
python几行就搞定了……
回复

使用道具 举报

     
发表于 2014-9-2 18:29 | 显示全部楼层
网址有没有规律?
回复

使用道具 举报

     
发表于 2014-9-2 19:34 | 显示全部楼层
httrack
回复

使用道具 举报

     
发表于 2014-9-2 20:45 | 显示全部楼层
给个网址
回复

使用道具 举报

     
发表于 2014-9-2 21:11 | 显示全部楼层
按键精灵6万个也不知道到什么时候了
python或者找个现成的爬虫吧
回复

使用道具 举报

发表于 2014-9-3 09:07 | 显示全部楼层
有些链接是js跳转,没有直接显示的超链接,不知道python怎么处理。
回复

使用道具 举报

     
 楼主| 发表于 2014-9-3 10:54 | 显示全部楼层
紧那罗 发表于 2014-9-2 21:11
按键精灵6万个也不知道到什么时候了
python或者找个现成的爬虫吧

嗯,似乎写爬虫要简单点。
不过操作上其实很简单,就是不断点击下一页,另存,下一页,另存,本以为可以有个简单的解决办法的,不会写爬虫啊
回复

使用道具 举报

头像被屏蔽
     
发表于 2014-9-3 12:12 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-8-30 06:23 , Processed in 0.098965 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表