找回密码
 立即注册
搜索
查看: 2807|回复: 6

[分享] 写个了e/ex站的calibre本子信息爬虫...

[复制链接]
     
发表于 2021-1-21 22:43 | 显示全部楼层 |阅读模式
初来乍到... 链接一下这个帖子..么的回复权限 [分享] [用了三年的更新]分享一下本子的管理方法 @2517君

对于从e/里站下载的本本,我全网搜了一遍发现除了正则,其他也没什么信息搜刮器..然而官网上的信息(tag, 作者, 标题, 评分, 语言, 原页面)倒是很全,也已经有爬虫脚本了..然后我就做了个打包进cbz文件的脚本。calibre也支持按tag检索, 这下子就方便多了。
https://github.com/xiazeyu/hentaiTagger4calibre


评分

参与人数 2战斗力 +3 收起 理由
plazum + 2 好评加鹅
Heliko + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2021-1-21 23:40 | 显示全部楼层
脚本使用流程还是太长了一点点。。
如果能整合成一键(下载zip+meta)就好了(逃
提供一个想法,把导出info.json的脚本里的createGalleryPageDownloadLink函数稍微改一下,
  1. const node = document.querySelector("#gn");
  2.         const zip_title = (node !== null ? node.textContent.trim() : null);

  3.         link.setAttribute("download", `${zip_title}.info.json`);
复制代码


这样本子下载下来的zip名字会和info.json的名字有匹配之处而且不会重名,虽然说到底还是一个一个下载,但就不必每次都进行改名字了,还需要拉进zip里面再解压出来这种操作了
之后遍历下载文件夹下的zip和info.json,进行名称匹配,我感觉解压和重建calibre的文档都可以写在同一个脚本里了,而不是跑三次脚本

不过我还没想过如果标题里有奇怪的字符是否能真的匹配上
回复

使用道具 举报

     
发表于 2021-1-21 23:42 来自手机 | 显示全部楼层
这种能不能爬到已经删掉的画廊的种子或者本体
回复

使用道具 举报

     
发表于 2021-1-22 09:55 来自手机 | 显示全部楼层
先收藏

—— 来自 Xiaomi Mi 10, Android 10上的 S1Next-鹅版 v2.4.4
回复

使用道具 举报

头像被屏蔽
     
发表于 2021-1-22 12:00 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2021-1-22 14:11 | 显示全部楼层
马克思佩恩,目前我是一周下一次种子,基本上好的新本都有种,老本种子没了确实需要些工具
回复

使用道具 举报

     
发表于 2021-1-22 14:39 | 显示全部楼层
问一下,这个用法是在三个脚本的目录下面放置漫画的压缩包,然后挨着运行脚本,最后再把压缩包放到cailber里面吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-7-17 02:23 , Processed in 0.052392 second(s), 10 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表