找回密码
 立即注册
查看: 3199|回复: 18

[其他] 500个G的json文件怎么做到查询

[复制链接]
头像被屏蔽
     
发表于 2024-12-25 23:04 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2024-12-25 23:18 | 显示全部楼层
一个 json 对象 500g 吗

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2024-12-25 23:30 | 显示全部楼层
流式处理
或者拆了导入搜索用的数据库 如ElasticSearch
回复

使用道具 举报

头像被屏蔽
发表于 2024-12-26 00:12 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-12-26 00:23 | 显示全部楼层
500个G的json?
首先问一下,这个json的内容是一个Object,还是若干个数组,如果是后者的话,可以流式读取,挨个处理每个数组。

但是要是一个单独的object,那就很不好搞了,我很难相信什么object能搞到这么大
回复

使用道具 举报

     
发表于 2024-12-26 00:26 | 显示全部楼层
回复

使用道具 举报

发表于 2024-12-26 03:05 | 显示全部楼层
解铃还须系铃人啊
回复

使用道具 举报

     
发表于 2024-12-26 04:26 来自手机 | 显示全部楼层
500g的json多半是偷的数据库,你要先把它导入库里
回复

使用道具 举报

     
发表于 2024-12-26 05:47 来自手机 | 显示全部楼层
json塞PostgreSQL里查询吧
回复

使用道具 举报

     
发表于 2024-12-26 07:41 来自手机 | 显示全部楼层
典型的数据库该干的活,导进es或者MongoDB呗

—— 来自 鹅球 v3.0.86-alpha
回复

使用道具 举报

     
发表于 2024-12-26 07:44 | 显示全部楼层
你确定这个东西不是先应该导入哪个管理软件吗
回复

使用道具 举报

发表于 2024-12-26 08:35 | 显示全部楼层
朋友从哪里拖的库
回复

使用道具 举报

发表于 2024-12-26 12:09 | 显示全部楼层
流式处理,问llm
回复

使用道具 举报

     
发表于 2024-12-26 12:49 | 显示全部楼层
试试内存映射,python封装是mmap

如果不行可能要按行读然后手动分割了
回复

使用道具 举报

     
发表于 2024-12-26 13:05 | 显示全部楼层
他真的,我哭死,还好心转成json不是直接txt
回复

使用道具 举报

     
发表于 2024-12-26 13:40 | 显示全部楼层
jq 是可以查询的,不过每次都要全部解析一遍。如果需要多次查询,还是导入数据库比较好。
回复

使用道具 举报

     
发表于 2024-12-26 14:42 来自手机 | 显示全部楼层
应该是拖的数据库吧这玩意
回复

使用道具 举报

     
发表于 2024-12-26 16:30 | 显示全部楼层
正好最近都在折腾一个几十G文件的读取,检索,修改,保存。最后发现什么乱七八糟的专门为图设计的xx工具/库/格式都不如读写为sqlite文件
回复

使用道具 举报

     
发表于 2024-12-26 16:52 | 显示全部楼层
泰坦失足 发表于 2024-12-26 16:30
正好最近都在折腾一个几十G文件的读取,检索,修改,保存。最后发现什么乱七八糟的专门为图设计的xx工具/库 ...

sqlite确实好用啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-4-21 23:31 , Processed in 0.125278 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表