famdic 发表于 2026-1-13 15:05

发现个能用的知识库

之前因为工作关系,到处翻阅标准烦不胜烦,直接问ai,ai直接编造条款回答我,后来火山方舟有个知识库,我还花了50多传了一堆标准上去让他解析切片,精度实在太差了,连勉强能用的标准都达不到。
ima.qq.com,有pc,网页,app三个平台
腾讯家出的,今天传了1000多个标准上去,精度极佳,使用到目前没有发现编造内容,还有知识广场,别人搞的知识库,使用的时候要检查一下提问范围,刚加了一个在他根目录提问会有很多公众号的内容,我是信不过。
这里只谈工具,不谈其他。

松下仓鼠 发表于 2026-1-13 16:05

ima 基本就是微信公众号+用户上传的 pdf,也可以添加网页,问题是会占用网页链接的快捷方式

zyjzhzyh 发表于 2026-1-13 16:11

真的吗,我下载下来试试,
好像国内做知识库和大模型问答的有点少,或者说之前都要自己搭建还是训练?门槛比较高?

Augusty 发表于 2026-1-13 16:15

国家标准全文公开系统:https://openstd.samr.gov.cn/bzgk/gb/。下载下来作为知识背景,哪个AI强就调用哪个AI问

famdic 发表于 2026-1-13 16:29

zyjzhzyh 发表于 2026-1-13 16:11
真的吗,我下载下来试试,
好像国内做知识库和大模型问答的有点少,或者说之前都要自己搭建还是训练?门槛 ...

不需要训练,上传完等他解析完毕就可以使用,速度挺快的,他回答你问题的答案会被限制在你提问的这个文件夹里面,
我目前建立了一个私有库,都是我自己一个一个收集的标准规范,我对这个库的内容很信任,广场上也有同类的知识库,可以加入直接提问,但是我看有挺多引用公众号的内容,所以我只做参考。
经过我的测试非常精准,在线的ai天天给我编答案,而且感觉没有那种,没有耐心非常急于把对话结束的问题,我还有一个测试方法是传个6m的小说文件,之前的在线ai没一个ai能读完的,这个ima在解析了我上传的小说文件后对我提出的各种关于结局,力量体系的问题都能很精准的总结,并理解我的意思在文本中找答案来回答我,而且比如说某个背景体系什么意思,他的回答来源于第八百九十几章都会给我标注清楚。这可是几百万字.

famdic 发表于 2026-1-13 16:40

Augusty 发表于 2026-1-13 16:15
国家标准全文公开系统:https://openstd.samr.gov.cn/bzgk/gb/。下载下来作为知识背景,哪个AI强就调用哪个 ...

这个系统不全的,而且经常查不到或者只有个名称不公开内容。
去年我也用你这种想法在火山方舟干了个知识库,几个g的标准文档,花了我50几块,解析出来的内容惨不忍睹,天天给你编聊斋。。
当时我朋友建议我搞个数据库,简单的数据库那没意义啊,我要精准的记得是什么,在标准中是将的消防栓还是消火栓,然后搜索。。
这个我不需要,我只需要知道大概什么要求,在哪里出现,ima就能理解我的意思并把这个库里涉及的相关内容查出来罗列好。这个在大量行业都是非常解放人的了。。

GMJ 发表于 2026-1-13 16:42

本帖最后由 GMJ 于 2026-1-13 16:44 编辑

在线AI以前也可以很准的,但开放后架不住这么多人往里面注屎污染。

常用专业的知识库值得你建立一个私人版的来防止污染,只是要记得自己去更新

啥时候ai这玩意可以挂在nas上用几十瓦的功耗跑起来即时问答,个人知识库的建设使用成本就低了
            
      
      
   

            
      
      
   

Augusty 发表于 2026-1-13 16:47

famdic 发表于 2026-1-13 16:40
这个系统不全的,而且经常查不到或者只有个名称不公开内容。
去年我也用你这种想法在火山方舟干了个知识 ...

居然在某些领域不全。之后我在推荐的话会注明

famdic 发表于 2026-1-13 16:53

Augusty 发表于 2026-1-13 16:47
居然在某些领域不全。之后我在推荐的话会注明

而且这个里面有很多下不了看不到内容,要么说其他部委,你要下载去找其他部位咨询,要么说这个是收费,不给下载

famdic 发表于 2026-1-13 16:55

GMJ 发表于 2026-1-13 16:42
在线AI以前也可以很准的,但开放后架不住这么多人往里面注屎污染。

常用专业的知识库值得你建立一个私人版 ...

这个能公开库,我的这个私有库就通过二维码开放,我的同事朋友能补充更新,目前免费空间50g,对于文字资料50g完全够了。。。

Nanachi 发表于 2026-1-13 17:00

粗看起来原理是RAG吗

GMJ 发表于 2026-1-13 17:04

本帖最后由 GMJ 于 2026-1-13 17:06 编辑

famdic 发表于 2026-1-13 16:55
这个能公开库,我的这个私有库就通过二维码开放,我的同事朋友能补充更新,目前免费空间50g,对于文字资 ...
亲友小范围公开本质上和你的个人私人库一个性质,公开到一定程度就变成林子大了什么鸟都有,开始有人污染库了。

这个程度甚至不需要太大,光是这个论坛的注册用户进去,我保证马上开始有人灌屎。
            
      
      
   

famdic 发表于 2026-1-13 17:12

GMJ 发表于 2026-1-13 17:04
亲友小范围公开本质上和你的个人私人库一个性质,公开到一定程度就变成林子大了什么鸟都有,开始有人污染 ...

可以设置权限的,不然广场上面那些公开的库分分钟被爆破。。

zievod 发表于 2026-1-14 02:49

你可以试试谷歌的notebookLM 算是升级版的ima

ima的优势在于可以抓公众号文章 公开库有些还不错 但是大部分都停更半年以上了 后续感觉够呛

—— 来自 OnePlus PJD110, Android 16, 鹅球 v3.5.99

剑起苍斓 发表于 2026-1-14 08:05

这就是简单的RAG啊,阿里也有对应的阿里云百炼,之前一直是免费的,今年也开始收费了

—— 来自 motorola XT2301-5, Android 15, 鹅球 v3.5.99-alpha

鸳鸳相抱 发表于 2026-1-14 08:57

我上个月直接拿ima帮媳妇无预习通过省级财务专家库开卷考试的

gx19860411 发表于 2026-1-14 10:55

那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99

chaoliu 发表于 2026-1-14 13:58

Augusty 发表于 2026-1-13 16:15
国家标准全文公开系统:https://openstd.samr.gov.cn/bzgk/gb/。下载下来作为知识背景,哪个AI强就调用哪个 ...

倒是可以但不知道怎么把自己想要的标准全部整下来,一个个手动点有些累(

Augusty 发表于 2026-1-14 14:58

chaoliu 发表于 2026-1-14 13:58
倒是可以但不知道怎么把自己想要的标准全部整下来,一个个手动点有些累( ...

下载页面加了比较常规的字符验证码,对于大众没有什么比较好的自动化下载手段。真需要的话可以考虑pay to win,二道贩子总是有的

好大一只绅士 发表于 2026-1-14 17:35

不明觉厉

mqm 发表于 2026-1-14 19:57

激动的把项目英文用户手册传上去了,不过3000多个文件一个小时了还没解析完

Jumbohard 发表于 2026-1-14 21:02

gx19860411 发表于 2026-1-14 10:55
那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99 ...

理论上是可以的,有模型专门干这个。当然要是希望过程更透明可控一点可以用MinerU或者dolphin自己识别了导出再添加知识库

—— 来自 Xiaomi 24018RPACC, Android 16, 鹅球 v3.5.99

鸳鸳相抱 发表于 2026-1-14 22:53

gx19860411 发表于 2026-1-14 10:55
那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99 ...
估计不太行,mineru的图片表格识别率只有60%出头,有待进一步提高性能

依然荏苒 发表于 2026-1-14 23:44

ima的底层WeKnora开源挺久了,可以本地部署,处理本地数据。其实类似的mcp组件也有挺多的不过上手复杂一些。我觉得llm的最大用处一个是总结知识,一个就是编程了。

famdic 发表于 2026-1-15 09:24

gx19860411 发表于 2026-1-14 10:55
那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99 ...

我这几天用下来是可以的。。直接给了我标注里表格中的数据,当然我还是去验证了一下。。

gx19860411 发表于 2026-1-16 10:08

famdic 发表于 2026-1-15 09:24
我这几天用下来是可以的。。直接给了我标注里表格中的数据,当然我还是去验证了一下。。 ...

那挺好,过几天试试。两年前我试着用ocr整标准知识库,效果一言难尽。

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99

流缨 发表于 2026-1-18 16:52

zievod 发表于 2026-1-14 02:49
你可以试试谷歌的notebookLM 算是升级版的ima

ima的优势在于可以抓公众号文章 公开库有些还不错 但是大部 ...

不能说是升级,notebookLM是plus pro max了,就是国内存在使用门槛
使用场景比ima这种偏向于知识整理的产品设计强的太多,而且可以加web搜索结果和油 管视频当资料

2026年再讨论ima着实有点晚,它的优势就是国内生态,腾讯罕见的没有给他分配营销资源,其实这东西的生产力促进效果远比阿里那些玩意儿强得多
页: [1]
查看完整版本: 发现个能用的知识库