找回密码
 立即注册
搜索
查看: 3519|回复: 26

[软件] 发现个能用的知识库

[复制链接]
     
发表于 2026-1-13 15:05 | 显示全部楼层 |阅读模式
之前因为工作关系,到处翻阅标准烦不胜烦,直接问ai,ai直接编造条款回答我,后来火山方舟有个知识库,我还花了50多传了一堆标准上去让他解析切片,精度实在太差了,连勉强能用的标准都达不到。
ima.qq.com,有pc,网页,app三个平台
腾讯家出的,今天传了1000多个标准上去,精度极佳,使用到目前没有发现编造内容,还有知识广场,别人搞的知识库,使用的时候要检查一下提问范围,刚加了一个在他根目录提问会有很多公众号的内容,我是信不过。
这里只谈工具,不谈其他。
回复

使用道具 举报

     
发表于 2026-1-13 16:05 来自手机 | 显示全部楼层
ima 基本就是微信公众号+用户上传的 pdf,也可以添加网页,问题是会占用网页链接的快捷方式
回复

使用道具 举报

     
发表于 2026-1-13 16:11 来自手机 | 显示全部楼层
真的吗,我下载下来试试,
好像国内做知识库和大模型问答的有点少,或者说之前都要自己搭建还是训练?门槛比较高?
回复

使用道具 举报

     
发表于 2026-1-13 16:15 | 显示全部楼层
国家标准全文公开系统:https://openstd.samr.gov.cn/bzgk/gb/。下载下来作为知识背景,哪个AI强就调用哪个AI问
回复

使用道具 举报

     
 楼主| 发表于 2026-1-13 16:29 | 显示全部楼层
zyjzhzyh 发表于 2026-1-13 16:11
真的吗,我下载下来试试,
好像国内做知识库和大模型问答的有点少,或者说之前都要自己搭建还是训练?门槛 ...

不需要训练,上传完等他解析完毕就可以使用,速度挺快的,他回答你问题的答案会被限制在你提问的这个文件夹里面,
我目前建立了一个私有库,都是我自己一个一个收集的标准规范,我对这个库的内容很信任,广场上也有同类的知识库,可以加入直接提问,但是我看有挺多引用公众号的内容,所以我只做参考。
经过我的测试非常精准,在线的ai天天给我编答案,而且感觉没有那种,没有耐心非常急于把对话结束的问题,我还有一个测试方法是传个6m的小说文件,之前的在线ai没一个ai能读完的,这个ima在解析了我上传的小说文件后对我提出的各种关于结局,力量体系的问题都能很精准的总结,并理解我的意思在文本中找答案来回答我,而且比如说某个背景体系什么意思,他的回答来源于第八百九十几章都会给我标注清楚。这可是几百万字.

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +1 收起 理由
zyjzhzyh + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
 楼主| 发表于 2026-1-13 16:40 | 显示全部楼层
Augusty 发表于 2026-1-13 16:15
国家标准全文公开系统:https://openstd.samr.gov.cn/bzgk/gb/。下载下来作为知识背景,哪个AI强就调用哪个 ...

这个系统不全的,而且经常查不到或者只有个名称不公开内容。
去年我也用你这种想法在火山方舟干了个知识库,几个g的标准文档,花了我50几块,解析出来的内容惨不忍睹,天天给你编聊斋。。
当时我朋友建议我搞个数据库,简单的数据库那没意义啊,我要精准的记得是什么,在标准中是将的消防栓还是消火栓,然后搜索。。
这个我不需要,我只需要知道大概什么要求,在哪里出现,ima就能理解我的意思并把这个库里涉及的相关内容查出来罗列好。这个在大量行业都是非常解放人的了。。
回复

使用道具 举报

     
发表于 2026-1-13 16:42 | 显示全部楼层
本帖最后由 GMJ 于 2026-1-13 16:44 编辑

在线AI以前也可以很准的,但开放后架不住这么多人往里面注屎污染。

常用专业的知识库值得你建立一个私人版的来防止污染,只是要记得自己去更新

啥时候ai这玩意可以挂在nas上用几十瓦的功耗跑起来即时问答,个人知识库的建设使用成本就低了
            
        
        
   

            
        
        
   

回复

使用道具 举报

     
发表于 2026-1-13 16:47 | 显示全部楼层
famdic 发表于 2026-1-13 16:40
这个系统不全的,而且经常查不到或者只有个名称不公开内容。
去年我也用你这种想法在火山方舟干了个知识 ...

居然在某些领域不全。之后我在推荐的话会注明
回复

使用道具 举报

     
 楼主| 发表于 2026-1-13 16:53 | 显示全部楼层
Augusty 发表于 2026-1-13 16:47
居然在某些领域不全。之后我在推荐的话会注明

而且这个里面有很多下不了看不到内容,要么说其他部委,你要下载去找其他部位咨询,要么说这个是收费,不给下载
回复

使用道具 举报

     
 楼主| 发表于 2026-1-13 16:55 | 显示全部楼层
GMJ 发表于 2026-1-13 16:42
在线AI以前也可以很准的,但开放后架不住这么多人往里面注屎污染。

常用专业的知识库值得你建立一个私人版 ...

这个能公开库,我的这个私有库就通过二维码开放,我的同事朋友能补充更新,目前免费空间50g,对于文字资料50g完全够了。。。
回复

使用道具 举报

     
发表于 2026-1-13 17:00 | 显示全部楼层
粗看起来原理是RAG吗
回复

使用道具 举报

     
发表于 2026-1-13 17:04 | 显示全部楼层
本帖最后由 GMJ 于 2026-1-13 17:06 编辑
famdic 发表于 2026-1-13 16:55
这个能公开库,我的这个私有库就通过二维码开放,我的同事朋友能补充更新,目前免费空间50g,对于文字资 ...

亲友小范围公开本质上和你的个人私人库一个性质,公开到一定程度就变成林子大了什么鸟都有,开始有人污染库了。

这个程度甚至不需要太大,光是这个论坛的注册用户进去,我保证马上开始有人灌屎。
            
        
        
   

回复

使用道具 举报

     
 楼主| 发表于 2026-1-13 17:12 | 显示全部楼层
GMJ 发表于 2026-1-13 17:04
亲友小范围公开本质上和你的个人私人库一个性质,公开到一定程度就变成林子大了什么鸟都有,开始有人污染 ...

可以设置权限的,不然广场上面那些公开的库分分钟被爆破。。
回复

使用道具 举报

     
发表于 2026-1-14 02:49 来自手机 | 显示全部楼层
你可以试试谷歌的notebookLM 算是升级版的ima

ima的优势在于可以抓公众号文章 公开库有些还不错 但是大部分都停更半年以上了 后续感觉够呛

—— 来自 OnePlus PJD110, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-1-14 08:05 来自手机 | 显示全部楼层
这就是简单的RAG啊,阿里也有对应的阿里云百炼,之前一直是免费的,今年也开始收费了

—— 来自 motorola XT2301-5, Android 15, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-1-14 08:57 | 显示全部楼层
我上个月直接拿ima帮媳妇无预习通过省级财务专家库开卷考试的
回复

使用道具 举报

     
发表于 2026-1-14 10:55 来自手机 | 显示全部楼层
那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-1-14 13:58 | 显示全部楼层
Augusty 发表于 2026-1-13 16:15
国家标准全文公开系统:https://openstd.samr.gov.cn/bzgk/gb/。下载下来作为知识背景,哪个AI强就调用哪个 ...

倒是可以但不知道怎么把自己想要的标准全部整下来,一个个手动点有些累(
回复

使用道具 举报

     
发表于 2026-1-14 14:58 | 显示全部楼层
chaoliu 发表于 2026-1-14 13:58
倒是可以但不知道怎么把自己想要的标准全部整下来,一个个手动点有些累( ...

下载页面加了比较常规的字符验证码,对于大众没有什么比较好的自动化下载手段。真需要的话可以考虑pay to win,二道贩子总是有的
回复

使用道具 举报

     
发表于 2026-1-14 17:35 | 显示全部楼层
不明觉厉
回复

使用道具 举报

     
发表于 2026-1-14 19:57 | 显示全部楼层
激动的把项目英文用户手册传上去了,不过3000多个文件一个小时了还没解析完
回复

使用道具 举报

     
发表于 2026-1-14 21:02 来自手机 | 显示全部楼层
gx19860411 发表于 2026-1-14 10:55
那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99 ...

理论上是可以的,有模型专门干这个。当然要是希望过程更透明可控一点可以用MinerU或者dolphin自己识别了导出再添加知识库

—— 来自 Xiaomi 24018RPACC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-1-14 22:53 | 显示全部楼层
gx19860411 发表于 2026-1-14 10:55
那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99 ...

估计不太行,mineru的图片表格识别率只有60%出头,有待进一步提高性能
回复

使用道具 举报

发表于 2026-1-14 23:44 来自手机 | 显示全部楼层
ima的底层WeKnora开源挺久了,可以本地部署,处理本地数据。其实类似的mcp组件也有挺多的不过上手复杂一些。我觉得llm的最大用处一个是总结知识,一个就是编程了。
回复

使用道具 举报

     
 楼主| 发表于 2026-1-15 09:24 | 显示全部楼层
gx19860411 发表于 2026-1-14 10:55
那种扫描的pdf标准以及里面的表格可以直接识别吗?

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99 ...

我这几天用下来是可以的。。直接给了我标注里表格中的数据,当然我还是去验证了一下。。
回复

使用道具 举报

     
发表于 2026-1-16 10:08 来自手机 | 显示全部楼层
famdic 发表于 2026-1-15 09:24
我这几天用下来是可以的。。直接给了我标注里表格中的数据,当然我还是去验证了一下。。 ...

那挺好,过几天试试。两年前我试着用ocr整标准知识库,效果一言难尽。

—— 来自 Xiaomi M2011K2C, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-1-18 16:52 | 显示全部楼层
zievod 发表于 2026-1-14 02:49
你可以试试谷歌的notebookLM 算是升级版的ima

ima的优势在于可以抓公众号文章 公开库有些还不错 但是大部 ...

不能说是升级,notebookLM是plus pro max了,就是国内存在使用门槛
使用场景比ima这种偏向于知识整理的产品设计强的太多,而且可以加web搜索结果和油 管视频当资料

2026年再讨论ima着实有点晚,它的优势就是国内生态,腾讯罕见的没有给他分配营销资源,其实这东西的生产力促进效果远比阿里那些玩意儿强得多
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-1-19 02:28 , Processed in 0.150984 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表