大模型回答哪方面的科普问题能深入浅出且不容易被其忽悠？

气旋 · 发表于 2025-9-2 09:01

本帖最后由气旋于 2025-9-2 09:06 编辑

就是没大模型前不太好搜索答案的然后对于没有专业背景的人能看懂回答且能判断回答是否合理

个人感觉可能是化学？语料足够丰富，答案相对也比较明确，另一方面可能答案的真伪判断可能比其他学科更容易点。

Prushka · 发表于 2025-9-2 09:06

对于没有专业背景的人能看懂回答且能判断回答是否合理

应该没有这种可能性

gammatau · 发表于 2025-9-2 09:29

不知道你化学是想了解到哪个层次，但化学比较常见的酸碱理论至少有三种，有机化学反应可行性、这个基团为什么能进攻那个基团基本靠看现象事后用嘴巴圆。我觉得你想要靠AI不被忽悠有点难度。

zanber · 发表于 2025-9-2 09:30

不管是哪个学科，你如果没有基础的判断能力就不要把AI的输出当真。哪怕它给你写了一段代码，你也要试一下能不能跑，反正我之前至少要纠正3次左右才能让代码跑起来。更别提常见的什么记忆幻觉胡编瞎造之类的问题了。

nexus1 · 发表于 2025-9-2 09:31

提示: 作者被禁止或删除内容自动屏蔽

eno_emos · 发表于 2025-9-2 09:52

本帖最后由 eno_emos 于 2025-9-2 09:55 编辑

没大模型前不太好搜索答案的

这个确实很合适，特别是你的问题非常复合的时候

对于没有专业背景的人能看懂回答且能判断回答是否合理

这个就不现实了，非专业背景跟能判断回答是否合理这俩条件本身就冲突

最适合的情况应该是你有基本概念，能清楚描述问题，但是问题过于复合，导致你自己解决需要大量时间把不同来源的解决方案拼在一起
这种条件下问ai它就能给出清晰可用的答案

泰坦失足 · 发表于 2025-9-2 09:57

前几天用ChatGPT5的自动模式, 让它自动决定是否thinking是否搜索, 一边玩MGS3一边问攻略, 可以说错误百出了.

气旋 · 发表于 2025-9-2 09:58

gammatau 发表于 2025-9-2 09:29
不知道你化学是想了解到哪个层次，但化学比较常见的酸碱理论至少有三种，有机化学反应可行性、这个基团为什 ...

我就问了类似为啥硅酸盐矿物质比碳酸盐多那么多之类的问题

它回答说是空间构型不同碳酸根是平面三角结构本身不成网靠阳离子连接形成三维结构

硅氧是正四面体结构四面体之间可以通过不同形式的连接形成层状链状网状阳离子既可以嵌入其中也可以取代硅原子充当骨架导致化合物种类繁多

当然再解释为啥没有稳定碳氧四面体结构就有点看不懂了啥离域π键没接触过

jojog · 发表于 2025-9-2 10:02

应该没有吧

聚二甲基硅氧烷 · 发表于 2025-9-2 10:06

提示: 作者被禁止或删除内容自动屏蔽

库德里尔 · 发表于 2025-9-2 10:13

ai不知道“珠穆朗玛峰”是怎样一个客观实在。ai只是把这些概念联系在了一起。在庞大的语义空间里，山峰是一个高维向量，珠穆朗玛峰也是一个高维向量，人类也是一个高维向量。

ai也不会算数。我随机写了一个大数乘法，6491827350*8103559274016882951=52606907727408945103050509850，ai不一定算的对。因为ai可能学习到了一个乘法的模式，这个模式让“乘法运算”最接近正确答案，但是这个模式泛化不到这么离谱的条件里。ai始终是在处理文本模式，而非数学问题。

提示词：不允许使用python等工具，计算6491827350*8103559274016882951=?
如果模型尝试估算，则要求它算精确值。好几个模型尝试通过工具调用来跳过计算，通过提示词明确拒绝了。

正确答案：52606907727408945103050509850
gpt-4o：52588920968389224951935268500
gpt-o4-mini：52600207727408945103050509850
deepseek-v3：用短数逐位去乘大数，最后卡输出token上限了。
deepseek-r1：以为数字是精心挑选的，然后绕进去了。
gemini-2.5-flash-nothinking：5260170066121960241947295250
gemini-2.5-flash：52601725586616428795026947850
gemini-2.5-pro：52607149454131569482114949350

可以看出ai确实不会算数。但是“聪明的ai”大概会知道，如果遇上这样的问题，可以调用python来计算，它返回的结果往往是对的。这就属于另外一个方向：工具使用啦。

—— 来自鹅球 v3.5.99

子虚乌有 · 发表于 2025-9-2 10:16

聚二甲基硅氧烷发表于 2025-9-2 10:06
AI拿来查攻略几乎可以说是不可用的，越复杂的游戏越不可用

因为攻略这玩意刚好卡在AI的弱点上，文字类的 ...

对没错。玩游戏查个攻略就知道ai只会胡说八道。

coldhot3 · 发表于 2025-9-2 10:18

ai编的太离谱了。比如查几个生物分子。而且上下文长了还降低智慧。

Lewismain · 发表于 2025-9-2 10:23

我当年搞化竞的时候就觉得有机全靠口胡

妄想中毒 · 发表于 2025-9-2 11:54

聚二甲基硅氧烷发表于 2025-9-2 10:06
AI拿来查攻略几乎可以说是不可用的，越复杂的游戏越不可用

因为攻略这玩意刚好卡在AI的弱点上，文字类的 ...

这得看网上相关资料多不多，我玩baba is youGPT就能很详细的告诉我每关解法步骤，还会分析不同语法的组合能产生什么效果以及为什么会产生这种效果，回答基本都是对的没有瞎说

normalli · 发表于 2025-9-2 12:01

明确而简单的问题是关键，和领域其实关系不大，不要一直追问，ai上下文一长就开始胡言乱语了

真草稚京 · 发表于 2025-9-2 12:36

气旋发表于 2025-9-2 09:01
就是没大模型前不太好搜索答案的然后对于没有专业背景的人能看懂回答且能判断回答是否合理

个人感觉可 ...

如果ai的回答你能看懂并且分辨

那说明这不是专业知识只是常识

你对专业知识是不是有啥误解

—— 来自 vivo V2324A, Android 15, 鹅球 v3.5.99

气旋 · 发表于 2025-9-2 12:48

真草稚京发表于 2025-9-2 12:36
如果ai的回答你能看懂并且分辨

那说明这不是专业知识只是常识

是常识只是没大模型前这些常识很不好搜索而已

星花 · 发表于 2025-9-2 13:12

本帖最后由星花于 2025-9-2 13:14 编辑

步骤 1: 欧拉公式与对数

从欧拉公式开始：

e^{i2\pi} = 1

对两边取自然对数（使用主值分支）：

\ln(e^{i2\pi}) = \ln(1)

由于对数是指数的逆函数，假设主值成立，则：

i2\pi = 0

因此：

i2\pi = 0 \quad (1)

步骤 2: 除以非零因子

假设 i\pi \neq 0，将方程 (1) 两边除以 i\pi：

\frac{i2\pi}{i\pi} = \frac{0}{i\pi}

简化：

2 = 0 \quad (2)

步骤 3: 推导出 1 = 0

将方程 (2) 两边除以 2：

\frac{2}{2} = \frac{0}{2}

简化：

1 = 0 \quad (3)

步骤 4: 推导出 3 = 0

从方程 (3) 出发，两边加 2：

1 + 2 = 0 + 2

简化：

3 = 2

但根据方程 (2)，2 = 0，因此：

3 = 0 \quad (4)

即：

0 = 3 \quad (5)

步骤 5: 计算 1 + 1

已知：

1 + 1 = 2

根据方程 (2)，2 = 0，所以：

1 + 1 = 0

再根据方程 (5)，0 = 3，因此：

1 + 1 = 3

结论

通过上述复杂数学公式的论证，我们得出 1 + 1 = 3。

星花 · 发表于 2025-9-2 13:17

你看1+1都可以忽悠成3，所以还是放弃吧。

新屋 · 发表于 2025-9-2 13:35

提示: 作者被禁止或删除内容自动屏蔽

Hydro · 发表于 2025-9-2 14:44

文学分析
其实正经文本分析也就是几个视角倒过来倒过去，不过是目标文本不大一样
觉得有道理吗，有道理那就是真的
当然本身没有被广泛分析过的文本就不要让模型分析了，它在线胡编原文的

jinyu19922011 · 发表于 2025-9-2 16:02

本帖最后由 jinyu19922011 于 2025-9-2 16:03 编辑

1、大概是医学（含药物知识等），当然是对应着科普概念，结果应该比社区医院的医生靠谱。
2、就像楼上说的，凡是涉及某专业的高层次知识，瞎编的概率很大。并且不是专业人士，甚至专业人士都不好分辨真假。需要动手验证。
3、瞎编来自其概率模型的原理，会产生幻觉，但幻觉也有幻觉的好处，在需要新的设计思路的时候还是提供也一定帮助的

mp5 · 发表于 2025-9-2 17:20

稍微专业一点的问题ai就不靠谱, 我不止一次被ai编造的虚无api接口给坑了

		自动登录	找回密码
密码			立即注册

nexus1 nexus1 当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2010-2-7 头像被屏蔽	发表于 2025-9-2 09:31 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

聚二甲基硅氧烷聚二甲基硅氧烷当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2017-8-6 头像被屏蔽	发表于 2025-9-2 10:06 来自手机 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

新屋新屋当前离线禁止发言精华 \| 战斗力鹅 \| 回帖 0 注册时间 2013-1-19 头像被屏蔽	发表于 2025-9-2 13:35 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报

[生活] 大模型回答哪方面的科普问题 能深入浅出且不容易被其忽悠？

[生活] 大模型回答哪方面的科普问题能深入浅出且不容易被其忽悠？