原来AI不会做数独

kiragz 发表于 2026-2-19 22:02

看了几个吹自家AI的视频，我随便找个数独小游戏让这些AI解答
结果基本都是只填一两行就开始瞎JB填，而且一格出错后就会无限循环换着几个错的数告诉你

开心上网 发表于 2026-2-19 22:54

羊寢发表于 2026-2-19 22:58

你用llm肯定不行，但是做过专项训练的ai还是能解这类问题的

oyss 发表于 2026-2-19 22:59

那么让AI写个解数独的代码准不准确呢

月夜凝雪 发表于 2026-2-20 01:32

羊寢发表于 2026-2-19 22:58
你用llm肯定不行，但是做过专项训练的ai还是能解这类问题的

这种所谓的专门训练真不是单纯扫储存库翻答案？

—— 来自 Xiaomi 23049RAD8C, Android 15, 鹅球 v3.5.99-alpha

螺旋的小夜曲 发表于 2026-2-20 01:34

我觉得AI做数学题都不太行，解题思路更像是死记硬背而不是真的在思考

tonyshva 发表于 2026-2-20 01:57

我们找了一堆供应商，我看下来就没一家能好好处理和输出表格和图形的，都基本是提示词工程的雕花，现在来看llm对数据结构的理解还是不行

论坛助手,iPhone

Corruptwing 发表于 2026-2-20 03:22

语言只是思考的工具，而不是思考本身
LLM距离真正的人工智能还差一个质变

overflowal 发表于 2026-2-20 05:54

这种东西用liner attention的那这玩意更容易搞

—— 来自鹅球 v3.4.97

卡仑治糖 发表于 2026-2-20 08:11

月夜凝雪发表于 2026-2-20 01:32
这种所谓的专门训练真不是单纯扫储存库翻答案？

—— 来自 Xiaomi 23049RAD8C, Android 15, 鹅球 v3.5.9 ...

ai 十几年前围棋和象棋都能破解，这种简单计算问题还需要看参考答案？

—— 来自 S1Fun

dkswxd 发表于 2026-2-20 08:17

我认为spec2017的548也算ai做数独，官方描述是这样的
548.exchange2_r 648.exchange2_s
Artificial Intelligence: recursive solution generator (Sudoku)
链接https://www.spec.org/cpu2017/Docs/
https://www.spec.org/cpu2017/Docs/benchmarks/548.exchange2_r.html

—— 来自 Xiaomi 22041211AC, Android 14, 鹅球 v3.5.99

库德里尔 发表于 2026-2-20 08:21

不要把ai和llm混在一起啊（

—— 来自鹅球 v3.5.99

widder 发表于 2026-2-20 08:30

卡仑治糖发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解，这种简单计算问题还需要看参考答案？

—— 来自 S1Fun ...

AI和AI是不同的，现在流行的都是大语言模型，他只会做一件事：文字接龙

娃哈哈123 发表于 2026-2-20 10:15

卡仑治糖发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解，这种简单计算问题还需要看参考答案？

—— 来自 S1Fun ...

阿尔法GO不也是用棋谱训练了，当时的宣传，就是用了几百万个棋谱

佛剑分说 发表于 2026-2-20 10:20

卡仑治糖发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解，这种简单计算问题还需要看参考答案？

—— 来自 S1Fun ...

专用和泛用的区别

佛剑分说 发表于 2026-2-20 10:22

其实我觉得现在好多人都在误用ai app，比如拿来给小孩解数学作业题

Indolencoma 发表于 2026-2-20 10:24

llm最好的用途我觉得目前只有“理解和转化语言（提示词）”

月神夜 发表于 2026-2-20 10:27

刚好之前看到过有人做过，不过是为了验证他的模型架构的长度外推能力....应该是生成大量题目利用已有的解数独算法生成大量数据...
PENG Bo的想法 - 知乎
https://www.zhihu.com/pin/1843005922013753344

窦唯发表于 2026-2-20 10:29

LLM的数学能力和人类思维方式不同，即使简单的加减法也是靠上下文概率推算，不会遵从规则。例如两位数加减，人类会分别计算不同位数并考虑进位规则，LLM 会直接概率估算十（、百）位，再估算个位数，全程找不到激活规则的痕迹。概率估算的缺点就是计算次数堆加后出错概率就指数级上升。

数独、表格数据处理这些任务让 LLM 生成代码来解决更可靠，目前最多只能做到通过各类上下文 MCP、skills 提示让 LLM 做到遇到任务时调用生成好的代码。

fooltiger 发表于 2026-2-20 10:36

人类做数独也要经过专门训练。

webto 发表于 2026-2-20 11:02

fooltiger 发表于 2026-2-20 10:36
人类做数独也要经过专门训练。

人类做数独也需要用其他工具生成代码是吧hhhh

fooltiger 发表于 2026-2-20 11:25

是，甚至有大量的人由于脑内没有这个专门工具，训练了也不会玩数独。

森田美位子 发表于 2026-2-20 12:08

歪个楼，github 上的 ice sudoku，可以分步求解

Rincewind 发表于 2026-2-20 12:09

fooltiger 发表于 2026-2-20 10:36
人类做数独也要经过专门训练。

不需要啊……又不是魔方，数独的推理比较直观，可以硬解的。

璇瑢子R 发表于 2026-2-20 12:25

感觉人脑计算也是语言机制。用类似口诀/定式记下一些基础的加减乘除开方平方因式分解之类的基础算子。然后通过短期记忆把计算结果拼出来

论坛助手,iPhone

莫夜戎 发表于 2026-2-20 13:09

是的，目前通用ai都不太能处理数独

fooltiger 发表于 2026-2-20 13:23

Rincewind 发表于 2026-2-20 12:09
不需要啊……又不是魔方，数独的推理比较直观，可以硬解的。

说得好像魔方不可以硬解一样，聊穷举法有意义吗。

数独也是有口诀有解题流程的，硬解难一点的题怕不是要解到天荒地老。

霍乱发表于 2026-2-20 13:36

Ai是一仓库功能齐全的尸体，还需要未来人类把它们做成弗兰肯斯坦的怪物

今晓天愁 发表于 2026-2-20 13:41

要不怎么说prompt工程呢实现你要的这个目的最好的办法是让ai写一个暴力求解代码

dreamill 发表于 2026-2-20 15:28

好几个llm井字棋都下不明白呢

wtwtwt21 发表于 2026-2-20 18:04

wtwtwt21 发表于 2026-2-20 18:05

yuki256 发表于 2026-2-20 19:59

gemini可以的，昨天刚试了

—— 来自 vivo V2454A, Android 16上的 S1Next-鹅版 v2.1.2

黑卷轴陶德传 发表于 2026-2-20 23:40

很正常啊，之前就有大模型AI打星际争霸不如游戏自带的脚本式AI，被疯狂的电脑打得满头包

orz100 发表于 2026-2-20 23:55

以前我觉得ai瞎说是为了提高随机性和为了更高效的回答问题选择了降低准确度。但是最近我越来越觉得纯粹是为了节约算力，一旦撞到思考深度的算力消耗阈值就开始给你瞎说

—— 来自 OnePlus KB2000, Android 11, 鹅球 v3.5.99

Rincewind 发表于 2026-2-21 18:31

fooltiger 发表于 2026-2-20 13:23
说得好像魔方不可以硬解一样，聊穷举法有意义吗。

数独也是有口诀有解题流程的，硬解难一点的题怕不是要 ...

不至于。
数独的逻辑很直观，魔方一点都不直观啊。

笨拙的机器人 发表于 2026-2-21 19:01

先区分是P还是NP

sunny_am 发表于 2026-2-21 20:11

会调工具大概就行

论坛助手,iPhone

小止发表于 2026-2-21 22:01

写微积分还挺强的，这是mit积分比赛的题目https://p.sda1.dev/30/9bf6a9a7c2dfb7867558d4c49f56f316/image.jpg

—— 来自 vivo V2405A, Android 16, 鹅球 v3.4.98

页: [1]

Stage1st's Archiver

原来AI不会做数独