原来AI不会做数独
看了几个吹自家AI的视频,我随便找个数独小游戏让这些AI解答结果基本都是只填一两行就开始瞎JB填,而且一格出错后就会无限循环换着几个错的数告诉你 你用llm肯定不行,但是做过专项训练的ai还是能解这类问题的 那么让AI写个解数独的代码准不准确呢 羊寢 发表于 2026-2-19 22:58
你用llm肯定不行,但是做过专项训练的ai还是能解这类问题的
这种所谓的专门训练真不是单纯扫储存库翻答案?
—— 来自 Xiaomi 23049RAD8C, Android 15, 鹅球 v3.5.99-alpha 我觉得AI做数学题都不太行,解题思路更像是死记硬背而不是真的在思考 我们找了一堆供应商,我看下来就没一家能好好处理和输出表格和图形的,都基本是提示词工程的雕花,现在来看llm对数据结构的理解还是不行
论坛助手,iPhone 语言只是思考的工具,而不是思考本身
LLM距离真正的人工智能还差一个质变 这种东西用liner attention的那这玩意更容易搞
—— 来自 鹅球 v3.4.97 月夜凝雪 发表于 2026-2-20 01:32
这种所谓的专门训练真不是单纯扫储存库翻答案?
—— 来自 Xiaomi 23049RAD8C, Android 15, 鹅球 v3.5.9 ...
ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?
—— 来自 S1Fun 我认为spec2017的548也算ai做数独,官方描述是这样的
548.exchange2_r 648.exchange2_s
Artificial Intelligence: recursive solution generator (Sudoku)
链接https://www.spec.org/cpu2017/Docs/
https://www.spec.org/cpu2017/Docs/benchmarks/548.exchange2_r.html
—— 来自 Xiaomi 22041211AC, Android 14, 鹅球 v3.5.99 不要把ai和llm混在一起啊(
—— 来自 鹅球 v3.5.99 卡仑治糖 发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?
—— 来自 S1Fun ...
AI和AI是不同的,现在流行的都是大语言模型,他只会做一件事:文字接龙 卡仑治糖 发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?
—— 来自 S1Fun ...
阿尔法GO不也是用棋谱训练了,当时的宣传,就是用了几百万个棋谱 卡仑治糖 发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?
—— 来自 S1Fun ...
专用和泛用的区别
其实我觉得现在好多人都在误用ai app,比如拿来给小孩解数学作业题 llm最好的用途我觉得目前只有“理解和转化语言(提示词)” 刚好之前看到过有人做过,不过是为了验证他的模型架构的长度外推能力....应该是生成大量题目利用已有的解数独算法生成大量数据...
PENG Bo的想法 - 知乎
https://www.zhihu.com/pin/1843005922013753344 LLM的数学能力和人类思维方式不同,即使简单的加减法也是靠上下文概率推算,不会遵从规则。例如两位数加减,人类会分别计算不同位数并考虑进位规则,LLM 会直接概率估算十(、百)位,再估算个位数,全程找不到激活规则的痕迹。概率估算的缺点就是计算次数堆加后出错概率就指数级上升。
数独、表格数据处理这些任务让 LLM 生成代码来解决更可靠,目前最多只能做到通过各类上下文 MCP、skills 提示让 LLM 做到遇到任务时调用生成好的代码。 人类做数独也要经过专门训练。 fooltiger 发表于 2026-2-20 10:36
人类做数独也要经过专门训练。
人类做数独也需要用其他工具生成代码是吧hhhh
是,甚至有大量的人由于脑内没有这个专门工具,训练了也不会玩数独。 歪个楼,github 上的 ice sudoku,可以分步求解 fooltiger 发表于 2026-2-20 10:36
人类做数独也要经过专门训练。
不需要啊……又不是魔方,数独的推理比较直观,可以硬解的。 感觉人脑计算也是语言机制。用类似口诀/定式记下一些基础的加减乘除开方平方因式分解之类的基础算子。然后通过短期记忆把计算结果拼出来
论坛助手,iPhone 是的,目前通用ai都不太能处理数独 Rincewind 发表于 2026-2-20 12:09
不需要啊……又不是魔方,数独的推理比较直观,可以硬解的。
说得好像魔方不可以硬解一样,聊穷举法有意义吗。
数独也是有口诀有解题流程的,硬解难一点的题怕不是要解到天荒地老。 Ai是一仓库功能齐全的尸体,还需要未来人类把它们做成弗兰肯斯坦的怪物 要不怎么说prompt工程呢 实现你要的这个目的最好的办法是让ai写一个暴力求解代码 好几个llm井字棋都下不明白呢 gemini可以的,昨天刚试了
—— 来自 vivo V2454A, Android 16上的 S1Next-鹅版 v2.1.2 很正常啊,之前就有大模型AI打星际争霸不如游戏自带的脚本式AI,被疯狂的电脑打得满头包 以前我觉得ai瞎说是为了提高随机性和为了更高效的回答问题选择了降低准确度。但是最近我越来越觉得纯粹是为了节约算力,一旦撞到思考深度的算力消耗阈值就开始给你瞎说
—— 来自 OnePlus KB2000, Android 11, 鹅球 v3.5.99 fooltiger 发表于 2026-2-20 13:23
说得好像魔方不可以硬解一样,聊穷举法有意义吗。
数独也是有口诀有解题流程的,硬解难一点的题怕不是要 ...
不至于。
数独的逻辑很直观,魔方一点都不直观啊。 先区分是P还是NP 会调工具大概就行
论坛助手,iPhone 写微积分还挺强的,这是mit积分比赛的题目https://p.sda1.dev/30/9bf6a9a7c2dfb7867558d4c49f56f316/image.jpg
—— 来自 vivo V2405A, Android 16, 鹅球 v3.4.98
页:
[1]