找回密码
 立即注册
搜索
查看: 8344|回复: 38

[欢乐] 原来AI不会做数独

[复制链接]
     
发表于 2026-2-19 22:02 | 显示全部楼层 |阅读模式
看了几个吹自家AI的视频,我随便找个数独小游戏让这些AI解答
结果基本都是只填一两行就开始瞎JB填,而且一格出错后就会无限循环换着几个错的数告诉你
回复

使用道具 举报

头像被屏蔽
发表于 2026-2-19 22:54 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-19 22:58 来自手机 | 显示全部楼层
你用llm肯定不行,但是做过专项训练的ai还是能解这类问题的
回复

使用道具 举报

     
发表于 2026-2-19 22:59 | 显示全部楼层
那么让AI写个解数独的代码准不准确呢
回复

使用道具 举报

     
发表于 2026-2-20 01:32 来自手机 | 显示全部楼层
羊寢 发表于 2026-2-19 22:58
你用llm肯定不行,但是做过专项训练的ai还是能解这类问题的

这种所谓的专门训练真不是单纯扫储存库翻答案?

—— 来自 Xiaomi 23049RAD8C, Android 15, 鹅球 v3.5.99-alpha
回复

使用道具 举报

     
发表于 2026-2-20 01:34 | 显示全部楼层
我觉得AI做数学题都不太行,解题思路更像是死记硬背而不是真的在思考
回复

使用道具 举报

     
发表于 2026-2-20 01:57 | 显示全部楼层
我们找了一堆供应商,我看下来就没一家能好好处理和输出表格和图形的,都基本是提示词工程的雕花,现在来看llm对数据结构的理解还是不行

论坛助手,iPhone
回复

使用道具 举报

发表于 2026-2-20 03:22 来自手机 | 显示全部楼层
语言只是思考的工具,而不是思考本身
LLM距离真正的人工智能还差一个质变
回复

使用道具 举报

发表于 2026-2-20 05:54 来自手机 | 显示全部楼层
这种东西用liner attention的那这玩意更容易搞

—— 来自 鹅球 v3.4.97
回复

使用道具 举报

     
发表于 2026-2-20 08:11 | 显示全部楼层
月夜凝雪 发表于 2026-2-20 01:32
这种所谓的专门训练真不是单纯扫储存库翻答案?

—— 来自 Xiaomi 23049RAD8C, Android 15, 鹅球 v3.5.9 ...

ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2026-2-20 08:17 来自手机 | 显示全部楼层
我认为spec2017的548也算ai做数独,官方描述是这样的
548.exchange2_r        648.exchange2_s
Artificial Intelligence: recursive solution generator (Sudoku)
链接https://www.spec.org/cpu2017/Docs/
https://www.spec.org/cpu2017/Docs/benchmarks/548.exchange2_r.html

—— 来自 Xiaomi 22041211AC, Android 14, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-20 08:21 来自手机 | 显示全部楼层
不要把ai和llm混在一起啊(

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-20 08:30 | 显示全部楼层
卡仑治糖 发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?

—— 来自 S1Fun ...

AI和AI是不同的,现在流行的都是大语言模型,他只会做一件事:文字接龙
回复

使用道具 举报

     
发表于 2026-2-20 10:15 | 显示全部楼层
卡仑治糖 发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?

—— 来自 S1Fun ...

阿尔法GO不也是用棋谱训练了,当时的宣传,就是用了几百万个棋谱
回复

使用道具 举报

     
发表于 2026-2-20 10:20 | 显示全部楼层
卡仑治糖 发表于 2026-2-20 08:11
ai 十几年前围棋和象棋都能破解,这种简单计算问题还需要看参考答案?

—— 来自 S1Fun ...

专用和泛用的区别
回复

使用道具 举报

     
发表于 2026-2-20 10:22 | 显示全部楼层
其实我觉得现在好多人都在误用ai app,比如拿来给小孩解数学作业题
回复

使用道具 举报

     
发表于 2026-2-20 10:24 来自手机 | 显示全部楼层
llm最好的用途我觉得目前只有“理解和转化语言(提示词)”
回复

使用道具 举报

     
发表于 2026-2-20 10:27 | 显示全部楼层
刚好之前看到过有人做过,不过是为了验证他的模型架构的长度外推能力....应该是生成大量题目利用已有的解数独算法生成大量数据...
PENG Bo的想法 - 知乎
https://www.zhihu.com/pin/1843005922013753344
回复

使用道具 举报

     
发表于 2026-2-20 10:29 来自手机 | 显示全部楼层
LLM的数学能力和人类思维方式不同,即使简单的加减法也是靠上下文概率推算,不会遵从规则。例如两位数加减,人类会分别计算不同位数并考虑进位规则,LLM 会直接概率估算十(、百)位,再估算个位数,全程找不到激活规则的痕迹。概率估算的缺点就是计算次数堆加后出错概率就指数级上升。

数独、表格数据处理这些任务让 LLM 生成代码来解决更可靠,目前最多只能做到通过各类上下文 MCP、skills 提示让 LLM 做到遇到任务时调用生成好的代码。
回复

使用道具 举报

     
发表于 2026-2-20 10:36 来自手机 | 显示全部楼层
人类做数独也要经过专门训练。
回复

使用道具 举报

     
发表于 2026-2-20 11:02 | 显示全部楼层
fooltiger 发表于 2026-2-20 10:36
人类做数独也要经过专门训练。

人类做数独也需要用其他工具生成代码是吧hhhh
回复

使用道具 举报

     
发表于 2026-2-20 11:25 来自手机 | 显示全部楼层
是,甚至有大量的人由于脑内没有这个专门工具,训练了也不会玩数独。
回复

使用道具 举报

     
发表于 2026-2-20 12:08 | 显示全部楼层
歪个楼,github 上的 ice sudoku,可以分步求解
回复

使用道具 举报

     
发表于 2026-2-20 12:09 来自手机 | 显示全部楼层
fooltiger 发表于 2026-2-20 10:36
人类做数独也要经过专门训练。

不需要啊……又不是魔方,数独的推理比较直观,可以硬解的。
回复

使用道具 举报

发表于 2026-2-20 12:25 | 显示全部楼层
感觉人脑计算也是语言机制。用类似口诀/定式记下一些基础的加减乘除开方平方因式分解之类的基础算子。然后通过短期记忆把计算结果拼出来

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-2-20 13:09 | 显示全部楼层
是的,目前通用ai都不太能处理数独
回复

使用道具 举报

     
发表于 2026-2-20 13:23 来自手机 | 显示全部楼层
Rincewind 发表于 2026-2-20 12:09
不需要啊……又不是魔方,数独的推理比较直观,可以硬解的。

说得好像魔方不可以硬解一样,聊穷举法有意义吗。

数独也是有口诀有解题流程的,硬解难一点的题怕不是要解到天荒地老。
回复

使用道具 举报

     
发表于 2026-2-20 13:36 来自手机 | 显示全部楼层
Ai是一仓库功能齐全的尸体,还需要未来人类把它们做成弗兰肯斯坦的怪物
回复

使用道具 举报

     
发表于 2026-2-20 13:41 | 显示全部楼层
要不怎么说prompt工程呢 实现你要的这个目的最好的办法是让ai写一个暴力求解代码
回复

使用道具 举报

     
发表于 2026-2-20 15:28 来自手机 | 显示全部楼层
好几个llm井字棋都下不明白呢
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-20 18:04 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2026-2-20 18:05 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2026-2-20 19:59 来自手机 | 显示全部楼层
gemini可以的,昨天刚试了

—— 来自 vivo V2454A, Android 16上的 S1Next-鹅版 v2.1.2
回复

使用道具 举报

发表于 2026-2-20 23:40 | 显示全部楼层
很正常啊,之前就有大模型AI打星际争霸不如游戏自带的脚本式AI,被疯狂的电脑打得满头包
回复

使用道具 举报

     
发表于 2026-2-20 23:55 来自手机 | 显示全部楼层
以前我觉得ai瞎说是为了提高随机性和为了更高效的回答问题选择了降低准确度。但是最近我越来越觉得纯粹是为了节约算力,一旦撞到思考深度的算力消耗阈值就开始给你瞎说

—— 来自 OnePlus KB2000, Android 11, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-21 18:31 来自手机 | 显示全部楼层
fooltiger 发表于 2026-2-20 13:23
说得好像魔方不可以硬解一样,聊穷举法有意义吗。

数独也是有口诀有解题流程的,硬解难一点的题怕不是要 ...

不至于。
数独的逻辑很直观,魔方一点都不直观啊。
回复

使用道具 举报

     
发表于 2026-2-21 19:01 来自手机 | 显示全部楼层
先区分是P还是NP
回复

使用道具 举报

发表于 2026-2-21 20:11 | 显示全部楼层
会调工具大概就行

论坛助手,iPhone
回复

使用道具 举报

     
发表于 2026-2-21 22:01 来自手机 | 显示全部楼层
写微积分还挺强的,这是mit积分比赛的题目

—— 来自 vivo V2405A, Android 16, 鹅球 v3.4.98
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-25 09:57 , Processed in 0.151332 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表