找回密码
 立即注册
搜索
楼主: GN-010

[科技] 问一个纯粹的技术(学术?)问题,可以直接从数据得到因果吗?

[复制链接]
     
发表于 2025-7-22 02:40 来自手机 | 显示全部楼层
本帖最后由 诸葛天霜 于 2025-7-22 02:42 编辑

在计算机这边有个分支叫因果学习,就是在考虑怎么让ai判断是否有因果关系,常用的区分方法叫因果推断和干预实验,逻辑接近于控制变量
回复

使用道具 举报

发表于 2025-7-22 05:38 | 显示全部楼层
看学流行病学的朋友文章蹭蹭的发,大概在他们的体系里是能通过统计手段来通过数据推断因果?
从我长期做湿实验形成偏见来说,我是信不了一点这种
回复

使用道具 举报

     
发表于 2025-7-22 06:37 | 显示全部楼层
真正严格的“因为...所以...”只存在于数学中,自然科学好歹还能控制变量做实验,但这种基于实验得到的因果仍旧是基于经验和假设的推论。只不过通常人都能接受这个,并且通过实验得到的结论在实际生产生活中够用。不然就得回答休谟的老问题:我知道之前1万次(无穷大次)在通常情况下把水加热到100摄氏度都会烧开,并且有数据和记录支持,但是我们怎么能从之前的1万次水100度烧开推论出之后每次水到100度也会烧开?毕竟你没看到下一次水烧到100度的情况...所以要做假设,所有水的性质都一样,以前关于水的现象在之后也会稳定存在且复现,诸如此类...

至于“社会科学”,这个短语里面的科学和“自然科学”指的东西几乎完全不一样(至少在不能做实验的意义上如此),它讲的因果关系也完全不一样。社会科学最大的问题是你总不好随便拿社会过来做实验吧(但确实会有一些,叫什么randomized field treatment,但你不可能拿state/全人类来做实验,也不能为了搞社会科学研究人为制造社会灾难把),于是么社会科学的大量所谓因果都是统计检验意义上的,并且也建立在一套前提假设之上。

当然我看经济学帝国主义的那些人,不懂自己和普通人的隔阂,反倒颇以此沾沾自喜,经济学赶紧毁灭吧(
回复

使用道具 举报

     
发表于 2025-7-22 11:32 | 显示全部楼层
本帖最后由 Nanachi 于 2025-7-22 11:34 编辑
把自然科学的研究模式贸然应用到社会科学领域是很危险的,具体来说,是对 “印欧式的,基于形式逻辑的公理系统” 过于痴迷乃至迷信是非常危险的。

我以前多次说过,印欧式的基于形式逻辑的公理系统本质上相当于构建内部自洽的闭环架空世界,它被应用到自然科学领域并取得巨大成功是个偶然,而这种偶然成就带来的对该研究方式的过度推崇隐含着巨大的危险。

危险之一在于 “自洽” 很容易被与 “正确” 混同,而实际上两者是绝对不能相等的。印欧式公理系统很容易造成一个上不着天下不着地的虚拟世界,这个虚拟世界内部可以运行极度良好但它并不是真实的。

危险之二在于公理系统具有 “预言” 能力,也就是通过形式逻辑得到更多推论的能力。但是在自然科学领域,一个被 “预言” 的现象是能够立刻进行验证的(只要实验设计正确);而在社会科学领域,被预言的现象无法获得验证的借口可就多了——比如,“时间没到”,又比如,“人不行”。

可以想象一下,贸然用这种自然科学中常见的研究方式去处理社会科学,并依靠其进行方针制订和制度设计会是什么后果。那很可能会造成这样一种心态: “虽然我们的策略没有取得任何正面效果,甚至引发了大量负面效果,但我们的公理模型是高度自洽的。现在的困难局面,一定是因为某些因素还没有配合,只要再坚持一下...”

当今世界上许多国家和群体,恐怕都在干这种一条路走到黑的事。为什么许多大小共同体都在做一些明显与现实利益相违背的事?因为他们的目标,是追求实现某个 “公理系统” 得出的某个 “预言”。对他们来说,眼前的阻碍都不过是短痛罢了,如果你用现实中的不利情况去反对他们,很可能会被他们看成 “反对量子力学的人”。

这就是危险之三:公理系统的特点之一在于其许多推论 “反直觉”,而自然科学告诉我们:“反直觉的事也可能是正确的”。然而,在社会科学中也是这么回事吗?或者说,社会科学存在 “正确” 这个概念吗?

社会科学很可能根本不适合用公理系统进行演绎式研究,而只适合用结合 “即时反馈” 的归纳法来研究。企图从人类的心理活动中去建立 “公理” “定律” 之类的东西怕是想多了。(也许有一天可以建立,但那个时候人类对脑科学的掌握程度恐怕已经实现读心术和思想钢印了)

那个男人曾经指出,要反对本本主义,要实事求是。 “基于形式逻辑的公理系统” 恰恰是可以生成完全脱离现实的本本的


不好的评论我会删 的想法- 知乎
https://www.zhihu.com/pin/1919844993297802962
回复

使用道具 举报

发表于 2025-7-22 13:24 来自手机 | 显示全部楼层
真是经济学学生吗,我们从大一开始每个老师都在讲相关性不等于因果性,数学、经原、统计、计量什么课上都会听到老师强调,让我们以后千万别写出那种跑个回归看到显著就结论成立的学术大份。他们要真这么觉得可以来质疑一下我院学术水平。

—— 来自 鹅球 v3.3.96
回复

使用道具 举报

     
发表于 2025-7-22 14:03 | 显示全部楼层
Pearl把因果分析分成三个层次,分别是关联、干预和反事实,他工作最主要的就是说明什么情况下可以把带do算子,也就是带干预的参数,通过关联(比如条件概率)表示出来。当然做这些之前需要有一个casual graph,也就是分析问题中各个变量的关系结构,而从数据里估计casual graph,有启发式的也有deep learning based的很多工作

这样最终因果推理就分成关系挖掘和和effect estimation,在这个意义上,这两者都能做,而且这样估计出来的因果也确实是人理解的因果而不是格兰杰因果性之类的东西,只不过不一定准而已。

这些方法和计量经济学里用的除了复杂一点外没有什么本质的不同。但是说白了,你招了很多非理工科学生,她们可能不相信还原论,甚至不相信自然主义,而偏偏还越是这样的人越喜欢社会学,更可怕的是越是这样的人聚集的学科,结果还越不可验证,这么些个人像Feynman说的,做的事看起来是像那么回事,最后实际嘛……

评分

参与人数 2战斗力 +2 收起 理由
不定学研 + 1 学到了
笨拙的机器人 + 1

查看全部评分

回复

使用道具 举报

     
发表于 2025-7-22 14:15 | 显示全部楼层
Hydro 发表于 2025-7-21 11:34
不是很懂,但是似乎是有两种方向,我不清楚这两种方向学术上应该叫什么,纯抛砖
第一种几乎不依赖事实观察 ...

按皮尔斯的理论分别是deduction和abudction
回复

使用道具 举报

     
发表于 2025-7-22 14:49 | 显示全部楼层
这能争论就很弱智。

这个高速论文,那我不用建高速,我用蜜雪冰城门店数说雪王导致了这个结果行不行阿?

随便弄一个莫名其妙的事情,增长曲线差不多不都可以套,有关吗?信这种东西怕不是弱智
回复

使用道具 举报

     
发表于 2025-7-22 16:40 | 显示全部楼层
就我看论文的经验来说很多混子都有相关性就可以发表了
回复

使用道具 举报

     
发表于 2025-7-22 16:51 | 显示全部楼层
GN-010 发表于 2025-7-21 15:39
我感觉应该这样理解:

1. “相关性不等于因果性”适用的范围偏向自然科学,尤其是医药相关。经济学语境 ...

其实各学科内都有这种问题,比如工科不承认除了模拟实验外任何的证明过程
回复

使用道具 举报

     
发表于 2025-7-22 17:36 来自手机 | 显示全部楼层
楼上怎么这么多没上过学的,相关就是因果那还要因果检验干嘛,而且因果检验自身也有争议
回复

使用道具 举报

     
 楼主| 发表于 2025-7-22 18:36 来自手机 | 显示全部楼层
不会读经典 发表于 2025-7-22 13:24
真是经济学学生吗,我们从大一开始每个老师都在讲相关性不等于因果性,数学、经原、统计、计量什么课上都会 ...

直接给你看小红书某个帖子的原文吧,贴主认为论文的论证过程是严谨的,通过各种检验论证其中的因果关系确实成立的


22 Fro带你读论文发布了一篇小红书笔记,快来看吧! 😆 JoHvm3maNgCRejN 😆 http://xhslink.com/m/6SAkPDxExST 复制本条信息,打开【小红书】App查看精彩内容!
回复

使用道具 举报

     
发表于 2025-7-22 21:29 | 显示全部楼层
就事论事
这篇论文里有没有具体考证过有多少拐卖案的确使用了高速公路?
如果的确很多,那多少有些因果性在里面
就像我如果有一些不方便过火车安检的东西(模造刀),也会选择自驾运输。
回复

使用道具 举报

     
发表于 2025-7-22 22:03 | 显示全部楼层
thisism 发表于 2025-7-22 14:49
这能争论就很弱智。

这个高速论文,那我不用建高速,我用蜜雪冰城门店数说雪王导致了这个结果行不行阿?

你甚至可以用上野千鹤子的名字在互联网平台上被提及的次数做指标,得出女权思想横行导致拐卖儿童案件高发的结论
回复

使用道具 举报

     
发表于 2025-7-23 08:45 | 显示全部楼层
即便利用高速又怎样呢?
这弱智咋不去研究种族灭绝和化学研究的关系性?杀人案和冶金的关联性?铊中毒和科普的关联性?哦对了,还有上大学人数和傻逼论文数之间的关联性
回复

使用道具 举报

     
发表于 2025-7-23 09:40 | 显示全部楼层
两个关键字,因果推断 & 计量经济学
回复

使用道具 举报

     
发表于 2025-7-23 11:02 | 显示全部楼层
Liang-Kleeman信息流
这个结果也从数量上明确地告诉我们,因果关系意味着相关性,但反之则不然,解决了长期以来关于相关性与因果关系的争论。
回复

使用道具 举报

发表于 2025-7-24 15:08 | 显示全部楼层
回复

使用道具 举报

     
发表于 2025-7-24 15:49 | 显示全部楼层
可以的,因为项目了解过一些些皮毛,简单来说就是使用各种测试来验证因变量会因为哪些自变量而改变,如果多种测试都能得到同一结果基本可以认为是可信的因果关系,但是单纯的ML是做不到的,ML只是提取相关关系
回复

使用道具 举报

发表于 2025-7-24 16:22 | 显示全部楼层
就好比那个问题,为啥我国的一斤正好是500克?

单位是可以规定的,数字是可以玩弄的。
回复

使用道具 举报

     
发表于 2025-7-24 17:19 | 显示全部楼层
个人觉得能从数据反映出一定因果关系,但要看什么样的数据怎么取得,而且影响因果的不是仅有一组或几组数据,能把所有影响因果的数据全掌握并算明白的,我一般称之为神仙。
回复

使用道具 举报

     
发表于 2025-7-24 20:41 来自手机 | 显示全部楼层
https://bytedance.larkoffice.com/wiki/BzbOwLsfCiKCsWkFSgccOCnDnGh

看这个科普去理解

—— 来自 鹅球 v3.3.96-alpha
回复

使用道具 举报

     
 楼主| 发表于 2025-7-24 23:59 | 显示全部楼层
赤色彗星SEXY 发表于 2025-7-24 20:41
https://bytedance.larkoffice.com/wiki/BzbOwLsfCiKCsWkFSgccOCnDnGh

看这个科普去理解

虽然……但是……这个不是抖音小程序的开发文档吗……
回复

使用道具 举报

     
发表于 2025-7-25 11:55 来自手机 | 显示全部楼层
数科里面确实有基于数据的因果学习方面的研究。
但看了楼上讨论很难说讨论的是不是一个东西
回复

使用道具 举报

     
发表于 2025-7-25 18:16 来自手机 | 显示全部楼层
最近讨论因果关系有点多呀,今天微信开始给我推这个了
https://mp.weixin.qq.com/s/yWWYIQfGueDJg_JapPbGWw



回复

使用道具 举报

     
发表于 2025-7-25 18:19 来自手机 | 显示全部楼层
记得当年崔永元跑美国拍的纪录片也有个这种瞎用相关性的
回复

使用道具 举报

     
发表于 2025-7-26 14:02 | 显示全部楼层
GN-010 发表于 2025-7-24 23:59
虽然……但是……这个不是抖音小程序的开发文档吗……

不好意思贴错了

https://www.bilibili.com/video/BV1SzM2zDER6/
回复

使用道具 举报

发表于 2025-7-26 15:04 | 显示全部楼层
其实经济学里面不同细分方向关注的点也是很不一样的。

传统意义上的econ其实做的都是structural model,得出的结论都是有因果性的,这类研究对数据的要求不tough,因为只是用来帮忙验证模型的辅料,得出的结论也没有外部有效性。这块相对门槛也比较高,国内大多数老师和学生的水平么..emmm反正懂得都懂,只能说被大家诟病确实也不无道理。

主楼说的什么高铁还不什么的文章没看过,猜测应该是empirical范式下的研究。这类研究不同细分方向的关注点就很不一样,比如会计和金融文章的卖点就完全不一样,一个注重指标可靠性,一个注重故事的趣味/思考性,当然这么说可能并不是非常严谨,但是你要知道一篇文章其实很难做到尽善尽美,所以经常会有所取舍,很多时候结果到底满不满足因果性并不是考量的唯一标准。最具有代表性的方向就是asset pricing了,这块更是压根不在意什么狗屁因果,只要你因子能跑赢市场能盈利就行了,谁tm care你这些啊。

当然抛开这些不谈,就算是empirical范式学界里面也早就明确了相关≠因果这种正确的废话了,更别说学界内部早就有过Credibility Revolution,所以方法的严谨性已经进化了很多版本了,就连大家耳熟能详的did/rdd方法也更迭演化出了不知道多少个版本,相关内容的文章joe每年一堆一堆的都说明该问题的关注度并不低。所以虽然该文章我没看,但主楼里的一些观点我认为不是学界的问题,是某些人的问题...

然后回到标题“能否从数据得到因果”,显然从学术的角度上来说是完全可以的,当然学术上认可的因果到底是不是你认为的因果这又另一个话题了。但其实这种困惑想要解决并不复杂,找一两篇高质量的文章看一看想必你就能得出自己的答案。

总得来说目前学界认可的因果有两方面,一种就是econ里面传统的structural model得出来的结论,当然话又说回来其实这类文章得出来的结果到底有没有因果性压根也不是重点了...另一类就是empirical范式下基于因果推断方法做的一些研究,也认为可以得到具有因果性的结论。不过这类文章对于相关现实场景其实有着很严苛的要求,并不是随便什么话题拿过来都适用的。现实就是很多人为了发文章,把不适合的场景拿过来套用一些看上去比较fancy的方法以获取发表。但是这年头大家谁都不容易,你非要说这是整个学科的问题感觉也有点先画靶再射箭了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-24 23:51 , Processed in 0.132191 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表