什么是“贝叶斯统计”?如何评价脑科学研究专家乔纳·莱勒将“贝叶斯统计”的手段引入心理学? - 知乎

统计专业,看到这段感觉槽点太多,简单喷一下,心理学小白,有错误还请各位大大指出。。

首先我们来看看原文 http://www.psychologytoday.com/blog/ulterior-motives/201012/ten-advances-in-psychological-science-in-2010

**

The use of Bayesian Statistics**. In a December article in The New Yorker, Jonah Lehrer pointed out that some phenomena in the psychology literature are not always repeatable. One reason for this failure to replicate results comes from the kinds of statistics often used in Psychology. We use a procedure called Null Hypothesis Testing that was developed over 100 years ago. More recently, statisticians and psychologists have been working to create a new form of statistical testing based on Bayesian statistics. These methods may help us to avoid publishing studies that are not likely to replicate. John Kruschke published a nice tutorial on how to use these methods.

第一个疑点,这里的Jonah Lehrer很明显就是中文版里的乔纳·莱勒,这里只是说他再new yorker发了一篇文章,并没有说是哪里的教授。当然年轻的AP在New Yorker发科普文章并不罕见,虽然一般都会清楚标注出来“这是专家不是我们专栏作家”好推销。。

于是我们来google一下这位Jonah Lehrer:
- 个人主页:http://www.jonahlehrer.com/about/
人家主页上自己都说了I'm a writer哪来什么心理学教授的事。。。

- wiki页面:Jonah Lehrer(wiki墙内搬运工不谢)

**Jonah Richard Lehrer
**(born June 25, 1981) is an American author, journalist, blogger, and speaker who writes on the topics of psychology,neuroscience, and the relationship between science and the humanities. He has published three books, two of which, Imagine and How We Decide_, were withdrawn from the market by publishers after it became known that Lehrer had fabricated quotations. This led to his resignation from his staff position at The New Yorker following disclosures that he had recycled earlier work of his own for the magazine. A later investigation atWired.com_, where he had previously worked, found instances of recycled content and plagiarism. He was fired from that position as a result of the investigation.

实在还不信的话去Indiana U心理系的网站(FACULTY DIRECTORY: Department of Psychological and Brain Sciences: Indiana University Bloomington)看看也能发现没有名字类似的人,所以到这里基本可以确定至少这个“中国心理学会”的翻译有很大问题。【如果确有此人的话请告知下啦我就删掉这部分】

然后再看看原文里的December article, 这个文章是2010年12.17发表的,说的12月应该就是当年12月,google一下不难发现应该是这篇:The Truth Wears Off, 貌似涉及统计的地方不太多,连bayesian这个词都没有出现,大部分是给lay people看的心理学内容不大想看了。。谁看完觉得有用再写答案吧。。

看到这里是不是觉得这篇翻译各种原创?其实也不尽然,注意在原文最后一句给了一个bayesian statistics的链接,打开一看是Amazon上一本Bayesian statistics的书(万恶的广告),乍一看也不算什么心理学的突破,只不过把统计上的各种Bayesian方法和怎么在R和winbugs里用归纳总结了一下而已,简单说就是一本软件使用手册。。。。

不过注意看一下作者,John K. Kruschke, 哈,这才是传说中的印第安纳大学心理系教授,什么“乔纳·莱勒”害我找半天。。。

publication list拿好不谢:John K. Kruschke, Publications, orz一大堆发表在名字里带cognitive science的地方,按照这个翻译的原创(niao)性(xing), 鬼知道哪个是他说的认知科学和“革命性成果”?

大概翻了下list,找了一篇最像introductory的文章(http://www.indiana.edu/~kruschke/articles/Kruschke2010WIRES.pdf)看了下,基本就是在说一件事,frequentist的null hypothesis significance testing(原来在心理学上有NHST这么萌的缩写一开始没仔细看还以为是什么很高大上的东西@v@)是和researcher的问题有关的,也就是说你要做一个hypothesis testing,你要先确定下来一个hypothesis,再根据这个hypothesis去收集数据,然后model要满足你收集数据的方法。拉出来文章里一个例子,比如说我有几个对照组,每个组collect data一直collect到有6个data point,和我每个组collect data两个月然后得到了正好和前一个方法一样的data,这样虽然data完全一样,但是因为data collection的方式,也就是背后的assumption不一样,所谓的p-value要用不同的方法计算。

后面还有一些其他例子,大致上就是说hypothesis testing是与hypothesis有关的(这不废话嘛orz),很多时候类似的结论其实可以是不同的hypothesis然后就可能有不同的p-value,和正好相反的答案。比如后面那个treatment vs placebo的例子就挺有趣,有兴趣的自己看吧,太长了懒得搬运了。。。

那么回到题主的问题,Bayesian statistics牛逼之处在哪?

For the record, 要把bayesian和frequentist划清界限的话我是一个Bayesian,但是我还是告诉你,不牛逼,bayesian能干的frequentist几乎都能干,只不过大部分时间用bayesian干更简单,方便,直观。也就是常说的简单粗暴。。。

当然Bayesian stat也并不是比frequentist低级,只不过方法比较统一而已,背后的理论一点都不浅显。。。扯远了,回到这个地方,为什么这里说Bayesian比Frequentist好呢?个人觉得,不是Frequentist不好,而是对于没有受过proper statistics training的人来说frequentist的东西太容易用错或者错误的解读。比如上面文章里的各种例子,黑了hypothesis testing这么大段,但是“你你你你你用错了我干嘛还要怪我不好嘛”(╯‵□′)╯︵┻━┻

至于为什么推崇bayesian,我倒觉得写的有点无厘头了,不过就是说Bayesian的方法可以直接去估计想要的问题,然后把所有assumption都量化成了variable,有了一个generative model之后很多data collection的问题就没关系了。但是我好奇作者就这么不care如果选prior的问题,换个prior整个model不也是会变?可能实际应用大家也不care prior哪个能conjugate就用哪个,大不了就用weak prior。。。。

【啊上面一吐槽不小心用了一些专业词汇,自行google吧这玩意都讲清楚太费劲。。】

总之呢,这个John Kruschke大大看来是个铁杆bayesian无疑了,说的也挺实在的,也不是没有道理,统计狗从大一开始学hypothesis testing学到grad还在学还在不断犯错,怎么能指望每个系的RA们都上一门intro to stat就完全掌握处理数据的特别技巧?

跑题千里之后拉回来一句,什么叫心理学里的“强烈的不确定性”,我觉得这里说的意思是“各种因为不太懂统计而返的错误”,为什么要用Bayesian呢,就是“不太懂这些统计也能看看书一秒脱离小白的简单粗暴统计学”。当然啦,这个说法当然是不对的,经典统计有经典统计的好处,Bayesian有Bayesian的优点,要说有什么不确定性经典统计处理不了只有Bayesian能处理还真不是这样,只不过大部分时间后者相对简单不容易犯严重错误罢了。

至于那个拙劣的翻译,前半段什么“百人百样”完全是错误理解原文。原文我认为说的是实验结果不是repeatable,因为同一个data set因为hypothesis不一样可以得到不同的结论,但是interpret的时候不仔细对应自己的hypothesis的话就可能说错,别人按照你说的结论去重复你的计算就会发现没法reproduce。(当然那个psychology today的文章写得也不明不白的。。所以到底写这篇十大发展是想表达什么意思我也存疑)

最后,至于“革命性”,噢哈哈哈哈哈看的那里我真的笑了,对于用Bayesian就能叫“革命性”的领域,我只能说,请放着我来!


Original url: Access

Created at: 2018-09-28 12:01:24

Category: default

Tags: none

请先后发表评论
  • 最新评论
  • 总共0条评论