白话空间统计十三:零假设(补记)

说在前面的话:前面花了好多章来讲各种数据分析的方法和例子,突然发现我原来设想的主线乱了。我的设想是对空间统计进行科普型的描述,结果写到后面,特别是这几章(准确说是从填中位数中心的算法坑开始),幸好有吴道长果断提醒,说我偏离方向了,我才豁然省悟。再次友情感谢吴道长(PS:吴道长是GIS圈子里面古玩玩的最好的,古玩界里面,GIS技术最好的综合性人才)。所以从今天开始,我继续把空间统计里面那些绕口的理论变成大白话写给大家。

再贴一张这位老帅哥的相片:

零假设在统计里面,是用来干嘛的呢?

简单的说,零假设最早是为了解决瞎猜的问题。

看下面这个例子:

现在进入经典统计学里面的标准示例——丢硬币:

继续看例子,比如一个城市的犯罪事件,假设没有任何的附加条件,应该是这样的:

也就是城市的每个区域,他的犯罪率应该是相同的。嗯当然也有可能是这样:

也就是说,在城市任何一个角落,都有可能发生案件,也有可能不发生,完全是随机的。这与均匀分布不同的是,均匀分布是每个角落都有且只有一例(这是几乎不可能的)。相对来说,随机发生的可能性就大很多了,有可能这个区域一起都没有,也有可能连续发生好几起。

那么作为分析师,你首先要告诉我,拿到的这份数据是不是随机的,有没有随机的可能。如果是随机的,就说明罪犯是无目的的犯罪,走哪逮哪,完全靠瞎蒙。

无目的的犯罪是最麻烦的,罪犯没有目的的瞎蒙,,那么警察也只能跟着瞎蒙……

为了不瞎蒙,就要先进行数据的探索和分析了。

首先,假设罪犯就是无目的的犯罪,如果能够推翻这个假设,自然就证明了罪犯是有目的的,这样才可以进一步进行分析。

过程如下:

那么如何判定是否拒绝了零假设呢?这份数据是否随机呢?请回头去看把话空间统计第四章:P值和Z得分。

最后,总结一句话:我们做的所有计算,最后的目的就是为了推翻零假设,零假设的存在,就是为了让我们去拒绝的。

(看到这里,想到老夫就像零假设……被无数女生拒绝……遂有感而发)。

版权声明:本文为博主原创文章,未经博主允许不得转载。

我也相信爱可以排除万难;只是,万难之后,又有万难。这是我更相信的。

白话空间统计十三:零假设(补记)

相关文章:

你感兴趣的文章:

标签云: