Statistics-1-研究方法入门

1、定义抽象概念

很多抽象的概念无法直接定义，比如什么叫幸福、什么是记忆力好……所以，对于抽象的概念可以运用统计的方式进行描述。

2、操作定义

为了描述某些抽象概念，可以定制一套相关联的操作来具体量化它们。将构造（constructs）或抽象转变为我们可衡量的变量的方式，用我们衡量它的方式描述变量的方式。

3、数据

有了可操作的方法，就可以根据这些操作来得到抽象概念关联的数据，进而根据数据分析这些抽象概念。

总体参数（如 mu 或 $\mu$）
- 用来描述整个总体的值，也就是抽样总体的平均得分。
样本统计量（如 X-bar 或 $\bar{x}$）
- 用来描述样本的值；我们使用统计量来估计总体参数。估计值是我们对总体参数的最佳猜测。所以，我们可以使用 $\bar{x}$ 来估计 $\mu$。
抽样误差
- 统计量与总体参数间往往有一定差值，毕竟是估算，差值在所难免，两者间的差值叫做抽样误差。所以，在进行估算时，一定要有良好的样本
为使样本统计数据的平均值 X 更接近于总体参数 μ，要使用更大样本量，而且样本要尽可能随机且无偏差
- 样本量越大就越接近真实的平均值

这种根据样本的情况，去推测总体的方式其实就是逻辑学中的‘归纳推理’，从一部分的情况推测出整体的情况。但这种推理往往会忽视整体中其他部分的情况或者以少数样本推测整体，都会出现结论的不准确，因此尽可能保证样本的随机、全面、有代表性，是保证这种方式可靠的前提，即使保证了几个条件，得出的结论仍然可能是不准确的，只能证明因素和结果间有联系，不能一定证明是有因果联系。

4、随机样本

每个对象被选中的概率是一样的，因此存在偏见的概率较小。

统计过程中也往往会存在很多潜在的变量或影响因素，因此，在进行样本选择时，外部因素相同的越多越有利于统计。

原则
- 以选中概率相同的方式选择个体。
- 以选中一个个体不会影响另一个个体被选中几率的方式选择个体

5、结果展示

选择而一种良好的结果呈现方式，将有利于得到正确的结论。

6、结果真假性

因为统计中可能存在很多潜在因素，即不可预知的变量存在，所以，对于结果的可靠性并不是绝对的，只是有参考价值，并不一定具有因果关系。两个变量相关并不意味着其中一个是另一个发生的原因。

金拱理论”（Golden Arches Theory，也被称为金拱门理论），两个拥有麦当劳分店的国家根本不会互相宣战”。此理论就是根据统计得出，然而人类冲突是非常复杂的，无法仅由一个单方面的因素解释。

统计出来的调查结果只能说明变量和结果间存在一定的关系，但不能说是绝对的，需要经过控制变量的实验才能得出，也就是进行变量的对照。

潜在因素
- 可为变量之间观察到的关系提供可能的另一种解释
- 是会影响我们衡量的两个或多个变量之间关系的因素
- 在我们做出确定的因果声明之前，必须在试验中加以控制
- 使从观察性研究的数据中确定因果关系变得困难

7、问卷调查

调查问卷是一种经常用到的方法，通过调查问卷展开调查有诸多好处：

它是了解总体的最简单方式之一
相对来说成本较低
可以远程进行
任何人都可以访问并分析调查结果

当然，调查问卷的方式也有诸多的弊端：

不真实的回答
- 虽然问卷是匿名的，但是很多人也因为不可知的原因不愿意回答或提供不真实的答案
有偏见的回答
参与者没理解问题的意思
- 一旦参与者没完全理解问题，那我们得到的答案就叫做应答偏差。
参与者拒绝回答

所以，在指定调查问卷时，一定要措辞良好，言辞清晰。

8、对照试验

保证除了其中一个因素外的其他因素都相同，设立多个组（至少两个），就可以观察出待检验的因素对于结果的影响。

单盲
- 如果研究者担心被测试者知道自己接受的是何种测试，可能会影响到他们的行为时，研究者就会采取单盲法，即不告诉被测试者正在被测试哪个因素或接受的何种变量控制。
双盲
- 参与者和研究者都不知道正在测试哪个变量或哪些人接受了哪些变量，这样可以避免研究者做出片面的判断。

在进行对照试验时，应让样本随机分布或随机选取被测试者，以避免其他隐藏的因素对于结果的影响。

试验是检测因果关系最有效的方式，经过精心设计和控制的试验可以得出因果关系的结论。