@@ -22,11 +22,11 @@ kernelspec:
22
22
23
23
这些美丽的定理是许多计量经济学和定量经济模型的基础。
24
24
25
- 本讲座围绕模拟进行,展示了大数定律和中心极限定理的实际操作 。
25
+ 本讲座围绕模拟进行,用实践展示大数定律和中心极限定理的核心思想 。
26
26
27
- 我们还将演示当所依赖的假设不成立时,大数定律和中心极限定理如何失效 。
27
+ 我们还将演示当假设不成立时,大数定律和中心极限定理会如何失效 。
28
28
29
- 本讲将关注单变量情况(多变量情况在 [ 更高级的讲座中处理 ] ( https://python.quantecon.org/lln_clt.html#the-multivariate-case ) )。
29
+ 本讲将关注单变量情况(多变量情况我们在 [ 更高级的讲座中 ] ( https://python.quantecon.org/lln_clt.html#the-multivariate-case ) 讨论 )。
30
30
31
31
我们将需要以下导入:
32
32
@@ -48,7 +48,7 @@ plt.rcParams['font.family'] = ['Source Han Serif SC']
48
48
``` {index} single: Law of Large Numbers
49
49
```
50
50
51
- 我们从大数定律开始讲起,该定律说明在什么条件下样本平均值会收敛到它们的总体平均值 。
51
+ 我们从大数定律开始讲起,该定律说明在什么条件下样本均值会收敛到它们的总体均值 。
52
52
53
53
### 大数定律的应用
54
54
@@ -57,7 +57,7 @@ plt.rcParams['font.family'] = ['Source Han Serif SC']
57
57
``` {prf:example}
58
58
:label: lln_ex_ber
59
59
60
- 考虑一个参数为 $p$ 的[伯努利随机变量](https://en.wikipedia.org/wiki/Bernoulli_distribution ) $X$。
60
+ 考虑一个参数为 $p$ 的[伯努利随机变量](https://baike.baidu.com/item/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83/1442377 ) $X$。
61
61
62
62
这意味着 $X$ 的取值在 $\{0,1\}$ 中,且 $\mathbb P\{X=1\} = p$。
63
63
@@ -83,11 +83,12 @@ p = 0.8
83
83
X = st.bernoulli.rvs(p)
84
84
print(X)
85
85
```
86
- 在这个场景中,大数定律告诉我们如果我们多次投掷硬币,我们看到的正面比例将接近均值 $p$。
86
+
87
+ 在这个场景中,大数定律告诉我们,如果我们多次投掷硬币,硬币落在“正面”的比例将接近均值 $p$。
87
88
88
89
我们使用 $n$ 来表示投掷硬币的次数。
89
90
90
- 让我们检查一下 :
91
+ 让我们查看一下实验的结果 :
91
92
92
93
``` {code-cell} ipython3
93
94
n = 1_000_000
@@ -103,19 +104,19 @@ X_draws = st.bernoulli.rvs(p, size=n)
103
104
print(X_draws.mean())
104
105
```
105
106
106
- 让我们将这个讨论与上面的讨论联系起来,我们说的样本平均值收敛于“群体平均值” 。
107
+ 让我们将这个讨论与我们前面说的样本均值收敛于“总体均值”联系起来 。
107
108
108
109
想象 $X_1, \ldots, X_n$ 是独立的投掷硬币行为。
109
110
110
- 群体平均值是在无限样本中的平均值 ,等于期望 $\mathbb E X$。
111
+ 总体均值是在无限样本中的平均值 ,等于期望 $\mathbb E X$。
111
112
112
- 抽样的平均值义 $X_1, \ldots, X_n$ 是
113
+ 抽样的样本均值 $X_1, \ldots, X_n$ 是
113
114
114
115
$$
115
116
\bar X_n := \frac{1}{n} \sum_{i=1}^n X_i
116
117
$$
117
118
118
- 在这种情况下,它是等于一的抽样的比例(正面的数量除以 $n$)。
119
+ 在这种情况下,它是等于一的抽样的比例(硬币落在“正面”的次数除以 $n$)。
119
120
120
121
因此,大数定律告诉我们对于上述伯努利试验
121
122
131
132
(lln_ksl)=
132
133
### 大数定律的陈述
133
134
134
- 让我们更仔细地阐述大数定律。
135
+ 让我们更仔细地阐述大数定律(Law of Large Number, LLN) 。
135
136
136
137
设 $X_1, \ldots, X_n$ 是随机变量,它们都具有相同的分布。
137
138
148
149
\mathbb P\{a \leq X_i \leq b\} = \int_a^b f(x) dx
149
150
$$
150
151
151
- (对于离散情况,我们需要用概率质量函数替换密度 ,并用求和替换积分。)
152
+ (对于离散情况,我们需要用概率质量函数替换概率密度函数 ,并用求和替换积分。)
152
153
153
154
让 $\mu$ 表示这个样本的共同平均值。
154
155
179
180
180
181
这里
181
182
182
- * IID 表示独立同分布
183
+ * IID 表示独立同分布,并且
183
184
* $\mathbb E |X| = \int_ {-\infty}^\infty |x| f(x) dx$
184
185
185
186
186
187
### 关于定理的评论
187
188
188
189
定理中的概率为一是什么意思?
189
190
190
- 我们尝试从模拟的角度来考虑,假设一下我们的计算机可以生成完美的随机样本(尽管事实上这[ 并非严格真实] ( https://en.wikipedia.org/wiki/Pseudorandom_number_generator ) )。
191
+ 我们尝试从模拟的角度来考虑,假设一下我们的计算机可以生成完美的随机样本(尽管事实上这[ 并非严格真实] ( https://baike.baidu.com/item/%E4%BC%AA%E9%9A%8F%E6%9C%BA%E6%95%B0%E5%8F%91%E7%94%9F%E5%99%A8/20835345 ) )。
191
192
192
193
同时假设我们可以生成无限序列,从而使得 $\bar X_n \to \mu$ 能够得到评估。
193
194
194
- 在这种设置下,{eq}` lln_as ` 应该被理解为计算机生成一个 $\bar X_n \to \mu$ 失败发生的概率是零 。
195
+ 在这种设置下,{eq}` lln_as ` 应该被理解为计算机生成一个没有满足 $\bar X_n \to \mu$ 的序列的概率是零 。
195
196
196
197
### 示例说明
197
198
198
199
``` {index} single: Law of Large Numbers; Illustration
199
200
```
200
201
201
- 让我们使用模拟来说明大数定律(LLN) 。
202
+ 让我们使用模拟来说明大数定律。
202
203
203
204
在说明它时,我们将使用一个关键思想:样本均值 $\bar X_n$ 本身是一个随机变量。
204
205
@@ -219,13 +220,13 @@ $\bar X_n$ 是随机变量的原因是它是随机变量 $X_1, \ldots, X_n$ 的
219
220
220
221
数组 ` sample_means ` 现在将包含 $m$ 次抽取的随机变量 $\bar X_n$。
221
222
222
- 如果我们对 $\bar X_n$ 的这些观测做直方图,我们应该看到它们聚集在总体平均值 $\mathbb E X$ 周围。
223
+ 如果我们对 $\bar X_n$ 的这些观测值做直方图,我们应该看到它们聚集在总体均值 $\mathbb E X$ 周围。
223
224
224
- 此外,如果我们在更大的 $n$ 值下重复这个练习,我们应该看到观测结果更紧密地聚集在总体平均值周围 。
225
+ 此外,如果我们在更大的 $n$ 值下重复这个练习,我们应该看到观测结果更紧密地聚集在总体均值周围 。
225
226
226
- 这实质上就是 LLN 告诉我们的内容 。
227
+ 这实质上就是大数定律告诉我们的内容 。
227
228
228
- 为了实现这些步骤,我们将使用函数 。
229
+ 为了实现这些步骤,我们将使用几个函数 。
229
230
230
231
我们的第一个函数生成给定分布的大小为 $n$ 的样本均值。
231
232
@@ -279,7 +280,7 @@ generate_histogram(X_distribution, n=1_000, m=1000)
279
280
280
281
我们将使用[ 小提琴图] ( https://intro.quantecon.org/prob_dist.html#violin-plots ) 来显示不同的分布。
281
282
282
- 小提琴图中的每一个分布代表着某个 $n$ 的 $X_n$ 分布,通过模拟计算得到 。
283
+ 小提琴图中的每一个分布代表着通过模拟计算得到的某个 $n$ 的 $X_n$ 分布。
283
284
284
285
``` {code-cell} ipython3
285
286
def means_violin_plot(distribution,
@@ -332,13 +333,13 @@ means_violin_plot(st.beta(6, 6))
332
333
333
334
我们必须关注大数定律陈述中的假设。
334
335
335
- 如果这些假设不成立,那么大数定律可能会失败 。
336
+ 如果这些假设不成立,那么大数定律可能会不成立 。
336
337
337
- ### 无限的第一矩
338
+ ### 无限的一阶矩
338
339
339
- 如定理所示,当 $\mathbb E |X|$ 不是有限的时候,大数定律可以失败 。
340
+ 如定理所示,当 $\mathbb E |X|$ 不是有限的时候,大数定律可以不成立 。
340
341
341
- 我们可以使用[ 柯西分布] ( https://zh.wikipedia.org/wiki /%E6%9F%AF%E8%A5%BF%E5%88%86%E5%B8%83 ) 来证明这一点。
342
+ 我们可以使用[ 柯西分布] ( https://baike.baidu.com/item /%E6%9F%AF%E8%A5%BF%E5%88%86%E5%B8%83/5021907 ) 来证明这一点。
342
343
343
344
柯西分布具有以下性质:
344
345
@@ -348,13 +349,13 @@ means_violin_plot(st.beta(6, 6))
348
349
349
350
因此大数定律不成立。
350
351
351
- 这里大数定律失败是因为柯西分布违反了假设 $\mathbb E|X| < \infty$。
352
+ 这里大数定律不成立是因为柯西分布违反了假设 $\mathbb E|X| < \infty$。
352
353
353
354
+++
354
355
355
- ### IID 条件的失败
356
+ ### IID 条件的失效
356
357
357
- LLN 可能因违反 IID 假设而不成立。
358
+ 大数定律可能因违反 IID 假设而不成立。
358
359
359
360
``` {prf:example}
360
361
:label: lln_ex_fail
371
372
\bar{X}_n = \frac{1}{n} \sum_{i=1}^n X_i = X_0 \sim N(0,1)
372
373
$$
373
374
374
- 因此,$ \bar{X}_n$ 的分布对所有 $n$ 都是 $N(0,1)$!
375
+ 因此,对所有 $n$ ,$ \bar{X}_n$ 的分布都是 $N(0,1)$!
375
376
```
376
377
377
- 这是否与 LLN 相矛盾,LLN 表明 $\bar{X}_ n$ 的分布将收敛至单点 $\mu$?
378
+ 这是否与表明 $\bar{X}_ n$ 的分布将收敛至单点 $\mu$ 的大数定律相矛盾 ?
378
379
379
380
不,LLN 是正确的——问题在于其假设未被满足。
380
381
383
384
``` {note}
384
385
:name: iid_violation
385
386
386
- 尽管在这种情况下,IID 的违反破坏了 LLN ,但*有*的情况下即使 IID 失败 LLN 仍然成立 。
387
+ 尽管在这种情况下,IID 的违反破坏了大数定律 ,但*存在*某些情况下即使 IID 失败大数定律仍然成立 。
387
388
388
389
我们将在[练习](lln_ex3)中展示一个例子。
389
390
```
395
396
``` {index} single: Central Limit Theorem
396
397
```
397
398
398
- 接下来,我们来讨论中心极限定理(CLT),它告诉我们样本均值与总体均值之间的偏差的分布情况。
399
+ 接下来,我们来讨论中心极限定理(Central Limit Theorem, CLT),它告诉我们样本均值与总体均值之间的偏差的分布情况。
399
400
400
401
### 定理的陈述
401
402
@@ -417,16 +418,16 @@ n \to \infty
417
418
```
418
419
````
419
420
420
- 这里的 $\stackrel { d } { \to } N(0, \sigma^2)$ 表示[ 分布收敛] ( https://en.wikipedia.org/wiki/Convergence_of_random_variables#Convergence_in_distribution ) 到以 0 为均值且标准差为 $\sigma$ 的正态分布。
421
+ 这里的 $\stackrel { d } { \to } N(0, \sigma^2)$ 表示[ 分布收敛] ( https://baike.baidu.com/item/%E4%BE%9D%E5%88%86%E5%B8%83%E6%94%B6%E6%95%9B/19127365 ) 到以 0 为均值且标准差为 $\sigma$ 的正态分布。
421
422
422
- CLT 的惊人含义是,对于任何具有有限[ 二阶矩] ( https://en.wikipedia.org/wiki/Moment_(mathematics) ) 的分布,简单地添加独立副本总是会得到高斯 (正态)曲线。
423
+ CLT 的惊人含义是,对于任何具有有限[ 二阶矩] ( https://baike.baidu.com/item/%E7%9F%A9/22856460 ) 的分布,简单地添加独立样本总是会得到高斯 (正态)曲线。
423
424
424
425
425
426
426
427
427
428
### 模拟 1
428
429
429
- 由于中心极限定理(CLT)几乎像魔法一样,运行验证其含义的模拟是构建理解的一种好方法 。
430
+ 由于中心极限定理几乎像魔法一样,运行验证其含义的模拟是辅助理解的好方法 。
430
431
431
432
为此,我们现在进行以下模拟:
432
433
@@ -437,7 +438,7 @@ CLT 的惊人含义是,对于任何具有有限[二阶矩](https://en.wikipedi
437
438
438
439
下面的代码正是为指数分布 $F(x) = 1 - e^{- \lambda x}$ 执行了这一操作。
439
440
440
- (请尝试使用其他 $F$ 的选择 ,但请记住,为了符合CLT的条件 ,分布必须有有限的二阶矩。)
441
+ (请尝试使用其他分布 $F$ ,但请记住,为了符合中心极限定理的条件 ,分布必须有有限的二阶矩。)
441
442
442
443
(sim_one)=
443
444
@@ -473,7 +474,7 @@ plt.show()
473
474
474
475
(注意这里没有 for 循环——所有的操作都是矢量化的,意味着主要计算都转移到了快速的 C 代码上。)
475
476
476
- 通过增加 ` n ` ,拟合到正态密度可以进一步改进 。
477
+ 通过增加 ` n ` ,我们会越来越接近正态分布 。
477
478
478
479
479
480
## 练习
@@ -483,7 +484,7 @@ plt.show()
483
484
``` {exercise}
484
485
:label: lln_ex1
485
486
486
- 用[贝塔分布](https://en.wikipedia.org/wiki/Beta_distribution )重复[上面](sim_one)的模拟。
487
+ 用[贝塔分布](https://baike.baidu.com/item/%E8%B4%9D%E5%A1%94%E5%88%86%E5%B8%83/8994021 )重复[上面](sim_one)的模拟。
487
488
488
489
你可以选择任何 $\alpha > 0$ 和 $\beta > 0$。
489
490
```
@@ -538,7 +539,7 @@ X = 1 if U < p else 0
538
539
print(X)
539
540
```
540
541
541
- 解释为什么这能提供一个具有正确分布的随机变量 $X$。
542
+ 解释为什么这能行代码可以提供一个具有正确分布的随机变量 $X$。
542
543
````
543
544
544
545
``` {solution-start} lln_ex2
563
564
``` {exercise}
564
565
:label: lln_ex3
565
566
566
- 我们上面提到即使违反IID条件,LLN有时仍然成立 。
567
+ 我们上面提到即使违反IID条件,大数定律有时仍然成立 。
567
568
568
- 让我们进一步调查这个说法 。
569
+ 让我们进一步探讨这个说法 。
569
570
570
571
考虑AR(1)过程
571
572
582
583
X_0 \sim N \left(\frac{\alpha}{1-\beta}, \frac{\sigma^2}{1-\beta^2}\right)
583
584
$$
584
585
585
- 这个过程违反了LLN的独立性假设
586
+ 这个过程违反了大数定律的独立性假设
586
587
(因为 $X_{t+1}$ 依赖于 $X_t$ 的值)。
587
-
588
- 然而,下一个练习告诉我们,样本均值向总体均值的LLN类型收敛仍然会发生。
588
+ 与大数定律类似的收敛仍然会发生。
589
589
590
590
1. 证明序列 $X_1, X_2, \ldots$ 是同分布的。
591
- 2. 使用模拟证明LLN收敛成立 ,其中 $\alpha = 0.8$, $\beta = 0.2$。
591
+ 2. 使用模拟证明大数定律类似的收敛成立 ,其中 $\alpha = 0.8$, $\beta = 0.2$。
592
592
593
593
```
594
594
595
595
``` {solution-start} lln_ex3
596
596
:class: dropdown
597
597
```
598
598
599
- ** Q1 解答 **
599
+ ** 第一题答案 **
600
600
601
601
关于第一部分,我们认为 $X_t$ 在所有 $t$ 时刻的分布与 $X_0$ 相同。
602
602
603
603
为了构建证明,我们假设这个命题对 $X_t$ 是正确的。
604
604
605
- 现在我们声称它对于 $X_ {t+1}$ 也是正确的。
605
+ 现在我们证明它对于 $X_ {t+1}$ 也是正确的。
606
606
607
- 观察我们是否得到了正确的均值 :
607
+ 首先我们验证均值是正确的 :
608
608
609
609
$$
610
610
\begin{aligned}
614
614
\end{aligned}
615
615
$$
616
616
617
- 我们也得到了正确的方差 :
617
+ 其次我们也得到了正确的方差 :
618
618
619
619
$$
620
620
\begin{aligned}
635
635
636
636
我们可以得出结论,这个AR(1)过程违反了独立性假设,但是分布相同。
637
637
638
- ** Q2 解决方案 **
638
+ ** 第二题答案 **
639
639
640
640
``` {code-cell} ipython3
641
641
σ = 10
0 commit comments