Skip to content

Commit faca50f

Browse files
committed
Estadistica
Signed-off-by: Alejandro Alfaro Sánchez <alejandro@alejandroalsa.es>
1 parent 0d8b4f1 commit faca50f

File tree

4 files changed

+197
-15
lines changed

4 files changed

+197
-15
lines changed

_config.yml

Lines changed: 11 additions & 12 deletions
Original file line numberDiff line numberDiff line change
@@ -64,24 +64,23 @@ avatar: assets/img/alejandroalsa.jpeg
6464
toc: true
6565

6666
comments:
67-
active: # The global switch for posts comments, e.g., 'disqus'. Keep it empty means disable
68-
# The active options are as follows:
67+
active: giscus
6968
disqus:
7069
shortname: # fill with the Disqus shortname. › https://help.disqus.com/en/articles/1717111-what-s-a-shortname
7170
# utterances settings › https://utteranc.es/
7271
utterances:
73-
repo: # <gh-username>/<repo>
72+
repo:
7473
issue_term: # < url | pathname | title | ...>
7574
# Giscus options › https://giscus.app
7675
giscus:
77-
repo: # <gh-username>/<repo>
78-
repo_id:
79-
category:
80-
category_id:
81-
mapping: # optional, default to 'pathname'
82-
input_position: # optional, default to 'bottom'
83-
lang: # optional, default to the value of `site.lang`
84-
reactions_enabled: # optional, default to the value of `1`
76+
repo: alejandroalsa/alejandroalsa.github.io
77+
repo_id: R_kgDOJ8ORRA
78+
category: General
79+
category_id: DIC_kwDOJ8ORRM4Cbi1j
80+
mapping: pathname
81+
input_position: bottom
82+
lang: site.lang
83+
reactions_enabled: 1
8584

8685
# Self-hosted static assets, optional › https://github.com/cotes2020/chirpy-static-assets
8786
assets:
@@ -128,7 +127,7 @@ defaults:
128127
- scope:
129128
path: _drafts
130129
values:
131-
comments: false
130+
comments: true
132131
- scope:
133132
path: ""
134133
type: tabs # see `site.collections`

_posts/2024-01-07-java-menu.md

Lines changed: 9 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,9 @@
1+
---
2+
title: Menús en Java
3+
date: 2024-01-08 12:00:00 +0800
4+
categories: [Programación, Java, Código Rápido]
5+
tags: [Java]
6+
---
7+
8+
# Menús en Java
9+

_posts/2024-04-02-estadistica.md

Lines changed: 177 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -1,9 +1,10 @@
11
---
22
title: Análisis descriptivo de datos. Regresión
33
date: 2024-01-08 8:00:00 +0800
4-
categories: [Estadística]
5-
tags: [Estadística, Regresión, Análisis]
4+
categories: [Estadística, Regresión, Análisis]
5+
tags: [Estadística]
66
math: true
7+
comments: false
78
---
89

910
# Análisis descriptivo de datos. Regresión.
@@ -56,7 +57,7 @@ Representa el número o fracción de veces que aparece cada posible valor de la
5657

5758
**Frecuencia Absoluta Acumulada (F.A Acumulada)** Es la suma actual de las frecuencias absolutas hasta cierto punto de la distribución.
5859

59-
**Frecuencia Relativa (Frec. Relativa)** Es la porcion de observaciones en una categoria especifica en relacion al numero de observaciones, o en este caso a la cantidad de recursos económicos.
60+
**Frecuencia Relativa (Frec. Relativa)** Es la porción de observaciones en una categoría especifica en relación al numero de observaciones, o en este caso a la cantidad de recursos económicos.
6061

6162
**Frecuenca Relativa Acumulada (F.R. Acumulada)** Es la suma actual de las frecuencias relativas hasta cierto punto de la distribución.
6263

@@ -138,21 +139,194 @@ Si hay un número par de valores, es la media aritmética de lso dos valores cen
138139
139140
### Cuantiles
140141

142+
Los cuantiles son valores de la variable que dividen a la distribución en un número determinado de partes iguales, es decir, en intervalos con igual frecuencia.
141143

144+
Existen casso particulares de cuantiles:
142145

146+
* **Cuartiles** Son los 3 valores de la variable ($Q_1$, $Q_2$, $Q_3$) que dividen la distribución en 4 partes iguales, cada una conteniendo el 25% de los valores de la variable.
143147

148+
$$Q_i, i = 1,2,3 => \frac{N * i}{4}$$
149+
150+
* **Deciles** Son los 9 valores de la variable ($D_1$, $D_2$, $D_3$, ..., $D_9$) que dividen la distribución en 10 partes iguales, cada una conteniendo el 10% de los valores de la variable.
151+
152+
$$D_i, i = 1,2,3,...,9 => \frac{N * i}{10}$$
153+
154+
* **Percentiles** Son los 99 valores de la variable ($P_1$, $P_2$, $P_3$, ..., $P_99$) que dividen la distribución en 100 partes iguales.
155+
156+
$$P_i, i = 1,2,3,...,99 => \frac{N * i}{99}$$
157+
158+
Si la posición obtenida con las fórmulas anteriores no es un número entero, elegiremos el dato que se encuentra en la posición que se corresponde con el siguiente número entero.
159+
160+
$$2,3 = 3$$
161+
162+
Si la posición obtenida con las fórmulas anteriores sí es un número entero, el cuantil lo calcularemos como la media del dato contenido en esa posición y el contenido de la posición siguiente
163+
164+
### Medidas de dispersión absolutas
165+
166+
Las medidas de dispersión absolutas son estadísticas que proporcionan información sobre la variabilidad o dispersión de un conjunto de datos sin tener en cuenta la dirección de las desviaciones con respecto a la media. Algunas de las más comunes son:
167+
168+
* **Varianza** Es una medida que nos indica cuánto se alejan los datos de la media. Tenemos que tener en cuenta que la varianza no puede ser negativa, no queda afectada por cambios de origen pero si por cambios de escala.
169+
170+
$$S^2 = \frac{1}{N} \sum_{i=1}^N (x_1 - \bar{x})^2 $$
171+
172+
173+
* **Desviación típica** Nos da una idea de cuánto se dispersan los datos en torno a la media. Una desviación típica mayor indica una mayor dispersión de los datos, mientras que una desviación típica menor indica que los datos están más concentrados alrededor de la media. Se denota como σ (sigma) para poblaciones y ss (minúscula) para muestras. Tenemos que tener en cuenta que la varianza no puede ser negativa, no queda afectada por cambios de origen pero si por cambios de escala.
174+
175+
$$S = \sqrt{S^2} $$
176+
177+
### Medidas de dispersión relativas
178+
179+
Las medidas de dispersión relativas son estadísticas que proporcionan información sobre la variabilidad o dispersión de un conjunto de datos en relación a su tamaño.
180+
181+
* **Coeficiente de Pearson** Representa el número de veces que $S$ contiene a $\bar{x}$, luego a mayor $V$, menor representatividad de $\bar{x}$
182+
183+
$$V= \frac{S}{\bar{x}}$$
184+
185+
Ejemplo:
144186

145187
## Variables estadísticas bidimensionales y distribuciones de frecuencias. Independencia.
146188

189+
El valor de una variable puede influir sobre otra, al mismo tiempo si no influye y no existe una relacion se puede decir que son independientes y cuando su relacion es perfecta se dice que estan relacionadas funcionalmete o lo que es lo mismo:
190+
191+
$$ y = f(x)$$
192+
193+
| X\Y | [0,2] | (2,4] | (4,6] | (6,8] | (8,10] | $n_x$ |
194+
|----------------------------|-------|-------|-------|-------|--------|-------|
195+
| Facebook | 8 | 5 | 8 | 3 | 2 | 26 |
196+
| TikTok | 5 | 9 | 3 | 0 | 0 | 17 |
197+
| YouTube | 5 | 3 | 5 | 0 | 0 | 13 |
198+
| Pinterest | 6 | 7 | 2 | 2 | 0 | 17 |
199+
| Instagram | 6 | 1 | 2 | 0 | 0 | 9 |
200+
| X | 3 | 6 | 3 | 1 | 0 | 13 |
201+
| Otra | 2 | 1 | 0 | 0 | 0 | 3 |
202+
| No estoy en redes sociales | 2 | 0 | 0 | 0 | 0 | 2 |
203+
| $n_y$ | 37 | 32 | 23 | 6 | 2 | 100 |
204+
205+
### Distribución marginal
206+
207+
La distribución marginal de $Y$ expresa cuantas veces se repite cada valor $y_i$ con independencia de que aparezca conjuntamente con otro valor y otro de $X$
208+
209+
| $Y$ | [0,2] | (2,4] | (4,6] | (6,8] | (8,10] |
210+
|----------------------------|-------|-------|-------|-------|--------|
211+
| $n_y$ | 37 | 32 | 23 | 6 | 2 |
212+
213+
La distribución marginal de $X$ expresa cuantas veces se repite cada valor $y_i$ con independencia de que aparezca conjuntamente con otro valor y otro de $Y$
147214

215+
| X\Y | $n_x$ |
216+
|----------------------------|-------|
217+
| Facebook | 26 |
218+
| TikTok | 17 |
219+
| YouTube | 13 |
220+
| Pinterest | 17 |
221+
| Instagram | 9 |
222+
| X | 13 |
223+
| Otra | 3 |
224+
| No estoy en redes sociales | 2 |
148225

226+
### Distribución condicionada
149227

228+
La distribución condicional de $X$ dada $Y$ describe cómo se distribuyen los valores de $X$ para cada valor de $Y$.
150229

230+
Distribución de $X$ condicionada a $Y:X\Y$
151231

232+
Distribución de $Y$ condicionada a $X:Y\X$
152233

234+
Ejemplo:
235+
236+
Distribución $X\Y = (2,4]$
237+
238+
| X\Y | [0,2] | (2,4] | (4,6] | (6,8] | (8,10] | $X\Y = (2,4]$ |
239+
|----------------------------|-------|-------|-------|-------|--------|---------------|
240+
| Facebook | 8 | 5 | 8 | 3 | 2 | 5 |
241+
| TikTok | 5 | 9 | 3 | 0 | 0 | 9 |
242+
| YouTube | 5 | 3 | 5 | 0 | 0 | 3 |
243+
| Pinterest | 6 | 7 | 2 | 2 | 0 | 7 |
244+
| Instagram | 6 | 1 | 2 | 0 | 0 | 1 |
245+
| X | 3 | 6 | 3 | 1 | 0 | 6 |
246+
| Otra | 2 | 1 | 0 | 0 | 0 | 1 |
247+
| No estoy en redes sociales | 2 | 0 | 0 | 0 | 0 | 0 |
248+
| | | | | | | 32 |
249+
250+
Distribución $Y\X = TikTok U Facebook$
251+
252+
| X\Y | [0,2] | (2,4] | (4,6] | (6,8] | (8,10] | |
253+
|-----------------------------|-------|-------|-------|-------|--------|----|
254+
| Facebook | 8 | 5 | 8 | 3 | 2 | |
255+
| TikTok | 5 | 9 | 3 | 0 | 0 | |
256+
| YouTube | 5 | 3 | 5 | 0 | 0 | |
257+
| Pinterest | 6 | 7 | 2 | 2 | 0 | |
258+
| Instagram | 6 | 1 | 2 | 0 | 0 | |
259+
| X | 3 | 6 | 3 | 1 | 0 | |
260+
| Otra | 2 | 1 | 0 | 0 | 0 | |
261+
| No estoy en redes sociales | 2 | 0 | 0 | 0 | 0 | |
262+
| $Y\X = TikTok U Facebook$ | 13 | 14 | 12 | 3 | 2 | 44 |
263+
264+
### Independencia estadı́stica
265+
266+
Dos variables $X$ e $Y$ son independientes estadı́sticamente cuando la frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales:
267+
268+
$$\frac{n_xy}{N} = \frac{n_x}{N} X \frac{n_y}{N} =>$$
269+
270+
$$N X n_xy = n_x X n_y ∀(x , y)$$
271+
272+
Ejemplo A:
273+
274+
$X:$ Número de hermanos
275+
$Y:$ Número de mascotas
276+
277+
¿Son $X$ e $Y$ independientes?
278+
279+
| X\Y | 0 | 1 | $n_x$ |
280+
|-------|----|----|-------|
281+
| 0 | 30 | 20 | 50 |
282+
| 1 | 18 | 12 | 30 |
283+
| 2 | 6 | 4 | 10 |
284+
| 3 | 6 | 4 | 10 |
285+
| $n_y$ | 60 | 40 | 100 |
286+
287+
$N X n_xy = n_x X n_y ∀(x , y)$
288+
289+
* Par $(x_1, y_1): 100 * 30 = 50 * 60$
290+
* Par $(x_1, y_2): 100 * 20 = 50 * 40$
291+
* Par $(x_2, y_1): 100 * 18 = 30 * 60$
292+
* Par $(x_2, y_2): 100 * 12 = 30 * 40$
293+
* Par $(x_3, y_1): 100 * 6 = 10 * 60$
294+
* Par $(x_3, y_2): 100 * 4 = 10 * 40$
295+
* Par $(x_4, y_1): 100 * 6 = 10 * 60$
296+
* Par $(x_4, y_2): 100 * 4 = 10 * 40$
297+
298+
Si $X$ e $Y$ son independientes.
299+
300+
Ejemplo B:
301+
302+
$X:$ Horas diarias de uso de la red social
303+
$Y:$ Nota media curso
304+
305+
¿Son $X$ e $Y$ independientes?
306+
307+
| X\Y | (0,5] | (5,7] | (7,9] | (9,10] | $n_x$ |
308+
|--------|-------|-------|-------|--------|-------|
309+
| (0,2] | 0 | 1 | 24 | 12 | 37 |
310+
| (2,4] | 0 | 17 | 14 | 1 | 32 |
311+
| (4,6] | 8 | 15 | 0 | 0 | 23 |
312+
| (6,8] | 6 | 0 | 0 | 0 | 6 |
313+
| (8,10] | 2 | 0 | 0 | 0 | 2 |
314+
| $n_y$ | 16 | 33 | 38 | 13 | 100 |
315+
316+
$N X n_xy = n_x X n_y ∀(x , y)$
317+
318+
* Par $(x_1, y_1): 100 * 0 = 37 * 16$
319+
* Par $(x_1, y_2): 100 * 1 != 32 * 33$
320+
* No hay necesidad de seguir comprobando
321+
322+
Si $X$ e $Y$ no son independientes.
323+
324+
![Diagrama de Dispersión Ejemplo B](../assets/img/diagrama_dispersion.png)
153325

154326
## Regresión lineal y correlación.
155327

328+
### Covarianza
329+
156330

157331

158332

assets/img/diagrama_dispersion.png

92.9 KB
Loading

0 commit comments

Comments
 (0)