MindMap Gallery A Mind Map of Statistics
This is a clear statistical mind map that mainly explains the types of charts, measures of concentration trends, cumulative frequency, and other content. Each content is further divided into several levels for explanation. A mind map is a visual thinking tool that is presented through the radioactive structure of a central idea or problem. It consists of themes, branches, and keywords, aiming to mimic the neural network structure of the human brain. This graphical approach helps promote memory, organize information, and stimulate creativity.
Edited at 2022-05-12 03:54:56ESTADISTICA
1. Estadistica
La estadistica es el estudio de la corelación, organización, analisis, interpretación y presentación de datos.
Son utlizados para inferir, predecir y recolectar
Constan de dos partes que vienen siendo descripctiva e inferencial
Descriptiva: registra los datos en tablas y los representa en graficos
Parametros estadisticos
Medidas de posición
Dispersión
Tendencia Central
Inferencial:Estudoa como co conclsuiones generales para una población a partir deñ estudio de una muestra y el grafico de confianza de los resultados obtenidos
2. Variables estadisticos
Estadisticas: cada una de las caracteristicas que poseen los individuos de una población
Cuantitativas: son las que tienen por modalidades cantidades numericas con las que podemos hacer operaciones aritmeticas.
Pueden ser discretos o continuos
Discretos: Valores que se cuentan
Continuos: Valores que se miden
Cualitativas: expresan caracteristicas que no pueden ser medidos con numero. Color de ojos
3. Tipos de Graficas
Muestra de población de estudio
Definiciones
Población: Grupo de personas que queremos estudiar
Muestra: Es la porción que se extrae de una población estadística para realizar un determinado estudio
Aleatorios: Escoger al azar
Sesgado: Los elementos incluidos en el estudio estadistico, son los que estan facilmente disponibles
4. Medidas de tendencia central
Es un numero ubicado en el centro de la distribución de los valores de una serie de correlaciones en la que se encuentran los conjuntos de datos.
MEDIA (promedio) Suma de todos los datos divididos los valores del conjunto
MODA El dato más repetitivo dentro de un conjunto
Medidas de dispersion
Nos muestran cuanto espacio se encuentra un conjunto de datos. La más simple es el rango, desviación tipica, desviacion media.
Rango: Se obtiene esta cuando la diferencia entre valor max - valor min
Desviacion tipica 6x da una idea de la poblacion de los datos con relacion a la recta
MEDIANA La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro
5. Frecuencia acumulada
Es la suma de todas las frecuencuas a medida que el conjunto de datos
Tabla de frecuencia acumulada
6. Distribución normal
Representa una gráfica de la distribución de datos de una variable continua.Surge a partir de las conexiones ojivas que se intersectan desde un histograma.
Su modelo matemático es:
La curva de la distribución normal
Es la distribución continua más importante en Estadística. También es conocida como: “campana de Gauss” o “curva de Gauss”
Valor esperado:
Se halla multiplicando la cantidad de elementos (n) de la muestra por la probabilidad en forma decimal (p).
Inversa de Distribución normal:
Se halla calculando el valor de un parámetro de un estadístico, a partir del área debajo de la curva en una distribución normal que se posiciona según el porcentual (percentil).
En la calculadora, siempre se debeconsiderar el área de la izquierda. Por lo tanto, si el área dada es la de laderecha, se le debe restar a 1.
9 propiedades de la curva
1. Tiene forma acampanada. 2. La media (μ) está exactamente al centro de la curva. 3. Tanto la media, la mediana y la moda tienen el mismo valor. 4. El eje x es una asíntota de la curva. 5. El área total bajo la curva es 1 (100%). 6. 50% del área se encuentra a la izquierda de la media, y 50% a la derecha. 7. Aproximadamente 68% del área se encuentra a menos de una desviación típica (σ) de la media (μ). 8. Aproximadamente 95% del área se encuentra a menos de dos desviaciones típicas (σ) de la media (μ). 9. Aproximadamente 99% del área se encuentra a menos de tres desviaciones típicas (σ) de la media (μ).
7. Prueba de Chi Cuadrada
χ² --> Chi cuadrado Σ --> Sumatoria fo -> Frecuencia observada fe --> Frecuencia esperada
La chi cuadrada es una prueba que permite determinar si dosvariables (datos) son independientes (no se afectan) entre sí. Se emplea para verificar o validar conclusiones de cualquier área de estudio del ser humano.
H0 = Hipótesis Nulala variable x es independiente de la variable y H1 = Hipótesis Alternativa.la variable x no es independiente de la variable y
Frecuencias esperadas
- Para asegurar que los datos sean independientes, se establece un “caso ideal” con las frecuencias esperadas... a fin de compararlas matemáticamente con las frecuencias reales (observadas). - Para elaborar una tabla de frecuencias esperadas, se debe hacer lo siguiente en cada celda: *Multiplicar total de fila por total de columna *Dividir entre el total de los totales
Calcular la chi cuadrada
1) Elevar al cuadrado la diferencia entre la frecuencia observada y la esperada. 2) Dividir esta elevación entre la frecuencia esperada. 3) Sumar cada una de estas divisiones.
Valor crítico
Fórmula para calcular los grados de libertad: (#filas − 1)(#columnas − 1)
Conclusiones: - Se acepta la hipótesis nula si χ² < valor crítico - Se rechaza la hipótesis nula si χ² > valor crítico
8. Correlación
El coeficiente de correlación de pearson
Correlación: La teoría de la correlación estudia el grado de dependencia o asociación entre variables. El grado de dependencia es mínimo si las variables son independientes. El grado de dependencia es máximo si las variables son dependientes.
Regresión: Es la teoría de la regresión busca determinar la curva (o función o línea) bajo la que se ajustan los puntos en un diagrama de dispersión, a fin de expresar el grado de dependencia entre ambas variables.
- Variable independiente en el eje x. - Variable dependiente en el eje y
Curvas de frecuencia acumulada
Es la gráfica que representa la acumulación de las frecuencias (eje y) de todas las clases (eje x), a partir de una tabla de frecuencias. Las escalas del eje x son los límites superiores delas clases. La coincidencia se representa con un ● o conuna ×. Al finalizar, se unen los ● o las ×.
- Percentiles (p%) - Cuartiles - Primer cuartil (Q1) - Tercer cuartil (Q3) - Mediana (Med) - Rango intercuartil (Q3 y Q1)
Rango Intercuartil: Se le llama RIC, que muestra la dispersión del 50% central de los datos
149 + 150 / 2 = 149. 5
49 + 100 / 2 = 74.5
49+ 50 = 99. 5
Limite superior= LS
Curva de frecuencia acumulada
¿Cómo construirla una tabla de datos agrupados?
1) Identificar el dato más pequeño
2) Establecer en dónde empezaría la clase
3) Identificar el dato más grande
4) Establecer en dónde terminaría la clase
5) Determinar de cuánto será la amplitud por clase
6) Determinar la cantidad de clases (dividir el término de la
clase entre la amplitud de clases)
EJEMPLOS DE GRAFICAS
Histograma
Grafica de barras
Diagrama de dispersión
Frecuencia acumulada
Poligono de frecuencias
Grafica de pastel
Diagrama y bigote