Estadística: Hablamos de un conjunto de técnicas para resumir y transmitir información, hacer
inferencias y generalizaciones de un conjunto de datos, es decir, extraer conclusiones del
conjunto de observaciones realizadas. Es la ciencia que ordena y analiza datos provenientes de
muestras y realiza inferencias acerca de ellos. La
estadística descriptiva se encarga de resumir
las observaciones de una muestra y describirlas mediante estadísticos. Es la parte teórica de la
estadística. Además, es útil para la
estadística inferencial, la cual necesita de esta clasificación
de datos para poder generalizarlos y sacar conclusiones a partir de este grupo reducido de
observaciones. Es la parte práctica de la estadística.
Población estadística: Es el conjunto de todos los elementos que cumplen con una o varias
características a las cuales se estudia. Cada uno de los elementos de esta población son los
individuos o entidades estadísticas, y puede ser una población finita o infinita dependiendo de
la cantidad.
Unidad de análisis: Cada uno de los individuos de la muestra.
Población de observaciones: Es hipotética, ya que incluye a todos los casos de la muestra en
cada variable.
Muestra: Es el subconjunto que se toma de los elementos de una población. Es necesario recortar
una parte de toda la población estadística para que sea posible estudiar la característica que se
quiera. Se requiere que las muestras sean representativas, recogidas aleatoriamente y que
replique la característica a estudiar en la población de individuos. Hay tantas muestras como
variables.
Característica: es un rasgo general para estudiar en una población. (Nivel de agresividad)
Variable estadística: Es la característica que estudiar en una muestra de forma rigurosa, a partir
de una característica general. (Puntaje obtenido en la escala de nivel de agresividad)
Clasificación de variables
Cuantitativas: Números. Pueden ser discretas, es decir, adoptar valores aislados; o continua,
que tenga valores intermedios.
Cuasicuantitativas: Poseen un orden jerárquico, distintos niveles.
Cualitativas: No pueden ordenarse, son cualidades.
Propiedades de la medición
Las variables se clasifican según la escala de medida que les corresponda. La medición es el
proceso que le atribuye números a las características. Las clases son exclusivas y exhaustivas. La
exclusividad refiere a que cada modalidad de la variable se encuentra asociada a una y sólo
unidad de análisis, mientras que la
exhaustividad refiere a que las modalidades de la variable
deben tener asignadas una categoría o valor.
Escala nominal: Orden arbitrario. (Variables cualitativas)
Escala ordinal: Orden jerárquico, mayor o menor que. (Variables cuasicuantitativas)
Escala intervalar: Se puede medir la distancia ya que el 0 es arbitrario (Cuantitativas)
Escala de razón: Son valores aislados, el 0 significa la ausencia del atributo, es decir, es
absoluto.
Estadística descriptiva
Parámetro poblacional: Propiedad descriptiva de una población, la cual es desconocida. Se usa
para calcularlo un
estadístico.
Estadístico:
Es una propiedad descriptiva de la muestra que consiste en un valor calculable. Es
un resumen de la muestra en un valor.
Estimador: Es el estadístico que se utiliza para conocer aproximadamente el valor de un
parámetro.
Operacionalización: Es el procedimiento para obtener el valor de una variable.
Modalidad: Son las formas en las que se presenta una característica.
Distribución de frecuencias
Siempre se inicia clasificando los datos en una matriz de datos, para luego comenzar a operar.
Las
distribuciones de
frecuencias
sirven para
ordenar y resumir la
información obtenida de la
muestra. Es el primer paso por
realizar para luego obtener un
gráfico.
Las frecuencias se distribuyen ordenadamente a partir de variables ordinales, ya que es necesario
que tengan un orden establecido jerárquicamente, por lo que con las nominales es indistinto el
orden.
Frecuencia absoluta: (ni) Es la cantidad de personas según la variable. Como resultado, da suma
de ni = n.
Frecuencia relativa: (Pi) Marca el peso de un valor al comparar distintas muestras. La sumatoria
siempre da 1. Se obtiene dividiendo la frecuencia absoluta por el n.
Frecuencia porcentual: (p%) Representa el peso de un valor en la muestra. Se obtiene
multiplicando la frecuencia relativa x 100 y la sumatoria da 100%.
Frecuencia acumulada: Las escalas
ordinales, intervalares y de razón tienen
un valor mínimo y uno máximo. Esta
frecuencia sirve para calcular la sumatoria
de observaciones en un valor
determinado, yendo de menor a mayor
(na) o de mayor a menor (ga). Sirve para
calcular hasta qué valor a lo sumo (na) o
hasta qué valor por lo menos (ga).
Se pueden acumular las frecuencias porcentuales y relativas también.
Las representaciones gráficas son una forma más resumida y llamativa visualmente de organizar
los datos. Las frecuencias van en el eje Y los valores que toma la variable en el eje X.
Según qué tipo de variable sea, corresponde un tipo de gráfico.
Pictograma: Se divide en sectores, tantos como
valores tome la variable. Es más adecuada para
variables cualitativas o algunas cuasicuantitativas
con pocos valores. Las frecuencias representadas
suelen ser la porcentual o la absoluta.
De
Barras:
Es más apropiado para las variables nominales,
ordinales y cuantitativas discretas.
De bastones
: Es
más apropiado
para las variables
cuantitativas
discretas.
Histograma: Es un
diagrama de barras adyacentes, por lo que es más
útil para intervalos. Se usa con variables
cuantitativas continuas.
Polígonos de frecuencia: Es un resumen del
gráfico de barras. Es necesario que la
variable tenga un orden jerárquico.
Comparación de muestras: En el caso de las frecuencias absolutas, la cantidad de individuos es
parecida o igual, mientras que las frecuencias relativas o porcentuales, pueden compararse
muestras de distintas cantidades de individuos.
Resúmenes estadísticos
Son estadísticos. Sirven para describir con más detalle lo que sucede en una muestra. Hay
diferentes estadísticos según los tipos de variables.
Medidas de posición: Sirven para interpretar un valor con respecto del grupo; a partir de la
medición ordinal. Se calcula el porcentaje de observaciones que está por debajo y por encima del
valor seleccionado. Para ello, se necesita la frecuencia acumulada para llegar a la interpretación
de ese dato.
Cuartiles: Se divide a la muestra en 3 posiciones de 4 partes iguales, es decir, cada una
equivale a un 25% de la muestra.
Deciles: Se divide a la muestra en 9 posiciones de 10 partes, es decir, cada una equivale al
10%.
Centiles: Se divide a la muestra en 99 partes iguales y cada una representa un 1%.
Para calcular un porcentaje en el que se ubica un valor, se calcula el rango percentilar. Sin
embargo, el percentil se calcula para saber el valor o el puntaje Para obtener el número de
individuos, se requiere del porcentaje y de la regla de 3.
Medidas de tendencia central: Es un resumen de lo que sucede en una distribución en
comparación con su grupo.
Moda: Es el valor más frecuente asociado, es decir, el valor que más se repite. Puede
calcularse en todas las escalas de medida, sobre todo en la nominal. Una variable puede ser
amodal y no tener moda o bimodal y tener dos modas.
Media: El promedio general del grupo. Se usa únicamente en variables cuantitativas y
contempla la cantidad de personas que respondieron para cada variable. Se obtiene sumando
todos los valores y dividiéndolos por n.
Mediana: Es el valor que divide a la distribución en 2 partes iguales. Se calcula desde la escala
ordinal.
Propiedades de la media
1. La suma de las diferencias de n puntuaciones con respecto a su media es = a 0, es decir, la
puntuación diferencial = 0. La razón es que unas son negativas y otras positivas. Esto permite
interpretar a la media como el centro de compensación de la distribución.
2. La suma de los cuadrados de las desviaciones de unas puntuaciones con respecto a su media
es menor que con respecto a cualquier otro valor.
3. Si sumamos una constante a un conjunto de puntuaciones, la media quedará aumentada en
esa misma constante.
4. Si multiplicamos por una constante a un conjunto de puntuaciones, la media quedará
multiplicada por esa constante.
5. Se puede calcular la media de un grupo a partir de la media de cada grupo parcial, esto es, la
media ponderada.
6. La variable definida como la combinación lineal de otras variables tiene como media la misma
combinación lineal de las medias de las variables intervinientes en su definición.
Medidas de variación: Para comparar un grupo con otro, puede obtenerse un valor que resuma
la variabilidad. Se analiza cuánto cambia la característica a estudiar de un individuo a otro, en las
distintas maneras en las que aparece. Entonces, se calcula si un grupo es más
heterogéneo u
homogéneo que otro. Un grupo por solo es variable, por lo que este índice es útil si se comparan
más de un grupo.
Índice de varianza: Para las variables cuantitativas, se obtiene con la puntuación diferencial
para saber cuán cercano o alejado de la media está el valor. Si está más cerca, hay menos
variabilidad, pero si está más alejado, hay más variabilidad. Se utiliza en variables del mismo
tipo, con la misma escala de medida y cuya media sea igual o similar. (S)
Desvío estándar: Informa cuánto se alejan los valores de la media. Se operacionaliza con una
raíz cuadrada para poder volver a la unidad de medida estándar. A mayor desvío, mayor
variabilidad.
Coeficiente de variación: Es un índice adimensional, no posee unidad de medida porque la
simplifica. Es útil para comparar variables con distinta media y unidad de medida, por ello es
la única medida relativa. Además, indican cuán representativa es la media en comparación
con otro grupo: a menor CV, mayor representatividad y menor variabilidad. A menor CV,
menor representatividad y mayor variabilidad.
Asimetría (AS): Las variables cuantitativas ordinales pueden comparase en grupos para observar
dónde se concentra la mayor parte de las observaciones.
Se observa una simetría cuando la mayoría se distribuye en los puntajes medios; cuando moda,
media y mediana coinciden.
Se observa una asimetría positiva cuando la mayoría se distribuye por debajo de la media, la
diferencia entre la media y la moda= un número positivo.
Se observa una asimetría negativa cuando se distribuye en los puntajes por encima de la media.
La diferencia entre media y moda= número negativo.
Curtosis: Se analiza el apuntalamiento de la distribución. (G2)
Es
mesocúrtica cuando la distribución es media u homogénea.
Es
leptocúrtica cuando la distribución está más apuntalada en un valor. Es un índice de poca
variabilidad. G2 da un número positivo.
Es platicúrtica cuando la distribución está más aplanada. Es un índice de heterogeneidad. G2
es un número negativo.
Puntuaciones típicas o puntaje Z: Sirve para interpretar qué significa una variable en un individuo
en particular, para analizar cómo se ubica en relación con el grupo. Contempla la variabilidad y
cómo se ubica el individuo con respecto a la media. Para ello, se transforma el
puntaje bruto en
una escala general, el puntaje Z.
El puntaje Z indica a cuántos desvíos se encuentra el individuo por encima o por debajo de la
media. Z= negativo indica que el individuo está por debajo de la media. Un puntaje Z= a
positivo indica que el individuo está por encima de la media. Además, sirve para comparar a un
individuo en distintas características.
Escalas derivadas: Es una escala que estandariza la media y el desvío para no obtener valores
decimales. Un ejemplo son el CI y los puntajes T.
Glosario de estadística.docx
browser_emoji Estamos procesando este archivo...
browser_emoji Lamentablemente la previsualización de este archivo no está disponible. De todas maneras puedes descargarlo y ver si te es útil.
Descargar
. . . . .