ORGANIZACIÓN DE LAS VARIABLES O DATOS:
Una vez recolectados los datos (variables) de una muestra se deben organizar u ordenar las variables, lo cual se lleva a cabo por medio de tablas.
Dependiendo del tipo de variable (cuantitativa o cualitativa), las tablas se clasifican en dos tipos:
- Tablas de datos simples y
- Tablas de datos agrupados en intervalos.
.- Tablas de datos simples:
Estas tablas de datos simples se usan para organizar variables cuantitativas discretas o discontinuas, en la cual se organizan en columnas teniendo en cuenta las variables, las frecuencias absolutas, frecuencia absoluta acumulada y frecuencia relativa, así:
- Variables o datos: en las tablas simples se designan con X y un subíndice según el número del dato que le corresponda: X1, X2, X3…. Xn, donde n es número de datos. En forma genérica se designa en el encabezado de la tabla como Xi
- Frecuencia absoluta de cada variable o dato: corresponde al número de veces que se repite el dato en la serie de datos recolectados, lo cual se designa con la letra f y un subíndice que corresponden al mismo de la variable: f1, f2, f3…. fn, donde n es número de datos y por tanto la sumatoria de todas las frecuencias absolutas es igual a n (total de datos). En forma genérica se designa en el encabezado de la tabla como fi
- Frecuencia absoluta acumulada de las variables: corresponde a la frecuencia absoluta de cada variable más el acumulado de las anteriores y se utiliza para el cálculo de la mediana, los cuartiles, deciles y percentiles, lo cual se designa con la letra F y un subíndice que corresponden al mismo de la variable: F1, F2, F3…. Fn, donde n es número de datos y por tanto el valor de la frecuencia absoluta acumulada de la variable Xn o sea Fn es igual a n. En forma genérica se designa en el encabezado de la tabla como Fi
- Frecuencia relativa de las variables: corresponde a la proporción de la frecuencia de la variable entre todas las variables y se calcula dividiendo la frecuencia absoluta de la variable entre el número de datos (fi/n), cuyo valor puede registrarse como numero o como porcentaje, lo cual se designa con la letra h y un subíndice que corresponden al mismo de la variable: h1, h2, h3…. hn, donde n es número de datos. La suma de todas las frecuencias relativas debe ser igual a 1 o al 100% según como se exprese. En forma genérica se designa en el encabezado de la tabla como hi
.- Tabla de datos agrupados en intervalos
Estas tablas de datos agrupados en intervalos se usan para organizar variables cuantitativas continuas o también para variables cuantitativas discontinuas cuando los datos están muy dispersos o las frecuencias absolutas son muy bajas.
Para organizar los datos se sigue los siguientes pasos:
- Organizar los intervalos o clases: de un determinado valor (arbitrario) el cual debe estar abierto por la derecha, que se representa como [a,b[, que se explica : a ≤ Xi < b
- Calcular la marca de clase: el cual corresponde al promedio de los dos extremos del intervalo, calculándose (a+b)/2, el cual se representa como Xi (tal como se identifica la variable en las tablas de datos simples). La importancia de calcular la marca de clase se debe a que gracias a ésta el manejo de este tipo de tablas en lo sucesivo es homologado al manejo de las tablas de datos simples.
- Luego se obtienen los mismos datos de las tablas de datos simples o sea las frecuencias absolutas, frecuencia absoluta acumulada y frecuencia relativa, utilizando la misma nomenclatura.
Ejemplo: Las pesos de los alumnos de una clase son: 45.4, 55,2, 49, 51,3, 52, 54, 56.2, 50.2, 48,3, 51.3, 46.2, 53.1, 52.9, 50, 50.6, 59.8, 53.9, 52.4, 53.9, 48.4
1). Organizar intervalos de 3 unidades (arbitrariamente): [45,48[, [48,51[, [51,54[, [54,57[ y [57,60[.
2). Luego calculamos la marca de clase o sea la Xi: (45+48)/2 = 46.5……….
3). Luego calculamos fi, Fi y la hi.