miércoles, 3 de febrero de 2010

VARIABLES Y ESCALAS EN SPSS

DEFINICIONES DE VARIABLES Y ESCALAS EN SPSS


DEFINICIÓN 1

Clasificación:

Las variables pueden ser clasificadas como cuantitativas (intervalares) o cualitativas
(categóricas), dependiendo si los valores presentados tienen o no un orden de
magnitud natural (cuantitativas), o simplemente un atributo no sometido a
cuantificación (cualitativa).

Una variable es medida utilizando una escala de medición. La elección de la(s) escala(s)
de medición a utilizar depende, en primer lugar, del tipo de variable en estudio, y,
además, del manejo estadístico a la que se someterá la información. En términos
prácticos, existe una correspondencia directa entre el concepto de variable y escala de
medición.

Un atributo corresponde a un valor específico de una variable, como ser el caso de la
variable sexo, la que posee dos atributos: varón o mujer. En variables que exploran el
grado de acuerdo o desacuerdo frente a una afirmación los atributos podrían ser:

1 = muy en desacuerdo
2 = en desacuerdo
3 = indiferente
4 = de acuerdo
5 = muy de acuerdo

Dependiendo de los valores que puede tener una variable cualitativa, ésta puede a su
vez ser dicotómicas (cuando sólo pueden adoptar un sólo valor sin jerarquía entre sí;
hombre ‐ mujer, positivo‐negativo, presente‐ausente), o bien, poli o multicotómicas ,si
existe la posibilidad de que adopten múltiples valores (edad, talla, nivel
socioeconómico, grupos sanguíneos, calificación previsional de usuarios).

1. Las variables cualitativas pueden agruparse en variables nominales u ordinales.

Hablaremos de variable nominal cuando los datos correspondan a una variable
cualitativa que se agrupa sin ninguna jerarquía entre sí, como por ejemplo:
nombres de personas, de establecimientos, raza, grupos sanguíneos, estado
civil. Estas variables no tienen ningún orden inherente a ellas ni un orden de
jerarquía.

Si las categorías o valores que adopte una variable cualitativa poseen un orden,
secuencia o progresión natural esperable, hablaremos de variable ordinal,
como por ejemplo: grados de desnutrición, respuesta a un tratamiento, nivel
socioeconómico, intensidad de consumo de alcohol, días de la semana, meses
del año, escalas de Killip o Apgar. A pesar de este orden jerárquico no es
posible obtener valoración numérica lógica entre dos valores.

2. Las variables de tipo cuantitativo pueden a su vez ser clasificadas como
continuas o discretas. Las escalas cuantitativas son reconocidas también como
escalas intervalares o numéricas.

Si entre dos valores determinados existen infinitas posibilidades de valores,
hablaremos de una variable de tipo continuo. Ejemplos de este tipo de
variables son: el peso, la talla, la presión arterial o el nivel de colesterol sérico.
En la práctica, salvo contadas excepciones no se dispone de métodos de
medición sofisticados como para poder medir exactamente los valores, por
ejemplo, de talla. En estricto rigor, la probabilidad que dos individuos tengan
exactamente la misma talla o edad es muy baja.

Si la variable a medir sólo puede adoptar un sólo valor numérico, entero, con
valores intermedios que carecen de sentido, hablaremos de variable
cuantitativa de tipo discreto. Son ejemplos de ellas: el número de hijos, de
unidades vecinales del sector, número de exámenes de laboratorio o de
pacientes atendidos.

Tanto las variables discretas como las continuas pueden agruparse
construyendo intervalos, entre cuyos valores extremos se ubicarán las
diferentes observaciones registradas. Sin embargo, estrictamente hablando,
sólo las variables continuas pueden ser objeto de categorización mediante
intervalos.

DEFINICIÓN 2
Las variables se dividen en cualitativas (las que representan atributos o características
no cuatificables) y cuantitativas (las que representan características cuantificables).
La variables cualitativas se dividen en nominales y ordinales. Las variables cualitativas
nominales se refieren a atributos que no se pueden representar con números, como
color, sexo, lugar de nacimiento, preferencias de marca, etc.

Las variables cualitativas ordinales representan un orden o jerarquía. Aunque pueden
usarse números para representarlas, estos solo indican el orden o "puesto" dentro de
un conjunto ordenado. Ejemplos: el orden de nacimiento dentro de un grupo de
hermanos, el orden en que llegaron los participantes en una competencia, el puesto en
el cuadro de honor en un grupo de alumnos, etc.

Las variables cuantitativas se dividen en discretas (las que solo pueden asumir una
cantidad finita de valores), y las contínuas (las que pueden asumir una cantidad infinita
de valores).

Las variables cuantitativas discretas provienen generalmente de contar objetos, por
ejemplo: número de hijos en la familia, número de veces al día que alguien se lava las
manos, número de clientes que visitaron cierto lugar, número e preguntas en
cuestionario, etc.

Las variables cuantitativas continuas provienen de hacer mediciones. Por ejemplo:
estatura, peso, longitud de un objeto, volumen, ingresos personales o familiares,
distancias, etc.
Datos nominales y ordinales:

Las variables pueden ser cualitativas o cuantitativas.

Variables cualitativas: aquellas que no aparecen en forma numérica, sino como
categorías o atributos (sexo, profesión, color de ojos) y sólo pueden ser nominales u
ordinales.

Variables nominales: lo único que puede hacerse es establecer frecuencias en cada
atributo y la igualdad o desigualdad entre los diferentes casos, ver cuál es el grupo que
tiene mayor frecuencia alcanzando el concepto de “moda” (y también obtener algunas

medidas de asociación cuando se relacionan variables entre sí).
Variables ordinales: recogen la idea de orden pero no tiene sentido realizar
operaciones aritméticas con ellas (acuerdo o desacuerdo con un proyecto de ley) ya
que no puede medirse distancia entre una categoría y otra. Se puede establecer aquí
igualdad y desigualdad, y relaciones como mayor que, y menor que. Puede
establecerse orden, pero no medirse distancia dentro de ese orden. La medida
estadística de tendencia central más apropiada para estas escalas es la "mediana".

DEFINICIÓN 3




1. NOMINAL

Son variables numéricas cuyos valores representan una categoría o identifican un
grupo de pertenencia. Este tipo de variables sólo nos permite establecer relaciones de
igualdad/desigualdad entre los elementos de la variable. La asignación de los valores
se realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de
este tipo de variables es el Género ya que nosotros podemos asignarle un valor a los
hombres y otro diferente a las mujeres y por más machistas o feministas que seamos
no podríamos establecer que uno es mayor que el otro.

2. ORDINAL

Son variables numéricas cuyos valores representan una categoría o identifican un
grupo de pertenencia contando con un orden lógico. Este tipo de variables nos permite
establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una
categoría es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel de
educación, ya que se puede establecer que una persona con título de Postgrado tiene
un nivel de educación superior al de una persona con título de bachiller. En las
variables ordinales no se puede determinar la distancia entre sus categorías, ya que no
es cuantificable o medible.

3. INTERVALO

 
Son variables numéricas cuyos valores representan magnitudes y la distancia entre los
números de su escala es igual. Con este tipo de variables podemos realizar
comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y
medir la distancia existente entre cada valor de la escala. Las variables de intervalo
carecen de un cero absoluto, por lo que operaciones como la multiplicación y la
división no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya
que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente
entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10
grados equivale a la mitad de una temperatura de 20 grados.

4. RAZÓN

Las variables de razón poseen las mismas características de las variables de intervalo,
con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0)
representa la ausencia total de medida, por lo que se puede realizar cualquier
operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y
ordenamiento). Este tipo de variables permiten el nivel más alto de medición. Las
variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de
escala de medida.

Debido a la similitud existente entre las escalas de intervalo y de razón, SPSS las ha
reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina
Escala. Las variables de escala son para SPSS todas aquellas variables cuyos valores
representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo
esto en cuenta discutiremos a continuación los diferentes procedimientos
estadísticos que se pueden utilizar de acuerdo al tipo de medida de cada variable.

B. Análisis Descriptivo de acuerdo al nivel de Medida

No todos los procedimientos estadísticos son realmente útiles para la totalidad de los
niveles de medida. Cada uno de los tipos de medida posee ciertas características, las
cuales debemos tener en cuenta en el momento de realizar un análisis descriptivo. En
la tabla [1], encontrará algunos de los procedimientos que resultan ventajosos en los
análisis descriptivos de los diferentes niveles de medida. Es necesario aclarar que esta
tabla es sólo una muestra de las medidas que se pueden emplear; en algunos textos de
estadística aparecen tablas más amplias y detalladas de los procedimientos.

                                                     Tabla 1







                                         


En la tabla 1 se notará que los niveles Nominal y Ordinal cuentan con los mismos
procedimientos de análisis, por lo que se agrupan como variables categóricas. A partir
de este punto cuando nos refiramos a las variables categóricas debemos recordar que
se alude a las variables de tipo Nominal y Ordinal.


Es importante resaltar que para los análisis descriptivos no hay una gran diferencia
entre estos dos tipos de variables, pero si existe diferencia en los análisis de Inferencia.

Antes de conocer como se efectúan estos procedimientos en SPSS, es necesario
exponer las razones por las que ciertos procedimientos no son de utilidad en algunos
de los niveles de medida.


B.1. Variables Categóricas

Para las variables que representan categorías o grupos de pertenencia, los principales
procedimientos estadísticos, que se pueden utilizar en su análisis descriptivo son las
frecuencias (Recuento), el Porcentaje, la Moda, en algunos casos la mediana y los
gráficos más favorables son el de Sectores y el de Barras.

Para comprender mejor la razón de estos procedimientos vamos a realizar el análisis
de la variable Género, la cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en
donde el valor uno (1) representa al género Femenino y el valor Dos (2) al género
Masculino. Las frecuencias y sus respectivos porcentajes para esta variable serían los
expuestos en la tabla 2. Ahora si hallamos las principales medidas de tendencia
central, obtenemos los resultados expuestos en la tabla 2.

                                                          Tabla 2







Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos
indica que en promedio los encuestados cuenta con un género de (1.2). Este resultado
no posee una interpretación aplicable a la información de la variable, por lo que esta
medida no es de utilidad en el análisis descriptivo.

Si observamos la Mediana notaremos que toma el valor 1, que para el caso
corresponde al género Femenino, pero si en vez de 10 valores tuviéramos únicamente
dos (1 y 2), la mediana sería de (1.5), cuya interpretación no es aplicable a la
información de la variable. La mediana se puede utilizar cuando estamos trabajando
con variables que contienen un elevado número de categorías y su interpretación se
debe manejar como un factor informativo para el investigador y no como una medida
representativa en el reporte.

Por último encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que
la categoría con mayor frecuencia dentro de la variable es la correspondiente al género
Femenino. Las medidas de dispersión y distribución no son aplicables a este tipo de
variables ya que sus ecuaciones nos permiten determinar cómo se comportan los
datos respecto a un punto central o media. Si hallamos la desviación estándar para los
datos del ejemplo, obtendríamos un valor de 0.42164, que nos indicaría que el
promedio del género presenta una variación de ±0.42, cuyo resultado no sería

aplicable a la interpretación de la variable.

B.2. Variables de Escala

Este tipo de variables nos permite realizar análisis más profundos de los datos,
aplicando una gran variedad de medidas. Al contrario de las variables categóricas en
este tipo de variables las frecuencias no son de utilidad en los análisis descriptivos,
debido a la gran cantidad de valores que suele tomar. Supongamos que realizamos un
sondeo de edad con una muestra de 500 personas, si generamos una tabla de
frecuencias obtendríamos fácilmente unos 60 o 70 rangos diferentes haciéndola muy
extensa y poco informativa.

Para las variables de escala son más informativas las medidas como la media, la
mediana, la desviación estándar, la asimetría y otras más, a las cuales se les suele
denominar Medidas de Resumen.

3 comentarios:

  1. Me parece muy buena esta información. Siempre me trabo cuando tengo que definirlas y sus ejemplos me ayudaron mucho!

    ResponderEliminar
  2. Profesor reciba cordiales saludos. Es deseable que siga actualizando su blog, el cual considero de importancia. Gracias

    ResponderEliminar
  3. Muchas gracias por la orientación. Muy clara

    ResponderEliminar