Tablas univariadas y bivariadas (TABLES)

37    Tablas univariadas y bivariadas (TABLES)


37.1  Descripción general

El uso principal de TABLES es obtener listados de tablas de frecuencias univariadas y bivariadas con la opción de mostrar porcentajes de fila, columna y esquina, y de manera opcional, estadísticas univariadas y bivariadas. También se pueden obtener tablas de valores medios de una variable.

Ambos las tablas univariadas/bivariadas y estadísticas bivariadas se pueden bajar a un archivo de manera que se utilicen desde un programa generador de informes con un formato escogido por el mismo usuario, o puede entrar a GraphID u otros paquetes, tales como EXCEL, por despliegue gráfico.

Tablas univariadas. Se pueden generar frecuencias univariadas y frecuencias univariadas acumulativas para cualquier número de variables de entrada y se pueden también expresar como porcentajes de la frecuencia total ponderada o sin ponderar. Adicionalmente se puede obtener la media de una variable de celda.

Tablas bivariadas. Se puede generar cualquier número de tablas bivariadas. Adicionalmente a las frecuencias ponderadas y/o sin ponderar, una tabla puede tener frecuencias expresadas como porcentajes basados en los marginales por fila y columna o en el total de la tabla y la media de una variable de una celda. Todos estos ítems se pueden incluir en una sola tabla hasta con seis ítems por celda, o bién, se puede imprimir cada una individualmente como una tabla separada.

Estadísticas univariadas. Para análisis univariado, se dispone de las siguientes estadísticas: media, moda, mediana, variancia (sin asimetría), desviación estándar, coeficiente de variación, asimetría y kurtosis. Existe también una opción de cuantiles (NTILE). Se puede solicitar una división desde tres partes hasta diez partes.

Estadísticas bivariadas. Para el análisis bivariado, se pueden solicitar las siguientes estadísticas:

- pruebas-t de medias (asume poblaciones independientes) entre pares de filas,
- Ji-cuadrada, coeficiente de contingencia y V de Cramer,
- Taus de Kendall, Gama, Lambdas,
- S (numerador de las estadísticas taus y gama), su desviación estándar y normal, y su variancia,
- ro de Spearman,
- estadísticas para medicina basada en evidencia (EBM),
- pruebas no paramétricas: Wilcoxon, Mann-Whitney y Fisher.

Matrices de estadísticas. Con excepción de las pruebas, estadísticas EBM o estadísticas que involucren a S, se pueden imprimir o bajar a un archivo, matrices con todas las estadísticas bivariadas mencionadas. Se pueden producir las matrices correspondientes a n ponderadas o sin ponderar.

Tablas de 3 y de 4 entradas. Estas tablas se pueden construir haciendo uso de las posibilidades de repetición y de división en subconjuntos. La variable de repetición se puede pensar como una variable de control o de panel. La posibilidad de dividir en subconjuntos puede usarse para escoger más casos para un grupo en particular de tablas.

Tablas de sumas. Se pueden producir tablas en las cuales las celdas contengan la suma de una variable dependiente si se especifica la variable dependiente como el factor de ponderación. Por ejemplo, WEIGHT=V208, donde V208 representa el ingreso de un encuestado, y se quiere obtener el ingreso total de todos los encuestados en una sola celda.

Nota. Se tienen las siguientes opciones para controlar la presentación de los resultados:

    Se puede asignar un título para cada conjunto de tablas.

    Se pueden imprimir porcentajes y las medias en tablas separadas si se desea.

    Se puede suprimir la malla de celdas.

    Se pueden imprimir las filas que no tengan entradas en una sección particular de una tabla de frecuencias grande; las tablas que tengan más de diez columnas se imprimen por secciones y el uso de la opción "zero rows (cero filas)" asegura que las diferentes secciones tengan el mismo número de filas (lo cual es importante si éstas se van a recortar y pegar posteriormente).


37.2  Características estándar de IDAMS

Selección de casos y variables. Se puede usar el filtro estándar para escoger un subconjunto de casos de los datos de entrada. Además, se pueden usar filtros locales y factores de repetición (llamados especificaciones de subconjunto) para escoger un subconjunto de casos para una tabla en particular. En tablas especificadas individualmente, la variable o variables a utilizar con la tabla se escogen con los parámetros de especificación de tabla R y C. Para conjuntos de tablas, las variables se seleccionan con los parámetros de especificación de tabla ROWVARS y COLVARS.

Transformación de datos. Se pueden usar las proposiciones de Recode. Nótese que para las variables R el programa utiliza el número de cifras decimales dado en el parámetro NDEC.

Ponderación de datos. Se puede especificar, de manera opcional, una variable de ponderación para cada conjunto de tablas. Las variables V y R con decimales se multiplican por un factor de escala para obtener valores enteros. Ver la sección "Dataset de entrada" abajo.

Cuando el valor de la variable de ponderación para un caso es cero, negativo, dato faltante o no numérico, entonces el caso siempre se omite; se imprime el número de casos así tratados.

Tratamiento de datos faltantes.

  1. El parámetro MDVALUES está disponible para indicar cuales valores de datos faltantes, si los hay, se usarán para verificar los datos faltantes.
  2. Las frecuencias univariadas y bivariadas se imprimen siempre para todos los códigos en los datos sin importar si se trata de datos faltantes o no. Para retirar completamente de las tablas los datos faltantes, se puede especificar un filtro o un subconjunto de casos. Alternativamente, se pueden definir valores máximos y/o mínimos de las variables de fila y de columna.
  3. Los casos con datos faltantes, se pueden opcionalmente incluir en los cálculos de porcentajes y de las estadísticas bivariadas. Esto se puede hacer con el parámetro de tabla MDHANDLING.
  4. Los casos con datos faltantes en la variable de celda se excluyen siempre de las tablas univariadas y bivariadas.
  5. Los casos con datos faltantes, se excluyen siempre de los cálculos de las estadísticas univariadas.

37.3  Resultados

Diccionario de entrada. (Opcional: ver el parámetro PRINT). Registros descriptores de variables y registros C, si los hay, solamente para variables utilizadas en la ejecución.

Una tabla de contenido del listado. El contenido indica cada tabla producida y da el número de página en el cual está localizada. Se suministra la información siguiente:

    - números de variables de fila y columna (0 si no hay)
    - numero de variable para el valor de la media - variable de celda (0 si no hay)
    - número de la variable de ponderación (0 si no hay)
    - valores mínimo y máximo de fila (0 si no hay)
    - valores mínimo y máximo de columna (0 si no hay)
    - nombre de filtro y nombre del factor de repetición
    - porcentajes: fila, columna y total (T=solicitado, F=no solicitado)
    - RMD: datos faltantes para la variable de fila (T=eliminar, F=no eliminar)
    - CMD: datos faltantes para la variable de columna (T=eliminar, F=no eliminar)
    - CHI: Ji-cuadrada (T=solicitada, F=no solicitada)
    - TAU: tau a, b o c (T=solicitada, F=no solicitada)
    - GAM: gama (T=solicitada, F=no solicitada)
    - TEE: pruebas t (T=solicitadas, F=no solicitadas)
    - EXA: prueba no paramétrica de Fisher (T=solicitada, F=no solicitada)
    - WIL: prueba no paramétrica de Wicoxon (T=solicitada, F=no solicitada)
    - MW: prueba no paramétrica de Mann-Whitney (T=solicitada, F=no solicitada)
    - SPM: ro de Spearman (T=solicitada, F=no solicitada)
    - EBM: estadísticas para medicina basada en evidencia (T=solicitadas, F=no solicitadas).
Las tablas que se solicitan con los parámetros de tabla PRINT=MATRIX o WRITE=MATRIX no se imprimen en el contenido y siempre se imprimen primero con números de página y de tabla negativos.

Otras tablas se imprimen en el orden de las especificaciones de la tabla, excepto para aquellas en las cuales sólo se hayan solicitado las estadísticas univariadas; éstas siempre se agrupan juntas al final del listado.

Tablas bivariadas. Cada tabla bivariada comienza en una página nueva; una tabla grande puede ocupar más de una página. Las tablas se imprimen con un máximo hasta de 10 columnas y 16 filas por página, según el número de ítems de cada celda. Las filas y columnas se imprimen sólo para los códigos que aparezcan en los datos. Los totales de filas y columnas y las frecuencias acumuladas marginales y porcentajes se imprimen, si así se ha solicitado, alrededor de los bordes de la tabla.

Una tabla grande se imprime por tiras verticales. Por ejemplo, una matriz con 40 filas de códigos y 40 columnas de codigos se imprimiría normalmente en 12 páginas tal como se muestra en el siguiente diagrama, en el cual los números en las celdas muestran el orden en el cual se imprimen las páginas:


                              primeros   segundos   terceros   cuartos
                              10         10         10         10         códigos

     primeros 16 códigos      1          4          7          10

     segundos 16 codigos      2          5          8          11

     últimos 8 códigos        3          6          9          12
Estadísticas bivariadas. (Opcional: ver el parámetro de tabla STATS)

Pruebas-t. (Opcional: ver el parámetro de tabla STATS). Si se solicitan pruebas-t, se imprimen éstas y las medias y las desviaciones estándar de la variable de columna para cada fila en una página separada.

Matrices de estadísticas bivariadas. (Opcional: ver el parámetro de tabla PRINT). Se imprime la esquina inferior izquierda de la matriz. Se imprimen 8 columnas y 25 filas por página.

Matriz de las N. (Opcional: ver el parámetro de tabla PRINT). Se imprime con el mismo formato de la matriz estadística correspondiente.

Tablas univariadas. (Opcional: ver el parámetro de tabla CELLS). Normalmente, cada tabla univariada se imprime al comienzo de una nueva página. Se imprimen las frecuencias, porcentajes y las medias de una variable, si se han solicitado, para diez códigos en una página.

Estadísticas univariadas. (Opcional: ver el parámetro de tabla USTATS).

Cuantiles. (Opcional: ver el parámetro de tabla NTILE). Se imprimen N-1 puntos, por ej. si se han solicitado cuartiles, el parámetro NTILE toma el valor 4 y se imprimen 3 puntos de separación.

Numeración de páginas. Es de la forma ttt.rr.ppp donde:


ttt = número de la tabla
rr = número de repetición (00 si no se usa)
ppp = número de página dentro de cada tabla.


37.4  Tablas univariadas/bivariadas de salida

Se pueden obtener en un archivo, tablas univariadas y bivariadas con las estadísticas solicitadas en el parámetro CELLS, si se especifica WRITE=TABLES. Las tablas están en el formato de matriz rectangular de IDAMS (ver el capítulo "Los datos en IDAMS"). Se produce una matriz para cada estadística solicitada. Si se usa un factor de repetición, se produce una matriz para cada repetición.

Las columnas 21-80 del registro descriptor de la matriz, contienen la siguiente descriptión adicional de la matriz:

21-40  
Nombre de la variable de fila (para tablas bivariadas).
41-60  
Nombre de la variable de columna.
61-80  
Descripción de los valores en la matriz.

Los registros de identificación de variable (#R and #C) contienen valores y nombres de código para las variables de fila y de columna respectivamente.

Las estadísticas se escriben como registros de 80 caracteres de acuerdo con un formato Fortran 7F10.2. Las columnas 73-80 contienen un identificador de la manera siguiente:

73-76  
Identificación de la estadística: FREQ, UNFR, ROWP, COLP, TOTP o MEAN.
77-80  
Número de tabla.

Nótese que los códigos de datos faltantes no se incluyen en la matriz.

37.5  Matrices de estadísticas bivariadas de salida

Se pueden seleccionar estadísticas para bajarlas a un archivo. Por ejemplo, si se han seleccionado gamas y taus, entonces se generará una matriz de gamas y una matriz de taus separadamente. Las matrices de salida de estadísticas bivariadas se solicitan con las especificaciones WRITE=MATRIX o bién con los parámetros de tabla ROWVARS o ROWVARS y COLVARS. Si se usa un factor de repetición, se baja al archivo una matriz por cada repetición. Las matrices son de la forma matriz de IDAMS cuadrada o rectangular (ver el capítulo "Los datos en IDAMS"). Los valores en la matriz se escriben con el formato Fortran 6F11.5. Las columnas 73-80 contienen la siguiente identificación:

73-76  
Identificación de la estadística: TAUA, TAUB, TAUC, GAMM, LSYM, LRD, LCD, CHI, CRMV o RHO.
77-80  
Número de tabla.

Nota. Si se suministra sólo ROWVARS, se escriben registros de medias y desviaciones estándar ficticias, 2 registros por 60 variables. El segundo registro de formato (#F) en el diccionario especifica un formato 60I1 para estos registros ficticios. Esto se hace de manera que la matriz se ajuste al formato de una matriz IDAMS cuadrada.

37.6  Dataset de entrada

La entrada es un archivo Datos descrito por un diccionario IDAMS. Excepto variables del filtro principal, todas otras variables referidas deben ser numéricas.

En distribuciones y ponderaciones, las variables V y R con cifras decimales se multiplican por un factor de escala para obtener valores enteros. Este factor se calcula como 10n donde n es el número de decimales del diccionario para las variables V y del parámetro NDEC para las variables R, y aparece en los resultados para cada variable.

Estadísticas univariadas sin distribuciones se calculan usando el número de decimales del diccionario para las variables V y del parámetro NDEC para las variables R.

Los campos con caracteres no-numéricos (incluidos campos en blanco) se pueden tabular con el parámetro BADDATA con MD1 o MD2. Ver el capítulo "El archivo Setup de IDAMS".

37.7  Estructura del setup


 
     $RUN TABLES
   
     $FILES
          Especificación de archivos
 
     $RECODE (opcional)
          Proposiciones de Recode
 
     $SETUP
          1. Filtro (opcional)
          2. Título
          3. Parámetros
          4. Especificaciones de subconjuntos (opcional)
          5. TABLES
          6. Especificaciones de tablas (tantas como sean necesarias)
 
     $DICT (condicional)
          Diccionario

     $DATA (condicional)
          Datos

 
     Archivos:
     FT02       tablas/matrices de salida
     DICTxxxx   diccionario de entrada (omitir si se usa $DICT)
     DATAxxxx   datos de entrada (omitir si se usa $DATA)
     PRINT      resultados (por defecto IDAMS.LST)

37.8  Proposiciones de control del programa

Referirse al el capítulo "El archivo Setup de IDAMS" para una descripción más detallada de las proposiciones de control del programa, 1-3 y 6 a continuación.

  1. Filtro (opcional). Selecciona un subconjunto de casos para usar en la ejecución.
    
         Ejemplo:  INCLUDE  V3=6
    
  2. Título (mandatorio). Una línea que contenga hasta 80 caracteres para titular los resultados.
    
         Ejemplo:  TABLAS DE FRECUENCIAS
    
  3. Parámetros (mandatorio). Para seleccionar opciones del programa. Los nuevos parámetros son precedidos por un asterisco.
    
         Ejemplo:  BADDATA=SKIP
    
    INFILE=IN /xxxx
    Un sufijo de ddname de 1-4 caracteres para los archivos Diccionario y Datos de entrada.
    Por defecto: DICTIN, DATAIN.

    BADDATA=STOP /SKIP/MD1/MD2

    Tratamiento de los datos no numéricos. Ver el capítulo "El archivo Setup de IDAMS".

    MAXCASES=n

    Número máximo de casos (después de filtrar) a usar del archivo de entrada.
    Por defecto: se usan todos los casos.

    MDVALUES=BOTH /MD1/MD2/NONE

    Cuales valores de datos faltantes se van a usar para las variables accedidas en esta ejecución. Ver el capítulo "El archivo Setup de IDAMS".

    * NDEC=0 /n

    Número de decimales (máximo 4) a conservar para las variables R.

    PRINT=(CDICT/DICT, TIME)

    CDIC 
    Imprimir el diccionario de entrada para las variables accedidas con registros C, si los hay.
    DICT 
    Imprimir el diccionario de entrada sin registros C.
    TIME 
    Imprimir el tiempo después de cada tabla.

  4. Especificaciones de subconjuntos (opcional). Estas proposiciones permiten escoger un subconjunto de casos para una tabla o un conjunto de tablas.
    
         Ejemplo:  CLASS     INCLUDE V8=1,2,3,-7,9
    
    Hay dos clases de especificación de subconjunto: filtros locales y factores de repetición. Cada uno tiene una función diferente, pero sus formatos son muy similar. Una especificación se puede utilizar como filtro local para una o más tablas y como un factor de repetición para otras.

    Reglas de codificación

    Prototipo: nombre proposición

    nombre

    Nombre del subconjunto. 1-8 caracteres alfanuméricos comenzando con una letra. Este nombre debe coincidir exactamente con el nombre usado en las especificaciones de análisis subsecuentes. Blancos intercalados no se permiten. Se recomienda que todos los nombres se justifiquen a la izquierda.

    proposición

    Definición del subconjunto que siga la sintáxis del filtro estándar de IDAMS.

    Para los factores de repetición, sólo se puede especificar una variable en la expresión.

    A continuación se describe como trabajan los filtros locales y los factores de repetición.

    Filtros locales. Una especificación de subconjunto se identifica como un filtro local para una tabla o un conjunto de tablas, al especificar el nombre del subconjunto con el parámetro FILTER. El filtro local funciona de la misma manera que el filtro estándar excepto que se aplica solamente a las especificaciones de la tabla en la cual ha sido referido.

    
         Ejemplo:  EDUCATN                INCLUDE V4=0-4,9 AND V5=1
                   (nombre subconjunto)   (expresión)
    
    En el ejemplo anterior, si EDUCATN se define como filtro local en las especificaciones de la tabla, la tabla se produciría con la inclusión de sólo aquellos casos con códigos 0,1,2,3,4 o 9 para V4 y 1 para V5.

    Factores de repetición. Una especificación de subconjunto se identifica como un factor de repetición para una tabla o un conjunto de tablas, al especificar el nombre del subconjunto con el parámetro REPE. Sólo se debe dar una variable en una especificación de subconjunto para usarla como factor de repetición. Los factores de repetición permiten la generación de tablas de 3 entradas, en donde la variable utilizada en el factor de repetición, se puede considerar como una variable de control o de panel. Si se utiliza un factor de repetición y un filtro, se puede obtener una tabla de 4 entradas.

    Las expresiones INCLUDE, hacen que las tablas producidas incluyan los casos para cada valor o rango de valores de la variable de control utilizada en la expresión. Los valores o rangos se separan con comas. Así si hay n comas en la expresión, se producirán n+1 tablas.

    
         Ejemplo:  EDUCATN                INCLUDE V4=0-4,9
                   (nombre subconjunto)   (expresión)
    
    En el ejemplo anterior, si EDUCATN se designa como un factor de repetición, resultarán dos tablas: una que la incluye los casos codificados 0-4 para la variable 4, y otra que incluye los casos codificados 9 para la variable 4.

    EXCLUDE se puede usar para producir tablas con todos los valores excepto aquellos especificados.

    
         Ejemplo:  EDUCATN                EXCLUDE V1=1,4
                   (nombre subconjunto)   (expresión)
    
    En el ejemplo anterior, si EDUCATN se designa como un factor de repetición, resultarán dos tablas: una con todos los valores excepto 1 y otra con todos los valores excepto 4.

  5. TABLES. La palabra TABLES en esta línea, señala que siguen especificaciones de tablas. Debe incluirse (con el objeto de separar las especificaciones de subconjuntos de las especificaciones de tablas) y sólo debe aparecer una vez.

  6. Especificaciones de tablas. Las especificaciones de tablas se utilizan para describir las características de las tablas que se van a producir. Las reglas de codificación son las mismas de los parámetros. Cada conjunto de especificaciones de tabla debe comenzar en una línea nueva.
    
    Ejemplos:  
    
         R=(V6,1,8) CELLS=FREQS           (una tabla univariada)
         R=(V6,1,8) C=(V9,0,4) -          (una tabla bivariada con factor de repetición,
           REPE=SEX CELLS=(ROWP,FREQS)     es decir tabla de 3 entradas)
         ROWV=(V5-V9) CELLS=FREQS -       (conjunto de tablas univariadas)
            USTA=MEAN                                            
         ROWV=(V3,V5) COLV=(V21-V31) -    (conjunto de tablas bivariadas)
            R=(0,1,8) C=(0,1,99)                                  
    

    ROWVARS=(lista de variables)

    Lista de variables para la cual se requieren tablas univariadas o lista de variables que se va a usar como filas en tablas bivariadas.

    COLVARS=(lista de variables)

    Lista de variables a usar como columnas para tablas bivariadas.

    R=(var, rmin, rmax)

    var 
    Número de variable de fila o de variable univariada de una tabla individual. Para suministrar los valores máximos y mínimos de un conjunto de tablas, coloque el número de variable en ceros, por ej. R=(0,1,5); en este caso los códigos máximos y mínimos se aplican a todas las variables en el parámetro ROWVARS.
    rmin 
    Código mínimo de la(s) variable(s) de fila para los cálculos estadísticos y de porcentajes.
    rmax 
    Código máximo de la(s) variable(s) de fila para los cálculos estadísticos y de porcentajes.

    Si se especifica rmin o rmax, entonces se deben especificar ambos. Si sólo se especifica el número de variable, los valores máximos y mínimos no se aplican.

    C=(var, cmin, cmax)

    var 
    Número de variable de columna para una tabla bivariada individual. Para suministrar los valores máximos y mínimos de un conjunto de tablas, coloque el número de variable en ceros, por ej. C=(0,2,5); en este caso los códigos máximos y mínimos se aplican a todas las variables en el parámetro COLVARS.
    cmin 
    Código mínimo de la(s) variable(s) de columna para los cálculos estadísticos y de porcentajes.
    cmax 
    Código máximo de la(s) variable(s) de columna para los cálculos estadísticos y de porcentajes.

    Si se especifica cmin o cmax, entonces se deben especificar ambos. Si sólo se especifica el número de variable, los valores máximos y mínimos no se aplican.

    TITLE='título de la tabla'

    Título para imprimir en el encabezamiento de cada tabla en este conjunto.
    Por defecto: no imprime título.

    CELLS=(ROWPCT, COLPCT, TOTPCT, FREQS /NOFREQS, UNWFREQS, MEAN)

    Contenido de las celdas de tablas cuando se ha especificado PRINT=TABLES o WRITE=TABLES.
    ROWP 
    Porcentajes para tablas univariadas o porcentajes basados en totales de fila para tablas bivariadas.
    COLP 
    Porcentajes basados en totales de columnas en tablas bivariadas.
    TOTP 
    Porcentajes basados en el gran total en tablas bivariadas.
    FREQ 
    Conteos de frecuencia ponderada (el mismo sin ponderar si no se especifica WEIGHT).
    UNWF 
    Conteos de frecuencia sin ponderar.
    MEAN 
    Media de la variable especificada por VARCELL.

    VARCELL=número de variable

    El número de la variable para la cual se va calcular la media en cada celda de la tabla.

    MDHANDLING=ALL /R/C/NONE

    Indica cuales valores de datos faltantes deben excluirse de los cálculos de porcentajes y estadísticas bivariadas.
    ALL 
    Eliminar todos los valores de datos faltantes.
    Eliminar los valores de datos faltantes para las variables de fila.
    Eliminar los valores de datos faltantes para las variables de columna.
    NONE 
    No eliminar valores de datos faltantes.
    Nota: los casos con datos faltantes siempre se excluyen de las estadísticas univaridas.

    WEIGHT=número de variable

    Número de la variable de ponderación, si se van a ponderar los datos.

    FILTER=xxxxxxxx

    El nombre de 1-8 caracteres de la especificación de subconjunto que se va a usar como filtro local. Debe estar encerrado entre comillas sencillas si tiene caracteres no-alfanuméricos. Si el nombre no coincide con alguno de los nombres de las especificaciones de subconjunto, se salta la tabla. Se deben usar letras mayúsculas con el objeto de hacer encajar el nombre en la especificación de subconjuntos el cual se convierte automáticamente a mayúsculas.

    REPE=xxxxxxxx

    El nombre de 1-8 caracteres de la especificación de subconjunto que se va a usar como factor de repetición. Debe estar encerrado entre comillas sencillas si tiene caracteres no-alfanuméricos. Si el nombre no coincide con alguno de los nombres de las especificaciones de subconujunto, se salta la tabla. Las tablas se repetirán para cada grupo de casos especificado. Se deben usar letras mayúsculas con el objeto de hacer encajar el nombre en la especificación de subconjuntos el cual se convierte automáticamente a mayúsculas.

    USTATS=(MEANSD, MEDMOD)

    (Sólo tablas univariadas).
    MEAN 
    Imprimir media, mínimo, máximo, variancia (sin asimetría), desviación estándar, coeficiente de variación, asimetría, kurtosis, total de casos ponderados y sin ponderar.
    MEDM 
    Imprimir mediana y moda (si hay ataduras, se escoge el valor numérico más pequeño).

    NTILE=n

    (Sólo tablas univariadas).
    La n es el número de cuartiles que se van a calcular; debe estar en el rango 3-10.

    STATS=(CHI, CV, CC, LRD, LCD, LSYM, SPMR, GAMMA, TAUA, TAUB, TAUC, EBMSTAT,
      WILC, MW, FISHER, T)

    Si se va imprimir o producir como salida alguna de las estadísticas bivariadas, suministrar el parámetro STAT con cada una de las estadísticas deseadas.
    Tablas bivariadas y matrices de salida
    CHI 
    Ji-cuadrada. (Si no se ha pedido MATRIX, la selección de CHI, CV o CC hará que se calculen las tres).
    CV 
    V de Cramer.
    CC 
    Coeficiente de contingencia.
    LRD 
    Lambda, variable de fila es la variable dependiente. (Si no se ha pedido MATRIX, la selección de cualquiera de las lambdas hará que se calculen las tres).
    LCD 
    Lambda, variable de columna es la variable dependiente.
    LSYM 
    Lambda, simétrica.
    SPMR 
    Estadística Ro de Spearman.
    GAMM 
    Estadística Gama.
    TAUA 
    Estadística tau a. (Si no se ha pedido MATRIX, la selección de cualquiera de las taus hará que se calculen las tres).
    TAUB 
    Estadística tau b.
    TAUC 
    Estadística tau c.

    Tablas bivariadas solamente
    EBMS 
    Estadísticas para medicina basada en evidencia.
    WILC 
    Prueba de rangos con signo de Wilcoxon.
    MW 
    Prueba de Mann-Whitney.
    FISH 
    Prueba exacta de Fisher.
    Pruebas-t entre todas las combinaciones de filas, hasta un límite de 50 filas.

    DECPCT=2 /n

    Número de decimales impresos para porcentajes, máximo cuatro.

    DECSTATS=2 /n

    Número de decimales impresos para las estadísticas media, mediana, taus, gama, lambdas y Ji-cuadrada. Todas las demás estadísticas se imprimirán con 2+n decimales (es decir, por defecto 4).

    WRITE=MATRIX/TABLES

    Si se va a generar un archivo de salida, se debe suministrar el parámetro WRITE y el tipo de salida.
    MATR 
    Bajar al archivo las matrices de estadísticas seleccionadas.
    Si el parámetro ROWVARS se especifica, se produce una matriz cuadrada para cada estadística solicitada en el parámetro STATS con todos los apareamientos de las variables que aparecen en la lista.
    Si se especifican los parámetros ROWVARS y COLVARS, se produce una matriz rectangular para cada estadística solicitada en el parámetro STATS con cada variable que aparezca en la lista de ROWVARS, apareada con cada variable que aparezca en la lista de COLVARS.
    TABL 
    Bajar al archivo las tablas de estadísticas solicitadas en el parámetro CELLS.

    PRINT=(TABLES /NOTABLES, SEPARATE, ZEROS, CUM, GRID /NOGRID,
      N, WTDN, MATRIX)

    Opciones que se refieren a tablas univariadas/bivariadas solamante.
    TABL 
    Imprimir las tablas con ítems especificados por CELLS.
    SEPA 
    Imprime cada ítem especificado en CELLS como una tabla separada.
    ZERO 
    Mantener las filas con marginales cero en el listado. (Sólo aplica si la tabla tiene más de 10 columnas y por lo tanto ha de imprimirse por tiras).
    CUM 
    Imprimir frecuencias y porcentajes acumulados y marginales por fila y columna. Si los datos son ponderados, las cifras se calculan sobre frecuencias ponderadas solamente.
    GRID 
    Imprimir la malla alrededor de las celdas de tablas bivariadas.
    NOGR 
    Suprimir la malla alrededor de las celdas de tablas bivariadas.

    Opciones que se refieren a WRITE=MATRIX solamente.
    Imprimir la matriz de las n para las matrices de estadísticas solicitadas.
    WTDN 
    Imprimir la matriz de las n ponderadas, para las matrices de estadísticas solicitadas.
    MATR 
    Imprimir las matrices de estadísticas especificadas con STATS.

37.9  Restricciones

  1. El número máximo de variables para frecuencias univariadas es 400.
  2. La combinación de variables y especificaciones de subconjuntos está sujeta a la siguiente restricción:
      5NV + 107NF < 8499
    donde NF es el número de especificaciones de subconjuntos y NV es el número de variables.
  3. Los valores de los códigos en tablas univariadas deben estar dentro del rango -2,147,483,648 a 2,147,483,647.
  4. Los valores de los códigos para tablas bivariadas deben estar en el rango -32,768 a 32,768. Cualesquiera valores de código fuera de este rango, se recodifican inmediatamente a los valores de los puntos extremos del rango, por ej. -40,000 se recodificará a -32,768 y 40,000 se convertirá en 32,768. De esta manera, en las especificaciones de tablas bivariadas, 32,768 corresponde al máximo "valor máximo". (Nótese que una variable de 5 dígitos con un código de datos faltantes de 99999 tendrá en el listado la fila de dato faltante con título 32,768).
  5. La frecuencia máxima acumulada, ponderada o sin ponderar para una tabla (y para cualquier celda, fila o columna) es 2,147,483,647.
  6. Dimensiones máximas de la tabla.
      Bivariada: 500 códigos de fila, 500 códigos de columna, 3000 celdas con entidades diferentes de cero.
      Univariada: 3000 categorías cuando se hayan solicitado frecuencias, mediana/moda; de lo contrario, son ilimitadas.
      Nota: para una variable como ingreso, si hay más de 3000 valores únicos de ingreso, no se puede obtener una mediana o una moda sin antes haber agrupado la variable.
  7. Los valores no enteros de las variables tipo V en distribuciones y ponderaciones se tratan como si no existiera el punto decimal; se imprime un factor de escala para cada variable.
  8. Las pruebas-t de medias entre filas se llevan a cabo solamente en las primeras 50 filas de una tabla.
  9. Para la salida de la matriz de estadísticas bivariadas, el máximo número de variables por fila o columna es de 95.
  10. Si se van a producir archivos de salida para frecuencias bivariadas y matrices de estadísticas, todos van al mismo archivo físico de salida.
  11. Cuando se utilizan variables recodificadas, no se pueden titular las filas y las columnas de las tablas.

37.10  Ejemplo

En el ejemplo a continuación, se piden las siguientes tablas:

  1. Conteos de frecuencia para las variables V201-V220.
  2. Estadísticas univariadas sin tablas de frecuencias para las variables V54-V62 y V64. Las medias tendrán un decimal y las demás estadísticas 3 decimales.
  3. Conteos de frecuencias ponderadas y sin ponderar y porcentajes con frecuencias acumuladas y porcentajes para las variables V25-V30 y la versión agrupada de la variable V7. Los casos con datos faltantes no se excluirán de los porcentajes o de las estadísticas. Se solicitan la mediana y la moda.
  4. Para las categorías de la variable individual V201, se piden conteos de frecuencias y la media de la variable V54.
  5. 8 tablas bivariadas (con variables de fila V25-V28 y variables de columna V29, V30) repetidas por los valores 1 y 2 de la variable 10 (sexo), es decir que la variable sexo se utiliza como variable de panel (control). En cada celda habrá conteos, porcentajes por filas, por columnas y por totales. Se piden las estadísticas Ji-cuadrada y Taus.
  6. Tablas de 3 entradas con la región (V3) agrupada en tres categorías como variable de panel. Las tablas se restringen a casos de hombres solamente (V10=1). En cada celda aparecerán conteos de frecuencias y media de la variable V54.
  7. Una tabla de conteos de frecuencia ponderada individual, con exclusión de los casos en los cuales la variable de fila y/o de columna tomen el valor de 9.
  8. Las matrices de las estadísticas Tau A y Gama se imprimirán y se bajarán a un archivo para todos los pares de variables V54-V62. También se imprimirá una matriz de conteo de casos válidos para cada par de variables.

          $RUN TABLES
          $FILES
          PRINT  = TABLES.LST
          FT02   = TREE.MAT             matrices de estadísticas
          DICTIN = TREE.DIC             archivo Diccionario de entrada
          DATAIN = TREE.DAT             archivo Datos de entrada
          $RECODE
              R7=BRAC(V7,0-15=1,16-25=2,26-35=3,36-45=4,46-98=5,99=9)
              NAME R7'V7 AGRUPADA'
          $SETUP
          EJEMPLO DE TABLAS
          BADDATA=MD1
          MALE     INCLUDE V10=1
          SEX      INCLUDE V10=1,2
          REGION   INCLUDE V3=1-2,3-4,5
          MD       EXCLUDE V19=9 OR V52=9
          TABLES
      1.  ROWV=(V201-V220)  TITLE='Conteo de frecuencias'
      2.  ROWV=(V54-V62,V64)  USTATS=MEANSD  PRINT=NOTABLES  DECSTAT=1
      3.  ROWV=(V25-V30,R7)   USTATS=MEDMOD  CELLS=(FREQS,UNWFREQS,ROWP)  -
              WEIGHT=V9  PRINT=CUM  MDHAND=NONE
      4.  R=(V201,1,3)  CELLS=(FREQS,MEAN)  VARCELL=V54
      5.  ROWV=(V25-V28)  COLV=(V29-V30)  -
              CELLS=(FREQS,ROWP,COLP,TOTP)  STATS=(CHI,TAUA)  REPE=SEX
      6.  ROWV=(V201-V203)  COLV=V206  -
              CELLS=(FREQS,MEAN)  VARCELL=V54  REPE=REGION  FILT=MALE
      7.  R=V19  C=V52  WEIGHT=V9  FILT=MD
      8.  ROWV=(V54-V62)  STATS=(TAUA,GAMMA)  PRINT=(MATRIX,N)  WRITE=MATRIX