Ordenamiento de alternativas (RANK)

34    Ordenamiento de alternativas (RANK)


34.1  Descripción general

RANK ofrece un ordenamiento razonable de alternativas, utilizando datos preferenciales como entrada y tres procedimientos de categorización, uno basado en la lógica clásica (el método ELECTRE) y otros dos basados en lógica difusa. Los dos métodos se diferencian esencialmente en la manera de construir las matrices relacionales. Con rangos difusos, los datos determinan completamente el resultado mientras que con el ordenamiento por el método clásico, el usuario, basado en los conceptos de la lógica clásica, tiene la posibilidad de controlar el cálculo de las relaciones que están por encima de las alternativas.

El método ELECTRE (lógica clásica) implementado en RANK, en un primer paso, utiliza los datos preferenciales de entrada para calcular una matriz final que expresa la opinión total colectiva acerca de la "dominancia" entre las alternativas, la estructura de relación no corresponde necesariamente a un ordenamiento lineal o parcial. La relación de "dominancia" para cada par de alternativas se controla por las condiciones de "concordancia" y "discordancia" establecidas por el usuario. Se pueden obtener diferentes relaciones estructurales a partir de los mismos datos al cambiar los parámetros de análisis. En el segundo paso, el procedimiento busca una secuencia de capas (o núcleos) de alternativas no dominadas. El primer núcleo consiste en las alternativas de más alto rango en todo el conjunto considerado. Debe notarse que en ciertos casos puede que no existan más núcleos, debido a bucles dentro de la relación. Esto puede ser verdad aún en el nivel más alto.

El primer método difuso (capas no dominadas) se desarrolló originalmente para resolver problemas de toma de decisiones con información difusa. Este método permite encontrar una secuencia de núcleos de alternativas no dominados dentro de una estructura de preferencia difusa, la cual no representa necesariamente un orden (total) lineal. Los núcleos subsiguientes son aquellos grupos de alternativas que tengan el rango más alto dentro las alternativas que no pertenezcan a los núcleos previos de nivel más alto. El primer núcleo comprende las alternativas de rango más alto dentro todo el conjunto considerado.

El segundo método difuso (rangos) trata de encontar la credibilidad de frases como "la j-ésima alternativa está exactamente en la posición p-ésima dentro el orden por rangos". Los resultados son claros en el caso de una relación lineal (total) en los datos; de lo contrario, se debe tener cuidado al interpretar los resultados. El proceso de optimización, desarrollado para manejar el caso general (normalizado o no-normalizado), permite al usuario decidir si debe normalizar o no la matriz relacional difusa antes del proceso de rangos (ver opción NORM). Después de la normalización se necesita un proceso cuidadoso de interpretación de los resultados. Usualmente datos incompletos resultan en una matriz relacional no-normalizada, especialmente cuando se usa DATA=RAWC y el número seleccionado de alternativas en respuestas individuales es más pequeño que el número de alternativas posibles. Aunque una matriz no-normalizada produce resultados en los cuales el nivel de incertidumbre es más alto, puede suministrar un cuadro más realista acerca de la relación latente que determina los datos; en verdad la normalización se puede interpretar como una clase de extrapolación.

Se pueden especificar dos tipos de relación individual preferencial (estricta o débil), en caso de que los datos que representen una selección de alternativas y en caso de que los datos representen alternativas por rangos.

  1. Datos que representan una selección de alternativas.
    • Preferencia estricta: se considera que cada alternativa seleccionada tiene un único rango (diferente) y a las no seleccionadas se les asigna el mismo rango más bajo.
    • Preferencia débil: se considera que todas las alternativas seleccionadas tienen un mismo rango común , el cual es más alto que el rango de las no seleccionadas.

  2. Datos que representan una ordenación de alternativas por rango.
    • Preferencia estricta: se considera que todas las alternativas con rangos tienen diferentes valores y las relaciones entre las alternativas del mismo rango se excluyen de los cálculos de la relación de preferencia global entre las alternativas.
    • Preferencia débil: en los cálculos se tienen en cuenta las alternativas con el mismo rango.

34.2  Características estándar de IDAMS

Selección de casos y variables. Se puede usar el filtro estándar para escoger un subconjunto de casos de los datos de entrada y se usa el parámetro VARS para seleccionar las variables.

Transformación de datos. Se pueden usar las proposiciones de Recode. Nótese que el programa sólo utiliza la parte entera de las variables recodificadas, es decir que estas variables se redondean al entero más próximo.

Ponderación de datos. Los datos se pueden ponderar con valores enteros. Nótese que los valores ponderados se redondean al entero más próximo. Cuando el valor de la variable de ponderación para un caso es cero, negativo, dato faltante o no numérico, entonces el caso siempre se omite; se imprime el número de casos así tratados.

Tratamiento de datos faltantes. Se puede usar el parámetro MDVALUES para indicar cuales valores de datos faltantes se van a usar para la verificación de los datos faltantes. Para DATA=RAWC, las variables con datos faltantes se saltan; para DATA=RANKS, los valores faltantes se sustituyen con el rango más bajo.

34.3  Resultados

Diccionario de entrada. (Opcional: ver el parámetro PRINT). Registros descriptores de variables y registros C, si los hay, solamente para variables utilizadas en la ejecución.

Datos inválidos. Mensajes acerca de los datos incorrectos (rechazados).

Métodos basados en la lógica difusa (METHOD=NOND/RANKS)

Matriz de relaciones. Se imprime por filas una matriz cuadrada que representa la relación difusa. Si las filas tienen más de 10 elementos, se continúa en la(s) línea(s) siguiente(s).

Descripción de las relaciones. Después de imprimir el tipo de relación, se imprimen tres medidas que caracterizan de manera concisa la relación, a saber: índice de coherencia absoluta, índice de intensidad e índice de dominación absoluta.

Resultados del análisis. Los resultados se presentan de manera diferente para cada método.

Para METHOD=NOND los núcleos se imprimen secuencialmente a partir del rango más alto y para cada uno de ellos se suministra la siguiente información:

su número secuencial con nivel de certeza,
los códigos y los nombres de alternativas o los números y nombres de variables (hasta 8 caracteres),
los valores de la función de pertenencia de las alternativas, indicando que tan fuertemente están ligadas al núcleo; los valores de pertenencia de alternativas que pertenecen a núcleos anteriores se sustituyen por asteriscos,
lista de alternativas que pertenecen al núcleo con el valor de pertenencia más alto (alternativas con mayor credibilidad).

Para METHOD=RANKS se imprime primero la matriz relacional normalizada si se solicitó antes la normalización. Después se imprimen los resultados, de dos maneras para una interepretación más fácil.

  1. Se imprimen secuencialmente todas las alternativas con la siguiente información para cada una:
    código y nombre de la alternativa o número y nombre de variable,
    los valores de la función de pertenencia de la alternativa, indicando que tan fuertemente está conectada con cada rango,
    la lista del rango o de los rangos de mayor credibilidad para esta alternativa.

  2. Se imprimen todos los rangos secuencialmente con la siguiente información para cada uno:
    número de rango,
    códigos y nombres de las alternativas o números y nombres de variables,
    los valores de la función de pertenencia de la alternativas, indicando que tan fuertemente están conectadas con ese rango,
    la lista de la(s) alternativa(s) de mayor credibilidad para ese rango.

Método basado en la lógica clásica (METHOD=CLAS)

Resultado del análisis. Se imprimen, para cada estructura relacional de "dominancia" final que resulta de un análisis, las diferencias de rangos y las proporciones mínimo/máximo de población especificadas por el usuario, seguidas de la lista de núcleos sucesivos no-dominados (identificados por su número secuencial) con las alternativas que les pertenecen.

Nota. Las alternativas se titulan con los 8 primeros caracteres del nombre de la variable para DATA=RANKS o con los 8 caracteres del nombre de código (si hay registros C en el diccionario) para DATA=RAWC.

34.4  Dataset de entrada

La entrada es un archivo Datos descrito por un diccionario IDAMS. Todas las variables del análisis deben tener valores enteros positivos. Nótese que las variables con valores decimales, se redondean al entero más próximo.

Las preferencias se pueden presentar de dos maneras en los datos. En la siguiente ilustración se muestra como hacerlo.

Supongamos que se han recolectado datos acerca de las preferencias de los empleados sobre varios factores relacionados con su trabajo:

Oficina individual
Salario alto
Vacaciones largas
Supervisión mínima
Compatibilidad entre colegas

Las dos maneras de representar ésto en un cuestionario son:

  1. DATA=RAWC
    En este caso, los factores se codifican (1 a 5) y se solicita al encuestado señalarlos en el orden de su preferencia. Las variables en los datos representarían los rangos:
    
              V6  Factor más importante
              V7  Segundo factor más importante
              .
              .
              V10 Factor menos importante
    
    y los códigos asignados a cada una de estas variables por un encuestado representarían los factores (1=oficina individual, 2=salario alto, etc.).

    No es necesario escoger todos los factores posibles, se podrian pedir por ejemplo, los tres más importantes, especificando sólo esas variables de la lista de variables: V6, V7, V8. El número de factores diferentes usados se especifica con el parámetro NALT.

  2. DATA=RANKS
    Aquí, cada factor aparece en el cuestionario como una variable:
    
              V13 Oficina individual
              V14 Salario alto
              .
              .
              V17 Compatibilidad entre colegas
    
    y al encuestado se le invita a asignar un rango a cada uno, en el cual 1 se da al factor más importante, 2 al siguiente, etc. Aquí las variables representan los factores y sus valores representan los rangos. A cada variable se le debe asignar un rango y todos los factores entran siempre al análisis. Los rangos deben codificarse de 1 a n donde n es el número de variables que se consideran.
Notas
  1. Si DATA=RANKS, el código 0 y todos los códigos mayores que n, en donde n es el número de variables (número de alternativas), se tratan como datos faltantes y se les asigna el rango más bajo.
  2. Si DATA=RAWC, los primeros NALT codigos diferentes encontrados durante la lectura de los datos (excluido 0), se usan como códigos válidos. Otros códigos hallados posteriormente en los datos, se toman como códigos ilegales. El cero siempre se trata como un código ilegal. Si el número de alternativas escogidas por los encuestados es menor que NALT, entonces aparecen las alternativas no seleccionadas en el listado con valores de código cero y nombre de código vacío.


34.5  Estructuda del setup


     $RUN RANK
   
     $FILES
          Especificación de archivos
 
     $RECODE (opcional)
          Proposiciones de Recode
  
     $SETUP
          1. Filtro (opcional)
          2. Título
          3. Parámetros
          4. Especificaciones de análisis (tantas como sean necesarias)
             (sólo para lógica clásica)
 
     $DICT (condicional)
          Diccionario

     $DATA (condicional)
          Datos

 
     Archivos:
     DICTxxxx   diccionario de entrada (omitir si se usa $DICT)
     DATAxxxx   datos de entrada (omitir si se usa $DATA)
     PRINT      resultados (por defecto IDAMS.LST)

34.6  Proposiciones de control del programa

Referirse al capítulo "El archivo Setup de IDAMS" para una descripción más detallada de las proposiciones de control del programa, ítems 1-4, a continuación.

  1. Filtro (opcional). Selecciona un subconjunto de casos para usar en la ejecución.
    
         Ejemplo:  INCLUDE  V2=11
    
  2. Título (mandatorio). Una línea que contenga hasta 80 caracteres para titular los resultados.
    
         Ejemplo:  PRIMERA EJECUCION DE RANK
    
  3. Parámetros (mandatorio). Para seleccionar opciones del programa.
    
         Ejemplo:  DATA=RANKS  PREF=STRICT  MDVALUES=NONE  VARS=(V11-V13)
    
    INFILE=IN /xxxx
    Un sufijo de ddname de 1-4 caracteres para los archivos Diccionario y Datos de entrada.
    Por defecto: DICTIN, DATAIN.

    BADDATA=STOP /SKIP/MD1/MD2

    Tratamiento de los datos no numéricos. Ver el capítulo "El archivo Setup de IDAMS".

    MAXCASES=n

    Número máximo de casos (después de filtrar) a usar del archivo de entrada.
    Por defecto: se usan todos los casos.

    MDVALUES=BOTH /MD1/MD2/NONE

    Cuales valores de datos faltantes se van a usar para las variables accedidas en esta ejecución. Ver el capítulo "El archivo Setup de IDAMS".
    Para DATA=RAWC, las variables con datos faltantes no se incluyen en el ordenamiento.
    Para DATA=RANKS, los datos faltantes se recodifican al rango más bajo.

    VARS=(lista de variables)

    Una lista de variables V y/o R a usar en el procedimento de rangos.
    Sin valor por defecto.

    WEIGHT=número de variable

    Número de la variable de ponderación, si se van a ponderar los datos.

    METHOD=(CLASSICAL /NOCLASSICAL, NONDOMINATED, RANKS)

    Especifica el método a usar en el análisis.
    CLAS 
    Método de lógica clásica (ELECTRE).
    NOND 
    Método difuso 1, llamado capas no dominadas.
    RANK 
    Método difuso 2, llamado rangos.

    DATA=RAWC /RANKS

    Tipo de datos.
    RAWC 
    Las variables corresponden a los rangos (la primera variable de la lista tiene el primero rango, la segunda el segundo, etc.), y su valor es el número del código de la alternativa seleccionada.
    RANK 
    Las variables representan las alternativas, sus valores son los rangos de las alternativas correspondientes.

    PREF=STRICT /WEAK

    Determina el tipo de relación de preferencia a usar en el análisis.
    STRI 
    Se usa una relación de preferencia estricta.
    WEAK 
    Se usa una relación de preferencia débil.

    NALT=5 /n

    (DATA=RAWC solamente). El número total de alternativas para ordenar.
    Nota: si DATA=RANKS, el número de alternativas se coloca automáticamente como el número de variables de análisis.

    NORMALIZE=NO /YES

    (METHOD=RANKS solamente).
    NO 
    No normalizar.
    YES 
    Se hace la normalización de la matriz relacional antes de calcular el valor de la función de pertenencia de las alternativas.

    PRINT=CDICT/DICT

    CDIC 
    Imprimir el diccionario de entrada para las variables accedidas con registros C, si los hay.
    DICT 
    Imprimir el diccionario de entrada sin registros C.

  4. Especificaciones de análisis (condicional: sólo en el caso de la lógica clásica). Las reglas de codificación son las mismas de los parámetros. Cada especificación de análisis debe comenzar en una nueva línea.
    
         Ejemplo:  PCON=66  DDIS=4  PDIS=20
    
    DCON=1 /n
    Diferencia de rangos que controla la concordancia en opiniones individuales (casos). Debe ser un entero dentro del rango 0 a NALT-1.

    PCON=51 /n

    Mínima proporción de concordancia individual expresada como un porcentaje y requerida en la opinión colectiva. Debe ser un entero dentro del rango 0 a 99. El valor por defecto significa que por lo menos, se necesita un acuerdo del 51% para tener una concordancia colectiva.

    DDIS=2 /n

    Diferencia de rangos que controla la discordancia en las opiniones individuales (casos). Debe ser un entero dentro del rango 0 a NALT-1.

    PDIS=10 /n

    Máxima proporción de discordancia individual, expresada como un porcentaje, tolerada en la opinión colectiva. Debe ser un entero en el rango 0 a 100. El valor por defecto significa que no se tolera una discordancia individual mayor del 10%.

34.7  Restricciones

  1. El número máximo de variables permitidas en una ejecución es 200, incluidas las variables de Recode y las variables de ponderación.
  2. El número máximo de variables de análisis es 60.


34.8  Ejemplos

Ejemplo 1. Determinación de un ordenamiento de alternativas, usando datos recolectados en forma de rangos de alternativas; hay diez alternativas, se asume una relación de preferencia débil y se hará una análisis con el método de rangos.


     $RUN RANK
     $FILES
     PRINT  = RANK1.LST
     DICTIN = PREF.DIC             archivo Diccionario de entrada
     DATAIN = PREF.DAT             archivo Datos de entrada
     $SETUP
     ORDENAMIENTO DE ALTERNATIVAS : METODO DE RANGOS
     DATA=RANKS  PREF=WEAK  METH=(NOCL,RANKS)  VARS=(V21-V30)
 
Ejemplo 2. Determinación de un ordenamiento de alternativas, con datos recolectados en forma de una selección por prioridades; se escogen tres alternativas entre 20 y el orden de las variables determina la prioridad de la selección; se supone preferencia estricta; se solicitan los dos métodos de análisis difuso.

     $RUN RANK
     $FILES
         los mismos del ejemplo 1
     $SETUP
     ORDENAMIENTO DE ALTERNATIVAS POR RANGOS : DOS METODOS DIFUSOS
     NALT=20  METH=(NOCL,NOND,RANKS)  VARS=(V101-V103)
 
Ejemplo 3. Determinación de un ordenamiento de alternativas, usando datos recolectados en forma de una selección por prioridades; se escogen 4 alternativas entre 15 y el orden de las variables no determina la prioridad de la selección (preferencia débil); se harán cuatro análisis de lógica clásica manteniendo siempre igual a 1 las diferencias de rangos, pero aumentando la proporción de discordancia y disminuyendo la proporción de concordancia.

     $RUN RANK
     $FILES
         los mismos del ejemplo 1
     $SETUP
     ORDENAMIENTO DE ALTERNATIVAS : LOGICA CLASICA
     PREF=WEAK  NALT=15  METH=CLAS  VARS=(V21,V23,V25,V27)
     PCON=75  DDIS=1  PDIS=5
     PCON=66  DDIS=1  PDIS=10
     PCON=51  DDIS=1  PDIS=15
     PCON=40  DDIS=1  PDIS=20