Modelo de respuesta aleatorizada de Warner para incrementar la probabilidad de obtener respuestas sinceras a preguntas sensibles

Valdez Blanco, Dindo

Servicios Personalizados

Revista

Articulo

Indicadores

Citado por SciELO
Accesos

Links relacionados

Similares en SciELO

Otros
Otros

Permalink

Fides et Ratio - Revista de Difusión cultural y científica de la Universidad La Salle en Bolivia

versión On-line ISSN 2071-081X

Fides Et Ratio v.21 n.21 La Paz mar. 2021

ARTÍCULOS ORIGINALES

Modelo de respuesta aleatorizada de Warner para incrementar
la probabilidad de obtener respuestas sinceras
a preguntas sensibles

Warner's Randomized Response Model to Increase the Probability
of Obtaining Honest Answers to Sensitive Questions

Dindo Valdez Blanco¹
¹Maestría en Ciencias Estadísticas, Licenciado en Estadística. Profesor de Estadística.
Universidad Mayor de San Andrés, La Paz- Bolivia dvaldez@fcpn.edu.bo
Artículo Recibido: 26-10-2020 Artículo Aceptado: 15-01-2021

Resumen

La veracidad de las respuestas en estudios sobre preguntas comprometedoras como el consumo de drogas es un tema de discusión y análisis permanente, en vista que las conclusiones de cualquier estudio basado en encuestas dependen de la calidad y autenticidad de las respuestas de los entrevistados. En esta investigación se estudió el modelo de respuesta aleatorizada propuesto por Warner con el propósito de disminuir el sesgo de respuesta cuando se formulan preguntas sensibles y/o delicadas, la aplicación fue realizada en la Facultad de Ciencias Puras y Naturales de la Universidad Mayor de San Andrés. El método empleado es cuantitativo de diseño no experimental, transeccional descriptivo. En el estudio se consideraron preguntas sensibles o delicadas para el entrevistado, como el comportamiento a realizar trampa en los exámenes y el consumo de drogas, aplicando el método de pregunta aleatorizada de Warner y el método de pregunta directa. Los resultados mostraron un incremento significativo en el número de respuestas afirmativas con el método de respuesta aleatorizada de Warner en relación a la pregunta directa respecto al consumo de drogas y realizar trampa en los exámenes de la universidad.

Palabras clave: Pregunta sensible, modelo de respuesta aleatorizada, sesgo de respuesta, encuestas por muestreo.

Abstract

The veracity of the answers in studies on compromising questions such as drug use is a subject of permanent discussion and analysis, given that the conclusions of any study based on surveys depend on the quality and authenticity of the responses of the interviewees. The randomized response model proposed by Warner was studied in order to reduce the response bias when sensitive and / or delicate questions are asked, the apphcation was carried out at the Faculty of Puré and Natural Sciences of the Universidad Mayor de San Andrés. The design of the method is quantitative and not experimental. In the study, sensitive or sensitive questions were considered for the interviewee, such as cheating behavior in exams and drug use, applying the Warner randomized question method and the direct question method. For the calculation of the sample size, a máximum estimation error of 4.07% was considered with a confidence level of 95%, the sample size was 507. For this purpose, a sample survey was conducted with 507 students applying a technique of Randomization regarding the last digit of their identity card in such a way that the interviewee must answer sensitive questions according to the result that the number of their identity card gives, from this the proportion of students who have the sensitive characteristic of indirectly, giving the interviewee anonymity and allowing a sincere response. Therefore, a probabilistic relationship is established between a given answer and the sensitive question. The results showed a significant increase in the number of affirmative responses with Warner s randomized response method in relation to the direct question regarding drug use and cheating on university exams.

Keywords: Sensitive question, randomized response model, response bias, sample surveys.

Introducción

En estudios sobre temáticas delicadas o muy personales, se presentan dos problemas: no dan respuesta y/o no contestan con veracidad.

Estos dos problemas generan sesgos de muestreo. Por lo cual radica la importancia de estudiar metodologías que mejoren la tasa de respuesta veraz ante este tipo de preguntas sin comprometer al entrevistado ante estas preguntas delicadas.

El objetivo principal fue estudiar el modelo de respuesta aleatorizada propuesto por Warner y aplicar el mismo a los estudiantes de la Facultad de Ciencias Puras y Naturales de la Universidad Mayor de San Andrés (F.C.P.N.), que se encuentraban matriculados en la gestión 2019, para analizar el comportamiento de los alumnos de la facultad frente a preguntas sensibles.

Referentes conceptuales

Esencialmente el método de Warner involucra una técnica de aleatorización de tal manera que el entrevistado debe responder a las preguntas sensibles de acuerdo al resultado que arroje el método, dichos procedimientos pueden ser: juegos de monedas, maso de cartas ruletas giratorias, entre otros (Reyes, 2014).

La técnica de aleatorización permite calcular el estimador de la proporción de manera indirecta, dando al entrevistado el anonimato y permitiendo una respuesta sincera. Por lo tanto, se establece una relación probabilística entre una respuesta dada y la pregunta sensible (Warner, 1965).

El Modelo de Respuesta Aleatorizada de Warner

Los individuos de una población pueden diferenciarse en cuanto si son portadores de un rasgo sensible X o no. Luego se busca la proporción tí de los portadores de características sensibles en la población, donde π = P(X=1) y 1-π = P(X=0), también se puede describir como la probabilidad de llevar la característica sensible. A los encuestados se les presentan dos declaraciones siguiendo el siguiente esquema:

Declaración A: Soy el portador de la característica sensible X.

Declaración B: No soy el portador de la característica sensible X.

La selección modelo de Warner debe satisfacer dos condiciones:

1) Las probabilidades () de selección de las dos afirmaciones se conocen de antemano y no son iguales a 0.5.

2) El entrevistador no conoce el resultado del experimento aleatorio, solo el encuestado sabe cuál de las dos afirmaciones fue seleccionada. Luego solo indica si la declaración seleccionada se aplica a él o no. La figura 1 muestra esquemáticamente el principio de la encuesta a partir de diagrama de árbol.

Cálculo de la probabilidad de tener la característica sensible:

Donde:

λ , probabilidad de una respuesta afirmativa

π , probabilidad de tener la característica sensible

p, probabilidad de responder la pregunta sensible

Por tanto, la estimación de la proporción de personas que tienen la característica sensible es:

Y su varianza es:

Estimador de la pregunta directa

En el caso de preguntas directas, las estimaciones de la proporción de casos que responden si a la pregunta sensible son:

Con

Comparación del Modelo de respuesta aleatorizada de Warner con el modelo de pregunta directa

La equivalencia entre el modelo de Warner y el modelo de entrevista directa, se proporciona una base para comparar el modelo de Warner con el Modelo de respuesta directa.

A partir de sus varianzas:

Donde es la varianza del Modelo de Warner. Utilizando el criterio de varianzas se obtiene lo siguiente:

Con

Para encontrar los valores de para diferentes valores de primero se resuelve la ecuación de segundo grado de la función en términos de:

Materiales y métodos

La metodología es cuantitativa de tipo no experimental, transeccional descriptivo. El procedimiento para la presente investigación comprende de dos partes: la implementación de una encuesta y el método de Warner para la estimación de la proporción de personas con una característica sensible, específicamente la proporción de estudiantes que hacen trampa en los exámenes y la proporción de estudiantes que consumen drogas. La encuesta permitirá aplicar el método de entrevista directa a los estudiantes de la universidad matriculados en la gestión 2019, para comparar los resultados con el método aleatorizado de Warner. A partir de la encuesta se podrá analizar si el método de respuesta aleatorizada asegura realmente el anonimato de los sujetos y aumenta la probabilidad de obtener respuestas sinceras a preguntas sensibles reduciendo el error. La figura 1 muestra el modelo de encuesta, en este caso se pide a cada entrevistado que conteste la pregunta A o B según la terminación del número de su cédula de identidad, de tal forma que el encuestador no sepa que pregunta está respondiendo el estudiante y así se proteja su respuesta frente a la pregunta sensible.

Tamaño de muestra

Para el cálculo del tamaño de muestra se consideró un error máximo de estimación de 4.07% con un nivel de confianza del 95%, el tamaño de muestra fue de 507- Para tal efecto se realizó una encuesta por muestreo a 507 estudiantes aplicando una técnica de aleatorización respecto al último dígito de su cédula de identidad de tal manera que el entrevistado debe responder a las preguntas sensibles de acuerdo al resultado que arroje el número de su cédula, a partir de ello se estima la proporción de estudiantes que tienen la característica sensible de manera indirecta, dando al entrevistado el anonimato y permitiendo una respuesta sincera. Por lo tanto, se establece una relación probabilística entre una respuesta dada y la pregunta sensible.

Se utilizó el muestreo aleatorio simple (Scheaffer; Mendenhall; Ott, 2007) con un límite máximo para el error de estimación de 4.07% y 95% de confianza, el tamaño de la muestra alcanza a 507 estudiantes de la FCPN.

Eficiencia relativa del Modelo de Warner y el Modelo Directo

En este sentido se considera que la eficiencia relativa del modelo de Warner para el modelo directo; es decir,

La eficiencia relativa es el cociente de varianzas y es independiente del tamaño de la muestra n, y solo depende de los parámetros y, para el modelo de Warner como para el modelo directo como se muestra en la tabla 1, se observa que a medida que la probabilidad de responder a la pregunta sensible se aproxima a 0.5, la eficiencia relativa del método directo aumenta exponencialmente, la eficiencia del modelo directo es mayor que la del modelo de Warner, en particular cuando (0.48 ≤ p< 0.50) que es el rango óptimo para que la privacidad de los encuestados este protegido, la eficiencia del modelo directo es de aproximadamente 2500 hasta 6942 veces mayor que del modelo de Warner.

Grado de protección de la privacidad

Se define la probabilidad condicional, que el encuestado realmente posea la característica sensible dado que responde afirmativamente.

Donde A indica que el entrevistado posee la característica sensible.

La figura 3 muestra que el grado de protección a la privacidad aumenta a medida que la probabilidad de tener la característica sensible π es mayor.

Resultados

A continuación, se presentan los resultados obtenidos con la aplicación del método de Warner y la pregunta directa.

- Trampa en los exámenes

El estimador del modelo de Warner denota la proporción de alumnos que han realizado trampa en los exámenes al menos una vez.

p = P[cédula no termina en 1 o 2] 0.82

La proporción de los encuestados que respondieron Si es λ=254/507=0.501, por tanto, el valor estimado de para los estudiantes que han realizado trampa es como se ve a continuación.

Para calcular la varianza y el error estándar se utilizan las siguientes formulas.

De esta manera, con el 95% de seguridad se puede afirmar que esta entre

El grado de protección de la privacidad estimado para los estudiantes que han hecho trampa para mejorar en el rendimiento académico es:

- Consumo de drogas

El estimador de la proporción de estudiantes que han consumido drogas en alguna ocasión por el método aleatorizado de Warner tiene el mismo proceso.

Los resultados de la tabla 2 indica que el método de Warner tiene estimaciones mayores, en el caso de la pregunta sensible sobre hacer trampa en los exámenes no existe una diferencia significativa como lo muestran los intervalos de confianza al 95% de confiabilidad, sin embargo para la pregunta sensible sobre el consumo de drogas, se puede observar que el intervalo de confianza de la proporción estimada con el método de Warner es significativamente mayor en relación al método directo al 95% de confianza.

Los resultados por sexo de la tabla 3 no muestran diferencias significativas respecto a las preguntas sensibles realizadas a los estudiantes de cada sexo al 95% de confianza.

Discusión

Con el objeto de comparar y discutir la eficacia del método de Warner, se revisó el trabajo de Investigación realizado por Beatriz Cobo Rodríguez para aspirar al máster en Estadística Aplicada por la Universidad de Granada (Cobo, 2013), el mismo utiliza el método de Warner para la aplicación de las preguntas del método de respuesta aleatoria. La encuesta se aplicó a una muestra representativa de la población de estudiantes de la facultad de Ciencias Económicas de la Universidad Nacional del Callao.

De acuerdo a los resultados obtenidos en dicho estudio, se observa que el porcentaje estimado de estudiantes que alguna vez hicieron trampa en los exámenes es 81.97% y el porcentaje estimado de estudiantes que alguna vez consumieron drogas fue 22.78%.

Comparado con la investigación realizada en la EC.P.N. se observa un mayor porcentaje en la pregunta sensible sobre hacer trampa en los exámenes con una diferencia absoluta de 31.8%, en cambio, respecto a la pregunta sobre el consumo de drogas la diferencia es menor (6.11%).

Conclusiones

1) La aplicación del modelo de respuesta aleatorizada de Warner ha demostrado que es una técnica que permite obtener mejores resultados en encuestas con preguntas sensibles. 2) La estimación de la proporción de estudiantes que hacen "trampa en los exámenes" utilizando el estimador de Warner es 50,17% mientras que en el diseño de entrevista directa es de 41,6%, refleja un incremento absoluto del 8.57%.

3) La estimación de "Consumo de drogas en alguna ocasión" utilizando el estimador de Warner es de 16,67%, mientras que con el diseño de entrevista directa es de 5,94% dando un incremento absoluto del 10.73%.

4) La desventaja principal del método de Warner radica en lo que respecta a la capacitación de los encuestadores y el tiempo que requiere explicar al entrevistado el cuestionario.

A la fecha existen otros métodos de estimación frente a preguntas delicadas, algunos de estos modelos son: el Modelo U (Greenberg, 1969) el cual perfecciona el modelo de Warner, los modelos de respuesta no aleatorizada (Liang, 2008) y el modelo triangular de respuesta no aleatorizada (Tang, 2009). Se recomienda estudiar dichos métodos para futuros trabajos de investigación.

Referencias

Basulto, J. (1982). El diseño de respuesta aleatorizada de Warner. Un modelo de superpoblación., (96), 51a 62.

Cobo, B. (2013). Respuesta aleatoria y técnicas de preguntas indirectas. Trabajo de tesis de maestría. Departamento de Estadística e Investigación Operativa Universidad de Granada. [ Links ]

Greenberg, B.G., Abul-Ela, A.-L., Simmons, W.R., and Horvitz, D.G. (1969). The unrelated question RR model: Theoretical framework. JASA 64, 520-539 [ Links ]

Guo-Liang Tian, J.-W Y. (2007). A new non-randomized model for analysis sensitive questions with binary outcomes. Statistics in medicine, 26(23), 4238-52. http://doi.org/10.1002/sim.2863. [ Links ]

Liang, T G., & Lai, T M. (2008). Two new models for survey sampling with sensitive characteristic: desing and analysis. Métrica, 251-263. [ Links ]

Nayak, T K. (1994). On randomized response surveys for estimating a proportion. Communications in Statistics - Theory and Methods, 23(11), 3303-3321. http://doi.org/10.1080/03610929408831448. [ Links ]

Reyes, H. (2014). El modelo de respuesta aleatorizada para estudiar el comportamiento de los estudiantes de la FCM frente a preguntas sensibles.Tesis de licenciado en estadística.Facultad de Ciencias Matemáticas. UNMSM, Lima, Perú. [ Links ]

Scheaffer, R., Mendenhall, W. y Ott, L. (2007). Elementos de muestreo. Grupo Edit. International Thomson Paraninfo S.A., Madrid, España [ Links ]

Tang Man Lai, Wu Qin (2016). Non-Randomized Response Model for Sensitive Survey with Noncompliance. Hong Kong. [ Links ]

Tang, M.L.,Tian, G.L., Tang, N.S.,Liu, Z.Q. (2009). A new nonrandomized multi-category response model for surveys with a single sensitive question: design and analysis. Journal of the Korean Statistical Society. Vol 38, Nol:339-349. [ Links ]

Tian Guo, LiangTang Man Lai (2014). Imcomplete Categorical Data Design Non-Randomized Response Techniques for Sensitive Questions in Surveys. Hong Kong. [ Links ]

Yamaguchi Kazuo (2016). Cross-sectional and Panel Data Analyses of an Incompletely Observed Variable Derived From the Nonrandomized Method for Surveying Sensitive Questions. Chicago. [ Links ]

Warner, S. L. (1965). Randomized response: a survey tecnique for eliminating evasive answer bias. Journal of Applied Psychology (Vol. 60). [ Links ]