A pesar de la diversidad de concepciones asociadas al origen de la empatía (Eisenberg y cols., 1994; Eisenberg, Espinrad y Sodowsky, 2006; Hoffman, 2000, Vaish y Warneken, 2012), no son pocos los autores que coinciden en definirla como una respuesta efectiva que surge de la comprensión del estado emocional de otra persona, que es muy similar al propio (de Vignemont y Singer, 2006, Coplan y Goldie, 2011).
Por tanto, y a pesar de la importancia de otros componentes que generalmente se incorporan a su definición (Davis, 1983), parece razonable entender la empatía desde dos dimensiones: la cognitiva y la afectiva. La primera tiene que ver con la serie de operaciones relacionadas con la lectura e interpretación de las complejas señales expresivas que surgen de la persona y su contexto inmediato. Dichas señales permiten un conocimiento específico sobre el estado emocional de esa persona. Estas operaciones se basan en el conocimiento que el observador tiene de sus propias reacciones emocionales, sus determinantes y consecuencias, y los estímulos que las predisponen y producen. La empatía cognitiva, por tanto, está relacionada con la toma de perspectiva: una serie de inferencias que el observador realiza sobre el estado emocional del otro, permitiéndole ponerse en su lugar, inferir sobre su emocionalidad (Eisenberg y cols., 1991) e imaginarse a sí mismo en una situación similar (Decety y Sommerville, 2003). La segunda dimensión de la empatía -la afectiva- surge como resultado de la verificación cognitiva de las señales que evocan respuestas emocionales similares en el observador y le mueven a comportarse en la misma dirección (Roth, 2020).
Medición de la empatía
A pesar de la existencia de una multiplicidad de criterios para conceptualizar la empatía ha sido reconocida por muchos autores (Batson, 2009, Decety & Lamm, 2009, Gerdes, Segal & Lietz, 2010), en la actualidad hay una gran variedad de procedimientos para medirla. Neumann, Chan, Boyle, Wang & Westburry (2015) identificaron tres categorías para medir la empatía: a) medidas de autoinforme (véase Mehrabian, 1996; Baron-Cohen & Wheelright, 2004; Garton & Gringart, 2005; Joliffe & Farrington, 2006; Reniers y cols., 2011, Innamorati y cols., 2019); b) medidas conductuales (Westbury & Neumann, 2008; Völlm y cols., 2006; Nummenmaay cols., 2008; Reid y cols., 2012); y c) medidas neurocientíficas: Resonancia magnética (Banissy, Kanai, Walsh & Rees, 2012; Duncan, de Greck, & Northoff, 2011; Decety, 2015); electromiografía facial (véase Sonnby-Borgström, 2002; Brown, Bradley & Lang, 2006; Fabes, Eisenberg & Eisenbud, 1993) y electroencefalografía (Light y cols., 2009).
Medición de la empatía en niños
Algunos autores (Miller y Eisenberg, 1988; Zhou, Valiente y Eisenberg, 2003) describen cuatro conjuntos instrumentales para evaluar los factores afectivos y cognitivos de la empatía infantil. El primero, se centra en la medición de las percepciones y el reconocimiento de las propias emociones mediante cuentos, videos y dibujos. El segundo, presta atención a la interpretación de señales emocionales en otras personas utilizando estímulos en forma de dibujos o historias descritas principalmente mediante entrevistas. Dadds y cols. (2008), por ejemplo, describieron los resultados obtenidos a lo largo de varios años, los informes paternos relativos a la empatía de sus hijos. El tercer grupo, y probablemente el más conocido, incluye la aplicación de escalas y cuestionarios en forma de autoreportes. Finalmente, el cuarto grupo está formado por aquellas medidas que exploran las respuestas del sistema nervioso central y periférico.
A pesar de la existencia de estos sistemas de medición, aparentemente ninguno puede considerarse suficientemente bueno para reflejar la complejidad del constructo empatía. La excesiva simplicidad que caracteriza a los instrumentos del primer grupo, no logra reproducir la verdadera complejidad del comportamiento empático. Aunque los autoreportes permiten estudiar la empatía junto con otras variables relevantes (Garton & Gringart, 2005) pueden no indicar completamente los afectos y pensamientos sobre los demás, sino cómo esperan otras personas que uno se sienta en circunstancias donde la conducta empática se considera apropiada. Por otro lado, como reconocen Zhou, Valiente & Eisenberg (2003) las mediciones neurofisiológicas aún no cumplen con la expectativa de hacer discriminaciones más finas entre empatía, simpatía, angustia personal y otras características relacionadas.
En cuanto a los procedimientos de papel y lápiz, los instrumentos de autoreporte más comúnmente aplicados a niños pequeños son, entre otros, las modificaciones del Índice de Reactividad Interpersonal (Davis, 1980, 1983) realizadas por Litvack-Miller y cols. (1997) y adaptadas a poblaciones hispanohablantes (Fernández, Dufey y Kranp, 2011; Mestre-Escrivá, Frías-Navarro y Samper-García, 2004); y el Índice de Empatía de Bryant (Bryant, 1982) y su adaptación al español (Del Barrio, Aluja y García, 2004). Aunque menos citadas, también son interesantes las adaptaciones realizadas por Garton & Gringart, (2005) y Zoll & Enz (2005). La primera, la escala Feel & Think fue diseñada para medir la empatía en niños de entre 8 y 9 años. Este instrumento fue un ajuste realizado a partir del Índice de Reactividad Interpersonal (Davis, 1980) previamente acotado por Litvack-Miller, McDougall & Romney (1997). El segundo, el Cuestionario de Empatía (QE) de Zoll & Enz (2005), es una prueba ajustada para niños entre 8 y 14 años, con elementos procedentes del Índice de Empatía de Bryant (1982) y con aportaciones de otros instrumentos (Mehrabian & Epstein, 1972; Leibetseder y cols., 2001; Davis, 1980, 1983; Eisenberg y Fabes, 1998); y actualmente cuenta con una adaptación al español para la población infantil boliviana (Roth, 2020).
El presente estudio exploró el potencial de la escala Feel & Think (F & T), modificada por Garton & Gringart (2005) para medir la empatía en niños bolivianos, de entre 8 y 12 años. Debido a que la estructura factorial de la F & T se acercaba a la concepción teórica de la empatía, se mantuvieron como base los factores afectivos y cognitivos y con ellos, todos los ítems incorporados por estos autores.
MÉTODO
Participantes
Los participantes fueron 650 niños de ambos sexos, con edades comprendidas entre los 8 y los 12 años. Todos los niños fueron reclutados en varias escuelas de las ciudades de La Paz y Tarija en Bolivia. Las muestras se obtuvieron en función de la disponibilidad de las escuelas y de su aceptación para participar en el presente estudio. Para ello, se obtuvo el consentimiento informado de sus padres y profesores. La muestra se redujo a 612 por la exclusión de los casos perdidos y atípicos. Así, la muestra final mostró 371 casos (60,6%) para La Paz y 241 (39,4%) para Tarija. Del total de participantes, 317 eran hombres (51,8%) y 295 mujeres (48,2%). La edad media (N = 612), fue de 10,09 años, con una DE = 1,395. Los porcentajes de edad y género de la muestra se muestran en la Tabla 1.
Edad | Varón | Mujer | Total | |||
---|---|---|---|---|---|---|
N | % | n | % | n | % | |
8 años | 48 | 47.5 | 53 | 52.5 | 101 | 100 |
9 años | 62 | 48.1 | 67 | 51.9 | 129 | 100 |
10 años | 69 | 52.3 | 63 | 47.7 | 132 | 100 |
11 años | 64 | 56.6 | 49 | 43.4 | 113 | 100 |
12 años | 74 | 54.0 | 63 | 46.0 | 137 | 100 |
El procedimiento seguido por Garton & Gringart (2005) para el ajuste de la escala construida por Litvack-Miller et al (1997), se justificó parcialmente en la comprensión de los ítems por parte de la muestra. A partir de este análisis, se refinaron 9 ítems, manteniendo los cuatro factores originales. El Análisis Factorial Exploratorio (AFE) recomendó la eliminación del segundo y tercer factor y sus respectivos ítems, configurando una escala de sólo 12 ítems, seis para el primer factor y seis para el segundo. Con esta estructura, el F & T fue capaz de explicar el 36,4% de la varianza, con indicadores de fiabilidad de 0,69 para el primer factor y de 0,54 para el segundo. Los autores, con dos factores (Afectivo y Cognitivo), obtuvieron una solución clara y una escala más accesible para los niños pequeños. El instrumento se valoró con una escala de cinco puntos (desde "No se parece en nada a mí" a "Se parece mucho a mí"). Finalmente, la escala mostró buenas propiedades psicométricas. La exploración de la normalidad reveló un amplio rango de puntuaciones, con ligeras asimetrías y curtosis negativas. No obstante, la distribución general se asumió como normal.
Instrumentos
Feel & Think (S&P). Para el presente estudio se adoptó la última versión modificada de Garton & Gringart (2005), con dos factores y 12 ítems (6 para cada factor). La escala original se tradujo al español y luego se volvió a traducir al inglés para comparar la versión original con la última traducción. Este procedimiento permitió realizar algunos ajustes menores en la paráfrasis de los ítems. Posteriormente, los ítems fueron revisados con la ayuda de los propios niños en diferentes grupos focales, realizados en La Paz y en Tarija. Esta experiencia llevó a la eliminación de dos ítems de la subescala cognitiva: El SyP8 ("Creo que la gente puede tener diferentes opiniones sobre la misma cosa") y el SyP12 ("Cuando estoy discutiendo con mis amigos sobre lo que vamos a hacer, pienso cuidadosamente en lo que dicen antes de decidir cuál es la mejor idea"). La revisión también permitió ajustar la terminología de aquellos ítems que planteaban dificultades de comprensión. Así, se mantuvieron 6 ítems para medir la dimensión afectiva y 4 para la cognitiva. Dado que a los niños les resultaba difícil responder a los ítems redactados de forma negativa, todos ellos se formularon de forma positiva. Los ítems debían responderse en una escala de 4 puntos, donde 1 = "no me parece nada" y 4 = "me parece mucho". Esta estructura de respuesta fue otra modificación con respecto a la versión original de Garton y Gringart (2005), que utilizaba 5 opciones de respuesta.
Empathy Questionnaire (QE) byZoll & Enz (2005). Este instrumento constituye un ajuste de la escala original previamente traducida al español y adaptada al contexto boliviano (Roth, 2020). La versión adaptada mostró adecuados indicadores de validez factorial y consistencia interna con una fiabilidad aceptable para dos componentes y 17 ítems (α= .850). El Análisis de Componentes Principales (ACP) mostró un KMO = .851 y una esfericidad significativa (χ2 = 883,604, p <.001), explicando el 30% de la varianza y confirmando la extracción de dos componentes principales: afectivo y cognitivo, con índices de saturación superiores a .39. El Análisis Factorial Confirmatorio (AFC) mostró un modelo relativamente bien ajustado (RMR = .059; GFI = .926; CFI = .951; PRATIO = .809; PCFI = .769; RMSEA = .042). El EQ se aplicó en el presente estudio, manteniendo los dos componentes, aunque se descartó el ítem P9 porque arrojó problemas de consistencia en el estudio anterior. Por lo tanto, el instrumento incluyó un total de 16 ítems (9 para el componente afectivo y 7 para el cognitivo).
Procedimiento
La recolección de datos se realizó en las instalaciones de la escuela, durante el período de clases y con la autorización del Director y del profesor respectivo para utilizar un período académico para el propósito de la investigación. Previamente, también se obtuvo el consentimiento informado de los padres. Antes de iniciar la administración, los investigadores dieron siempre la misma explicación y se aseguraron de que los niños comprendieran plenamente el proceso de respuesta utilizando ejemplos especialmente preparados para ello. También respondían y aclaraban cualquier duda sobre cómo responder. El procedimiento fue siempre el mismo con todos los participantes. La administración de los instrumentos duró generalmente entre 30 y 40 minutos.
Decisiones de análisis
En primer lugar, se exploró la normalidad de la distribución con especial consideración de los valores de asimetría y curtosis. Luego, se obtuvo el indicador de fiabilidad mediante el Alfa de Cronbach, y la consistencia interna, explorando las correlaciones bivariadas. La verificación de la validez incluyó el análisis divergente o discriminativo en función del género, y la validez concurrente, utilizando el test de Zoll y Enz (2005). La validez de constructo se estableció mediante el método ACP con Varimax, y mediante el AFC a través del modelado de ecuaciones estructurales. Todos los cálculos se realizaron con ayuda de los paquetes IBM-SPSS y AMOS v23.
RESULTADOS
Exploración de la normalidad. Se exploraron las características de la distribución de las puntuaciones totales de la escala. Aunque no fue posible aceptar la normalidad según la prueba de Kolmogorov-Smirnov, los valores M (Huber = 29,2; Tukey = 29,3; Hampel = 29,2; Andrews = 29,3) y la coincidencia entre los valores de la media recortada (29,2) y la mediana (29,0), sugieren una distribución relativamente normal, aunque con una ligera asimetría y curtosis negativas (-,204 y -,553, respectivamente). La tabla 2 muestra los estadísticos descriptivos de cada uno de los ítems, donde los ítems 3 y 6 suponen una posible contribución a los valores negativos de asimetría y curtosis, posiblemente por sesgos en la respuesta debido a las dificultades de comprensión de estos ítems.
M | DE | Asimetría | Curtosis | |
---|---|---|---|---|
SyP1 | 2.90 | .855 | -.353 | -.572 |
SyP2 | 3.22 | .754 | -.645 | -.182 |
SyP3 | 3.28 | .750 | -.815 | .207 |
SyP4 | 2.76 | .919 | -.213 | -.831 |
SyP5 | 3.15 | .878 | -.694 | -.462 |
Syp6 | 2.74 | 1.055 | -.234 | -1.189 |
SyP7 | 2.94 | .916 | -.506 | -.596 |
SyP9 | 2.61 | .958 | -.138 | -.921 |
SyP10 | 2.69 | .969 | -.165 | -.969 |
SyP11 | 2.85 | .925 | -.329 | -.803 |
Fiabilidad. El análisis de fiabilidad fue inferior a lo esperado (alfa de Cronbach = .642), lo que sugiere cierta precaución en la aplicación de la prueba por carecer de una adecuada consistencia interna. Sin embargo, la relación entre los ítems de la escala general indicó altas correlaciones positivas entre todos los ítems (ver Tabla 3). Asimismo, los ítems de las dos subescalas correlacionaron positiva y significativamente (Rho = .427, p < .001).
SyP1 | SyP2 | SyP3 | SvP4 | SyP5 | SyP6 | SvP7 | SyP9 | SyP10 | SvP11 | |
---|---|---|---|---|---|---|---|---|---|---|
SyP1 | 1.000 | |||||||||
SyP2 | .198** | 1.000 | ||||||||
SyP3 | .173** | .227** | 1.000 | |||||||
SyP4 | .192** | .104* | .099* | 1.000 | ||||||
SyP5 | .149** | .161** | .102* | .140** | 1.000 | |||||
SyP 6 | .178** | .103* | .139** | .191** | .088** | 1.000 | ||||
SyP7 | .190** | .093* | .120** | .144** | .162** | .163** | 1.000 | |||
SyP9 | .102* | .124** | .103* | .182** | .172** | .155** | .199** | 1.000 | ||
SyP10 | .138** | .185** | .089* | .149** | .135** | .051 | .221** | .115** | 1.000 | |
SyP11 | .149** | .236** | .187** | .177** | .223** | .187** | .135** | .288** | .099* | 1.000 |
* p < .05; ** p < .01
Validez divergente. Se verificaron diferencias entre las puntuaciones obtenidas en niños y niñas, tanto en la escala total como en los componentes de "sentir preocupación" y "pensar en ayudar". La Tabla 4 resume los estadísticos correspondientes. Nótese que para todos los casos hubo diferencias significativas a favor de las niñas [Feel: F (1, 610) = 16,269, p < .000; Think: F (1, 610) = 6,561, p < .011; Escala total: F (1, 610)= 16,645, p < .000].
Varones | Mujeres | ||||||||
---|---|---|---|---|---|---|---|---|---|
n | M | DE | n | M | DE | Levene | F | p | |
Sentir preocupación | 317 | 16.523 | 3.169 | 295 | 17.528 | 2.981 | .165 | 16.269 | .000 |
Pensar en ayudar | 317 | 11.930 | 2.100 | 295 | 12.355 | 1.999 | .590 | 6.561 | .011 |
F & T Total | 317 | 28.454 | 4.395 | 295 | 29.884 | 4.266 | .327 | 16.645 | .000 |
Aunque el instrumento pudo discriminar bien entre hombres y mujeres, fue posible verificar la homogeneidad de las respuestas en los niños de 8 a 12 años, comparando los estadísticos descriptivos obtenidos para cada grupo. La Tabla 5 resume estos valores mostrando sólo pequeñas diferencias entre estos diferentes grupos de edad.
Edad | n | M | SD |
---|---|---|---|
8 años | 101 | 29.47 | 4.836 |
9 años | 129 | 29.05 | 4.211 |
10 años | 132 | 28.80 | 4.590 |
11 años | 113 | 29.65 | 3.952 |
12 años | 137 | 28.89 | 4.360 |
Validez concurrente. Los puntajes obtenidos fueron correlacionados con los del Cuestionario de Empatía (QE) de Zoll & Enz (2005), adaptado por Roth (2018), demostrando adecuados indicadores de confiabilidad y validez factorial. Ambas pruebas fueron aplicadas de manera concurrente a una población de 612 niños de ambos sexos. La Tabla 6 muestra las correlaciones entre los componentes son positivas y muy significativas, indicando la misma vocación de ambas pruebas.
Escala | Sentir preocupación | Pensar en ayudar | Total F & T |
---|---|---|---|
Empatía Afectiva QE | .432** | .373** | .480** |
Empatía Cognitiva QE | .333** | .320** | .385** |
Total QE = | .474** | .418** | .532** |
p < .05; ** p < .01
Análisis de componentes principales (ACP). El ACP (KMO = .766; esfericidad de Bartlett: χ2 = 465,75, p < .000) realizó el análisis de reducción utilizando el método Varimax y tomando valores propios mayores que 1. El procedimiento de extracción recomendó tres componentes. Sin embargo, para alinearse con la propuesta teórica que sustentaba la escala original, se forzó la extracción de sólo dos componentes. La Tabla 7 presenta la solución estructural basada en dos componentes del instrumento F & T.
Items | Sentir preocupación | Pensar en ayudar |
---|---|---|
9F. Si Juan/Juana ve gente que está nerviosa o preocupada, se asusta y se preocupa también un poco | .680 | |
4F. Con frecuencia a Juan/Juana le afectan las cosas que pasan | .541 | |
11F.A veces Juan/Juana se siente apenado cuando hay gente que está preocupada | .523 | |
1F. Las situaciones de emergencia le preocupan a Juan/Juana | .510 | |
6F. Juan/Juana es una persona bastante blanda | .504 | |
5F. Juan/Juana se preocupa y apena mucho por la gente que no tiene su misma suerte | .451 | |
2T. Juan/Juana se preocupa mucho cuando ve que alguien necesita ayuda con urgencia | .721 | |
3T. Juan/Juana desea ayudar a las personas que son maltratadas | .691 | |
7T. Juan/Juana intenta comprender mejor a sus amigos, tratando de ser como ellos | .513 | |
10T.Cuando Juan/Juana está enojado o resentido con alguien, casi siempre trata de imaginarse lo que esa persona está pensando o sintiendo | .321 |
Como puede verse en la Tabla 7, la solución de dos componentes situó 6 ítems en el componente "sentir" y 4 en el componente "pensar". Era evidente que, en el primer caso, el sentimiento estaba vinculado a la preocupación empática y que el componente de pensamiento tendía a referirse a situaciones de ayuda. Las cargas factoriales fueron siempre superiores a .450, con la excepción del ítem 10 que reportó una carga de .321. El gráfico de sedimentación confirmó la extracción de dos componentes. Las varianzas de los ítems o comunalidades exhibieron valores mayores a .249, con excepción del ítem 10 que arrojó una varianza irrelevante de .188. Además, el ACP obtuvo una varianza total explicada de 34,67.
Análisis factorial confirmatorio (AFC). El AFC planteó la hipótesis de que las respuestas a la escala podían explicarse por dos factores: Sentir preocupación y Pensar en ayudar, y que ambos factores se correlacionaban positivamente. También se asumió que los ítems para el factor Sentir, registran cargas con valores distintos de cero, mientras que los ítems que no miden ese factor cargan cero. Lo mismo se supuso para el otro factor. La Figura 1 muestra el modelo hipotético de la escala F & T. El AFC permitió verificar las características de normalidad frente a la exploración inicial con distribución leptocúrtica. La evaluación con el AFC confirmó esta tendencia, con un valor multivariado inferior a 7,00 (West, Finch y Curran, 1995), señalando al ítem 6 como el mayor contribuyente a la alta curtosis. También se descartó la existencia de casos atípicos mediante el cálculo del d 2 de Mahalanobis.
Finalmente, debido a que los índices de covarianza y los pesos de regresión no mostraron variaciones significativas entre ellos, se descartó la aplicación de medidas correctoras al modelo. La evaluación y la bondad de ajuste del modelo métrico arrojó los siguientes indicadores: El CMIN, representado por el estadístico Chi Cuadrado obtenido con 21 parámetros y 34 grados de libertad, resultó ser muy alto y no permitió rechazar la hipótesis nula de bondad de ajuste (χ2 = 70,829, p < .000).
Sin embargo, el análisis de los residuos estandarizados mediante la Raíz Cuadrada Media Residual tiene un valor óptimo (RMR = .031). Asimismo, los índices de bondad del ajuste (GFI = .977) y la bondad corregida de los índices (AGFI = .963) están dentro del rango esperado. Por otro lado, el Índice de Ajuste Normalizado (NFI) que incluye el Índice de Ajuste Comparativo, (CFI = .913) y el Error de Aproximación de la Raíz Cuadrada Media, fueron satisfactorios (RMSEA = .042). El Índice de Validación Cruzada Esperada también midió satisfactoriamente la parsimonia del modelo, (ECVI = .185). Por último, el índice HOELTER permite concluir que el tamaño de la muestra elegido para la presente investigación (N = 612), es adecuado para sus fines. En resumen, a pesar de tener el índice CMIN adverso, se sugiere un modelo de medición bien ajustado para medir el constructo Empatía a través de los dos factores concurrentes.
A continuación, se presentan los índices de ajuste del modelo de medida obtenidos para las dos ciudades. Como se puede observar en la Tabla 8, los valores son similares en las dos ciudades, aunque el CMIN y el RMSEA son algo mayores para Tarija.
CIUDAD | n | CMIN | p | RMR | GFI | CFI | AGFI | RMSEA | ECVI | HOELTER | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|
LA PAZ | 371 | 76.233 | .000 | .040 | .961 | .850 | .9360 | .058 | .320 | .05 | .01 | |
TARIJA | 253 | 46.165 | .080 | .039 | .965 | .920 | .943 | .039 | .367 | 253 | 273 |
Con respecto a los parámetros estimados por el modelo, debemos señalar que todas las ponderaciones de regresión no estandarizadas tienen Coeficientes Críticos (CR) significativos. Asimismo, las estimaciones estandarizadas muestran correlaciones no inferiores a .433, lo que indica correlaciones relativamente robustas entre los factores latentes y las variables observables (ver Tabla 9). Por último, las estimaciones también muestran una fuerte correlación entre ambos factores latentes (Sentir preocupación - Pensar en ayudar = .969) y todas las varianzas sin excepción fueron significativas. En conclusión, gran parte de los indicadores estadísticos obtenidos permiten ser optimistas sobre los atributos psicométricos de la escala F & T, con buenas perspectivas para abordar la medición cuantitativa de la empatía en niños bolivianos de 8 a 12 años.
Factor | Peso no estandarizado | Err.S | C.R | p | ||
SyP9 | ← | Sentir preocupación | 1.000 | |||
SyP4 | ← | Sentir preocupación | .932 | .156 | 5.985 | *** |
SyP11 | ← | Sentir preocupación | 1.137 | .173 | 6.562 | *** |
SyP1 | ← | Sentir preocupación | .859 | .144 | 5.958 | *** |
SyP6 | ← | Sentir preocupación | .988 | .173 | 5.723 | *** |
SyP5 | ← | Sentir preocupación | .873 | .147 | 5.921 | *** |
SyP2 | ← | Pensar en ayudar | 1.000 | |||
SyP3 | ← | Pensar en ayudar | .781 | .150 | 5.204 | *** |
SyP7 | ← | Pensar en ayudar | 1.204 | .203 | 5.931 | *** |
SyP10 | ← | Pensar en ayudar | 1.087 | .200 | 5.446 | *** |
Factor | Peso estandarizado | |||||
SyP9 | ← | Sentir preocupación | .418 | |||
SyP4 | ← | Sentir preocupación | .406 | |||
SyP11 | ← | Sentir preocupación | .493 | |||
SyP1 | ← | Sentir preocupación | .403 | |||
SyP6 | ← | Sentir preocupación | .375 | |||
SyP5 | ← | Sentir preocupación | .398 | |||
SyP2 | ← | Pensar en ayudar | .433 | |||
SyP3 | ← | Pensar en ayudar | .340 | |||
SyP7 | ← | Pensar en ayudar | .429 | |||
SyP10 | ← | Pensar en ayudar | .366 |
*** p< .01
CONCLUSIONES
La escala de F & T de Garton y Gringart adaptada y aplicada a la población infantil boliviana, entre 8 y 12 años, demostró propiedades psicométricas aceptables. La detección de la normalidad antes del análisis reveló valores tolerables de asimetría negativa y curtosis; los datos tendían a distribuirse con relativa normalidad, aunque la prueba de Kolmogorov-Smirnov sugería rechazar la Ho de normalidad. Se eligió la prueba de Garton y Gringart (2005), principalmente porque cumplía dos requisitos: por un lado, contaba con un número reducido de ítems (12 ítems), algo muy conveniente para evaluar un atributo como la empatía en niños pequeños (véase Kokkinos y Kipritsi, 2012 y Scott y Graham, 2015). En la experiencia, los niños menores de 10 años tienen comprensibles dificultades para mantener la atención durante periodos prolongados, con más probabilidad de error al responder pruebas excesivamente largas. En segundo lugar, la escala F & T fue adaptada para medir sólo dos dimensiones: afectiva y cognitiva. Esta característica facilita la interpretación de los resultados de la medición, especialmente cuando se realiza con fines socioeducativos en el contexto escolar (van Noorden y Cols, 2015). Los resultados obtenidos permiten disponer de un instrumento compacto, sencillo de administrar y fácil de interpretar.
La estructura final de la escala no es muy diferente de la original; sin embargo, hay que advertir tres puntos. En primer lugar, las pruebas de comprensibilidad recomendaron la eliminación de dos ítems del factor cognitivo, reduciendo el número total de ítems de 12 a 10. En segundo lugar, se garantizó que todos los ítems se mantuvieran con una formulación positiva, por lo que no fue necesario invertirlos. Por último, se ajustó la escala de respuesta de la prueba para permitir sólo cuatro opciones. Esta decisión podría tener consecuencias en la sensibilidad general del instrumento o forzar la respuesta hacia un lado u otro de la escala. Sin embargo, también redujo el sesgo de los valores extremos, comunes en las escalas de cinco puntos (Bisquerra y Pérez-Escoda, 2015). Estos ajustes preliminares dieron lugar a modificaciones relevantes del instrumento, aunque creemos que no afectaron significativamente a su estructura original. Tampoco hay razones para pensar que las recomendaciones del análisis factorial de relacionar el factor afectivo con la preocupación empática y el factor cognitivo con la decisión de ayuda, afectaran a la identidad de la escala F & T.
El modelo propuesto para la adaptación del F & T pareció adecuado en términos generales; sin embargo, la fiabilidad obtenida aconseja cierta cautela en la evaluación de la consistencia interna de la prueba. Asimismo, las correlaciones entre los ítems de la escala general y la obtenida entre ambas dimensiones, mostraron valores muy significativos. La evaluación de la validez (concurrente, divergente y de constructo) fue satisfactoria, dando confianza a la relación ítem-constructo.
Por otro lado, en el presente estudio quedó claro que las mediciones de la empatía infantil basadas en el procedimiento de auto-reporte plantean varias dificultades. Una de ellas surge porque la medición depende de las perspectivas del evaluado o de otro informante, y al hacerlo; la validez de la medida se pone en duda debido a la falta de objetividad. Esto ocurre por dos razones a) es difícil estar seguro de la capacidad de las personas para interpretar y/o describir sus estados emocionales (particularmente cierto en el caso de la población infantil); y b) los auto-reportes nunca están exentos de la amenaza del sesgo emergente de deseabilidad social, especialmente en culturas donde la tendencia a enmascarar emociones debido al control social es común (Hunter, 2003; Eisenberg y cols., 1987; Eisenberg & Fabes, 1990, Eisenberg & Lennon, 1983).
Estas debilidades deberían motivar la exploración de alternativas de medición más objetivas que complementen las formas introspectivas convencionales que presentan sólo una perspectiva de las expresiones de la empatía. Las iniciativas de Tamburrino (1993) y Long y Cols. (2006) van en esta dirección, combinando la evaluación de registros de video o viñetas, conductas verbales que obligan a emitir juicios explícitos sobre el comportamiento del evaluado, y auto-reportes subjetivos.
Por otro lado, los mecanismos de evaluación de la empatía deberían ir de la mano de la creciente producción tecnológica disponible en la llamada 'computación afectiva', que permite el desarrollo de sistemas capaces de reconocer y medir, de forma automática y remota, emociones y otras expresiones difícilmente accesibles. Algunos autores (véase Picard, 1997, 2003) han informado de aplicaciones tecnológicas desligadas de la psicología, la informática y la ingeniería biomédica que miden las emociones mediante algoritmos derivados del aprendizaje automático o la inmersión en entornos virtuales (Baños y Cols., 2004; Martín-Morales y Cols., 2017).
Finalmente, debe reconocerse como una limitación de este estudio, la imposibilidad de articular la simplicidad necesaria para medir la empatía en niños, con la urgencia de no descuidar la multidimensionalidad del constructo. Futuras investigaciones deberán abordar la medición parsimoniosa de la empatía infantil sin sacrificar su complejidad y buscando complementar el auto-informe con otras medidas de las múltiples y concurrentes manifestaciones de la empatía humana.