INTRODUCCIÓN
El desarrollo del pensamiento crítico (PC) en estudiantes de secundaria se ha convertido en un objetivo educativo fundamental en el siglo XXI. Dado que los adolescentes están inmersos en el mundo de la información rápida a través del internet es esencial que cada discente posea la capacidad de usar el PC como un escudo de defensa. De esta manera, podrán analizar datos adquiridos, afrontar momentos desafiantes y tomar decisiones pertinentes frente a dilemas. Por lo tanto, es vital desempeñarse de manera responsable, razonada, reflexiva y tener disposición crítica al decidir ante cualquier contexto considerando la vida, salud de los seres vivientes y de este planeta tierra que reclama sostenibilidad.
En el ámbito educativo, es crucial desde la escuela trabajar con actividades diseñadas para lograr aprendizajes que formen ciudadanos críticos (Gerdts et al., 2022). En este sentido, el Ministerio de Educación en el Perú (MINEDU, 2016) orienta el uso de experiencias de aprendizaje que incluyan materiales, acciones kinestésicas y trabajos en equipo. Estas experiencias deben enfatizar la investigación, criticidad, curiosidad y la propuesta de soluciones a contextos retadores con el objetivo de promover el interés en el aprendizaje. Asimismo, es emergente que las autoridades familiares y todos los colaboradores educativos sean parte del apoyo educativo para enseñar a ser críticos pensantes y evitar que la población de estudiantes caiga en la dependencia de adicciones.
Por consiguiente, en el contexto educativo, es relevante examinar la capacidad crítica de los discentes, para esto es esencial contar con un instrumento válido y fiable que permita examinar habilidades del pensamiento crítico. En esta línea, se evidencia un estudio sobre validez y fiabilidad de un cuestionario con 51 enunciados para analizar esta habilidad en la comuna estudiantil de secundaria basados en la prueba original de Watson y Glaser, contextualizado en Turquía. Este se aplicó a 945 colaboradores en ocho liceos educativos, su contenido fue validado por ocho docentes expertos y posee un coeficiente 0,87 de confiabilidad de Kr 20 en su totalidad (Orhan y Ceviker, 2022).
De manera similar, existe otro estudio de adaptación y validación de un manual de medición de percepciones del PC en universitarios de la facultad de servicio social de Noruega. Este instrumento que evalúa las dimensiones de apertura crítica y escepticismo reflexivo integrando once preguntas, mostró una fuerte significatividad (p ≤ .001) en todas sus subhabilidades, así como un buen ajuste en los datos (N = 182) y en el modelo de evaluación (Gerdts et al., 2022).
Por otro lado, se registra la traducción y validez del instrumento de Halpern adaptado en el país de Portugal, para la versión portuguesa se usó el análisis de factor confirmatorio para evaluar la estructura, dicho test registró una fiabilidad aceptable (Ω=0.75) y para el coeficiente de recuerdo-libre de (Ω=.70), pero no tan favorable para el componente reconocimiento del PC (Ω=.58). Adicionalmente, en Indonesia se realizó un trabajo de investigación sobre validar el mismo tipo de herramienta sobre el PC en la población de discentes de secundaria. Este está basado en el cuestionario del PC de Watson y Glaser y está enlazado al curso de educación cívica, resalta elevada significancia r=≥0.3 en correlación de Pearson y una confiabilidad >.08 -1 Alfa de Cronbach (Wayan et al., 2018). También, existe un trabajo validado en México aplicado a 135 alumnos, fue analizado por 18 maestros especialistas y hallaron pertinencia. Este indica 0.739 en Alfa de Cronbach, la examinación factorial abarca las tres dimensiones del PC, algunas interrogantes están vinculadas al área médica y la muestra es de universitarios médicos (Olivares y López, 2017).
Finalmente, muchos analistas consideran la prueba original del pensamiento crítico de Watson-Glaser de 80 preguntas como un manual extenso y demanda mucho tiempo para ser completado por los colaboradores. Por ello, en 1994 se diseña una versión corta (WGCTA-FS) a cargo de los propios autores. Esta versión consta de 40 enunciados, ha sido empleada en universitarios de pregrado mostrando una fiabilidad de KR20 en r =.76 y un valor de r =44 en el método de mitades partidas en los enunciados pares e impares (Gadzella, et al., 2005). En Perú, existe un instrumento de medición orientada a la reflexión del PC, la cual fue validada por tres jueces expertos obteniendo alto reporte de 0,81 según Kr20 (Guevara, 2016).
En resumen, el pensamiento crítico es la habilidad de identificar un dilema, elegir información relevante, reconocer supuestos, seleccionar hipótesis idóneas, emitir juicios razonables y justificar inferencias (Orhan y Tekin, 2022). Esta habilidad racional y reflexiva está direccionado a decidir, actuar y cuándo garantizar algo (Tenreiro y Marques, 2021).
De manera similar, este proceso prioriza entender y analizar los argumentos en una situación real y emplear recursos para diferenciar lo razonable de lo no cuerdo, lo que es verdadero o falacia (Grados y Raza, 2018). Además, se destaca al PC como el desarrollo de un juicio autorregulado para un fin preciso e incluye aspectos de análisis, interpretación, examinar, inferir, explicar y autorregular (Olivares y López, 2017).
En efecto, pensar críticamente implica estudiar situaciones detalladamente y proponer acciones pertinentes para resolver retos (Lovelace et al., 2016). Es la aplicación del manejo del conocimiento para identificar situaciones desafiantes, establecer actos pertinentes, evaluar alternativas y dar continuidad a los actos idóneos para culminar problemas (Baldwin et al., 2011). Esta capacidad integra el análisis, la comprensión, la interpretación de puntos de vista o enunciados que se orientan a ser aprobados. Dicha evaluación puede fundamentarse en la observación, la evidencia empírica, el razonamiento o el uso del método científico, enfatizando la claridad, la evidencia y la equidad. Componentes como la inferencia, la identificación de supuestos, la deducción, la interpretación y la evaluación de argumentos son esenciales en la prueba de evaluación del PC de (Watson y Glaser, 1994) considerada una herramienta reconocida.
Actualmente, existen diversas pruebas que evalúan el PC incluyendo diversas subhabilidades y estos son aplicables en poblaciones distintas basados en pruebas estandarizadas de Watson y Glaser, Facione, Halpern y entre otros. Sin embargo, algunas de estas pruebas requieren tiempo excesivo para responder y están computarizadas (Olivares y López, 2017).
En el contexto peruano, la carencia de un instrumento válido para evaluar el PC en estudiantes del séptimo ciclo de educación básica regular, representa un desafío significativo. Por lo tanto, el presente estudio se propone validar un instrumento de medición del PC adaptado para estudiantes de cuarto y quinto de secundaria y con el fin de determinar su pertinencia y utilidad en el contexto peruano. La disponibilidad de este instrumento permitirá a los educadores obtener datos precisos sobre el nivel de PC de los estudiantes, lo que facilitará la implementación de estrategias pedagógicas efectivas y la promoción del desarrollo de estas habilidades.
En consecuencia, la pregunta de investigación es ¿Cuáles son las propiedades psicométricas (validez de contenido, validez de constructo y fiabilidad) de un instrumento adaptado para medir el pensamiento crítico de estudiantes de secundario en el contexto peruano?, para responder a esta pregunta el objetivo del estudio es validar un instrumento de medición del pensamiento crítico para estudiantes de secundaria en el contexto peruano.
MÉTODO
El enfoque seleccionado para este estudio es cuantitativo, de tipo instrumental y con un diseño no experimental. El enfoque cuantitativo se justifica por la necesidad de obtener datos numéricos y estadísticos para evaluar la validez y fiabilidad del instrumento adaptado.
Inicialmente, se solicitó y obtuvo la autorización del autor original del instrumento de medición del pensamiento crítico en estudiantes de secundaria desarrollado en Turquía. Tras obtener el consentimiento, se procedió a la adaptación y validación del instrumento para el contexto peruano. El instrumento original está escrito en idioma turco e inglés y fue desarrollado en la teoría de Watson y Glaser, integra 51 preguntas con sus respectivos textos basados en el diario de un estudiante de secundaria. Está validado por ocho docentes expertos y posee 0.87 en coeficiente de fiabilidad de KR20 y presenta buenos índices de validez.
Posteriormente, se realizó la traducción la traducción del instrumento al español por un traductor certificado. Además, se consultó a dos especialistas profesores de comunicación en educación básica regular para analizar la comprensión de la prueba original en términos de suficiencia, claridad, coherencia y relevancia en el contexto peruano. Se determinó considerar de mucha importancia y suficiencia de cinco a seis items por cada componente del PC en el instrumento adaptado, considerando los textos e interrogantes hacia el interés de los discentes adolescentes peruanos.
Fueron incluidos los enunciados uno, cuatro, cinco, seis y diez para la subhabilidad inferencial, las preguntas 11, 12, 14, 15 y 17 para la evaluación de argumentos, 21, 23,28 y 29 para deducción, para el componente suposición se registraron las preguntas 30, 33, 36, 38, 39 y 41 y finalmente en la interpretación están los enunciados 42, 43, 45, 46, 47 y 48. El manual de evaluación integró 26 items con sus respectivos textos. También, se requirió a 13 maestros expertos, la cual seis de ellos son maestros del nivel secundario y otros educadores universitarios para la revisión y validación de la herramienta. Se realizaron las modificaciones sugeridas por los profesionales validadores en cuanto a la amplitud y redacción del instrumento en relación al contexto local peruano e interés estudiantil para optimizar la coherencia en español.
Adicionalmente, se solicitó la autorización al directivo principal de un centro educativo de secundaria ubicado en el distrito Comeño en Lima para aplicar el cuestionario a los discentes de secundaria del séptimo ciclo y se emitió el consentimiento informado de manera virtual a la comunidad de padres de familia.
Luego, se ejecutó el examen piloto a un aula de 33 discentes, que cumplen con características similares y después de analizar los resultados se eliminó los enunciados uno, diez, quince y diecisiete para optimizar la fiabilidad.
Seguido, se aplicó el test a una muestra de 200 estudiantes de 13 a 17 años de edad y se trabajó con los programas de Kr20 y mitades partidas para la confiabilidad y para encontrar las valideces se emplearon la prueba de V Aiken, índices de dificultad y discriminación de enunciados, método de Kruskal-Wallis, U Mann Whitney, Correlación canónica y Spearman Brown. Todos los análisis se realizaron en el programa estadístico SPSS.
RESULTADOS Y DISCUSIÓN
A continuación, se presentan los resultados obtenidos en el proceso de validación del instrumento de medición del pensamiento crítico adaptado para estudiantes de secundaria en el contexto peruano. El análisis se centró en evaluar las propiedades psicométricas del instrumento, incluyendo la validez de contenido, la validez de constructo y la fiabilidad.
De acuerdo con los reportes de los índices de V de Aiken como parte de la validez de contenido de la variable de estudio y los criterios. Se reporta que el aspecto de S=suficiencia representa 0.988, C=claridad resalta un índice de 0.979, en Co=coherencia indica 0.913 y en el criterio de R=relevancia es de 0.909. De acuerdo con el reporte y el índice de concordancia de los jueces el instrumento presenta validez de contenido de 0.945 representando alto nivel de concordancia, Tabla 1:
Tabla 1 Índices de dificultad y discriminación de ítems
| ítems | Dificultad | Discriminación |
| 1 | 0.778 | 0.455 |
| 2 | 0.689 | 0.636 |
| 3 | 0.178 | 0.682 |
| 4 | 0.956 | 0.291 |
| 5 | 0.867 | 0.273 |
| 6 | 0.911 | 0.182 |
| 7 | 0.911 | 0.182 |
| 8 | 0.933 | 0.136 |
| 9 | 0.933 | 0.136 |
| 10 | 0.844 | 0.318 |
| 11 | 0.978 | 0.345 |
| 12 | 0.889 | 0.227 |
| 13 | 0.867 | 0.273 |
| 14 | 0.867 | 0.273 |
| 15 | 0.867 | 0.273 |
| 16 | 0.844 | 0.318 |
| 17 | 0.985 | 0.212 |
| 18 | 0.822 | 0.364 |
| 19 | 0.778 | 0.455 |
| 20 | 0.867 | 0.273 |
| 21 | 0.844 | 0.318 |
| 22 | 0.889 | 0.227 |
De acuerdo con los índices de los 22 enunciados de la prueba los valores oscilan entre 0.178 a 0.985 pudiéndose detectar los niveles de medición como fácil, regular y dificultoso, en general la prueba contiene 0.526 lo que implica adecuado nivel de dificultad. Además, los valores de los índices de discriminación varían ente 0.136 a 0.682. Sin embargo, el nivel de discriminación de ítems representa 0.41 e indica una discriminación de ítem adecuado. Tabla 2 a continuación, resultados de la prueba Kruskal - Wallis:
Tabla 2 Resultados de la prueba de Kruskal - Wallis
| Rangos | Estadísticos de pruebaa,b | |||||
|---|---|---|---|---|---|---|
| Variable | Componentes | N | Rango promedio | H de Kruskal-Wallis (X2) | gl | Sig. asintótica |
| Pensamiento crítico | Inferir | 200 | 34.81 | 159.650 | 4 | 0.000 |
| Evaluación de argumentos | 200 | 73.23 | ||||
| Deducción | 200 | 115.26 | ||||
| Suposición | 200 | 173.19 | ||||
| Interpretar | 200 | 168.51 | ||||
De acuerdo con los resultados de la tabla 2, los valores de la prueba de Kruskal Wallis próximo a la prueba de Chi cuadrado x2 = 159.650 con gl de 4 y p_valor < 0.05 registra que existe diferencia significativa entre los componentes de inferir, examinar argumentos, deducción, suposición e interpretar. Estas comparaciones implican la existencia de variación o el comportamiento de manera independiente en cada uno de los componentes.
Tabla 3 Resultados múltiples de Lambda y correlación canónica
| Prueba de funciones | Lambda de Wilks | Sig. | Correlación canónica |
|---|---|---|---|
| 1 | ,266 | ,000 | 0.857 |
Los resultados de la Tabla 3, muestran que de acuerdo con el valor de Lambda de Wilks 0.266 representa una diferencia significativa entre los componentes del pensamiento crítico, implica que son significativamente diferentes entre los componentes. Sin embargo, existe una correlación múltiple 0.857 entre los componentes de la variable puesto que p***. La Tabla 4, prueba U Mann Whitney, resultados:
Tabla 4 Resultados de la prueba U Mann Whitney para la comparación múltiple entre los componentes
| Prueba | Dimensión | Diferencia de rangos (I-J) | Desv. Error | Sig. | |
|---|---|---|---|---|---|
| U Mann Whitney | Inferir | Evaluación de argumentos | 1,08889* | 0.19619 | 0,00 |
| Deducción | 1,97778* | 0.19619 | 0,00 | ||
| Suposición | 3,66667* | 0.19619 | 0,00 | ||
| Interpretar | 3,55556* | 0.19619 | 0,00 | ||
| Evaluación de argumentos | Deducción | 2,88889* | 0.19619 | 0,00 | |
| Suposición | 2,57778* | 0.19619 | 0,00 | ||
| Interpretar | 2,46667* | 0.19619 | 0,00 | ||
| Deducción | Suposición | 1,68889* | 0.19619 | 0,00 | |
| Interpretar | 1,57778* | 0.19619 | 0,00 | ||
| Suposición | Interpretar | 0.11111 | 0.19619 | 0.98 | |
De acuerdo con los resultados de comparación estadística entre los componentes del pensamiento crítico de la Tabla 4, la comparación estadística entre la inferencia y la argumentación muestra una diferencia de 1.089 con un p_valor <0.05, con respecto a la deducción muestra de 1.978 con p_valor <0.05, mientras con la suposición representa 3.667 y p_valor <0.05 y con la interpretación resalta una diferencia de 3.556 y p_valor <0.05. Así mismo se tiene la comparación estadística con la argumentación y la deducción de 2.889 con p_valor <0.05, además con la suposición de 2.578 p_valor <0.05 y con interpretación de 2.467 p_valor <0.05. Mientras la comparación estadística entre la deducción con la suposición evidencia 1.689 p_valor <0.05 y con la interpretación de 1.578 con p_valor <0.05. Implica la existencia de la diferencia significativa estadística. Sin embargo, se ha detectado que no existe diferencia significativa entre la suposición con la interpretación puesto que a diferencia es de 0.111 y p_valor> 0.05. Valores correlacionales a continuación en la Tabla 5.
Los resultados de la correlación detectada por la prueba estadística de Spearman-Brown de la Tabla 5, muestran una relación entre baja y moderada; de ellos se tiene a las orientaciones y dirección positiva, implica que al incrementar el nivel de una de los componentes también incrementa el nivel de los otros componentes; además para cada uno de las asociaciones de los componentes se asumen valores de comparación estadística significativa, puesto que el valor de significación estadística p_valor <0.05. Los coeficientes de correlación más alta y representativa se encuentran entre la inferencia con la deducción de 0.508 y entre la deducción con la interpretación de 0.516, mientras que la correlación más baja se muestra entre la inferencia y la suposición de 0.296.
Por último, se ha detectado los coeficientes de la consistencia interna de los componentes del pensamiento crítico, al respecto el índice de KR20 de la inferencia representa 0.731, p*** y se tiene a la relación de mitades de nivel moderado, el componente evaluación de argumentos tiene KR20 de 0.734 con una relación de mitades moderada y p***, con respecto al componente deducción se tiene a KR20 de 0.720 con r mitades de 0.60 y p***, la dimensión suposición posee KR20 de 0.708 con r mitades de 0.512 y p***. Para la dimensión interpretar el KR20 es de 0.721 con r mitades de 0.581 y p***. Sin embargo, la prueba en conjunto muestra un coeficiente de KR20 de 0.709 y r mitades de 0.571 moderado y p***. Estos valores descritos muestran que la prueba representa buen nivel de consistencia interna y una correlación adecuada de mitades partidas y el valor de significación p_valor <0.05 lo que señala la existencia de una relación adecuada entre los ítems de la variable de estudio.
Discusión
En esta investigación adaptó y validó un instrumento de medición del pensamiento crítico basado en la teoría de Watson y Glaser, el cual fue originalmente desarrollado en Turquía (Orhan y Ceviker, 2022) aplicado a discentes de cuarto y quinto grado de secundaria de Perú. Los hallazgos de este estudio se alinean con la estructura multidimensional del PC propuesto por Watson y Glaser, que incluye dimensiones como inferencia, evaluación de argumentos, deducción, evaluación de suposiciones e interpretación.
El proceso de adaptación implicó la traducción del inglés al español por un traductor profesional y se trabajaron en algunas modificaciones en la redacción de los textos considerando la semántica y coherencia de acuerdo a la cultura y contexto peruano. Este resultado resalta lo expuesto por Rodríguez, et al., (2018) quienes resaltan que puede existir algunas variaciones en la traducción y comprensión de los enunciados de la prueba del pensamiento crítico cuando este es usado en distintos contextos o culturas.
Desde luego, se omitieron algunos interrogantes considerando la adaptación y amplitud de la prueba. El instrumento idóneo para evaluar el PC dependerá de las características de los encuestados, cultura, nivel de comprensión, propósito de la evaluación, rigurosidad, densidad de textos, lenguaje entendible, idioma entre otros aspectos a considerar, resultados que se alinean con (Betancourth et al., 2020), en cuanto a la pertinencia cultural en la evaluación psicológica.
En los hallazgos estadísticos, la prueba total obtuvo un coeficiente de 0.709 de Kr20 mostrando buena consistencia interna y adecuado índice de 0.571 en el método mitades partidas y un p-valor<0.05 resaltando una relación adecuada entre los enunciados de la variable de investigación. los resultados se comparan con los de Gadzella et al. (2005), quienes reportaron un KR-20 de 0.76 para la versión corta del instrumento de Watson y Glaser. Si bien los valores son similares, las diferencias podrían deberse a las particularidades de la muestra y el contexto peruano.
Por último, los resultados adquiridos en esta prueba adaptada y validada en el contexto peruano registran adecuados resultados en los coeficientes adquiridos de la data procesada en las pruebas de validaciones como la V de Aiken, índice de dificultad y discriminación de ítems, prueba de Kruskal Wallis, evaluación de Lambda y correlación canónica, U Mann Whitney y Spearmann-Brown. Los resultados de validez de contenido =0.945, índice de nivel de dificultad=0.526 y 0.41 en discriminación de ítems y los resultados obtenidos en la consistencia interna de un coeficiente de 0.709 de Kr20 y 0.571 en el método mitades partidas y un p_valor<0.05 resaltando una relación adecuada entre los enunciados de la variable del pensamiento crítico evidencian cercanía con los resultados adquiridos de la prueba de origen.
Los índices de validez de contenido, dificultad y discriminación se alinean con los hallazgos de Orhan y Ceviker (2022), lo que sugiere que el instrumento adaptado conserva las propiedades psicométricas del original. Estos resultados se comparan favorablemente con otros estudios que han validado instrumentos de PC en diferentes contextos, lo que resalta la robustez del instrumento adaptado.
CONCLUSIONES
La validación del instrumento diseñado para medir el pensamiento crítico en estudiantes de secundaria ha demostrado ser efectiva y fiable, evidenciada por un nivel adecuado de dificultad promedio de 0.526 y una consistencia interna robusta, con un coeficiente KR20 de 0.709. Los resultados del análisis de Kruskal-Wallis revelan diferencias significativas entre las dimensiones evaluadas: inferir, examinar argumentos, deducción, suposición e interpretación, lo que sugiere que cada componente contribuye de manera significativa al constructo del pensamiento crítico.
Además, la correlación positiva y moderada observada a través de la prueba de Spearman-Brown indica que el fortalecimiento en una dimensión puede influir favorablemente en las demás. Estos hallazgos subrayan la validez y la utilidad del cuestionario como herramienta diagnóstica para examinar el pensamiento crítico en este grupo poblacional, proporcionando una base sólida para futuras investigaciones y aplicaciones educativas en el desarrollo de habilidades críticas en los estudiantes.















