INTRODUCCIÓN
La autoeficacia continúa siendo un tema destacado en las investigaciones y aplicaciones prácticas relacionadas a los procesos de enseñanza y aprendizaje, dado su impacto significativo en la motivación y el rendimiento estudiantil. Por otro lado, Bandura (1986) define la autoeficacia como las creencias individuales acerca de la capacidad para lograr metas y objetivos propuestos. En el ámbito educativo, específicamente entre los docentes, se conceptualiza como la confianza que el maestro tiene en su habilidad para fomentar el aprendizaje de los estudiantes. Esta confianza juega un papel crucial no solo en el desempeño del docente, sino también en el desarrollo académico de los estudiantes, destacando así la importancia de fortalecer la autoeficacia como componente clave en la dinámica educativa (Tschannen-Moran y Woolfolk Hoy, 2001).
Cabe destacar que, la formación del profesorado se presenta como el elemento esencial para el progreso óptimo en las actividades educativas, ya que su función primordial radica en el desarrollo, discernimiento y potenciación de las capacidades, habilidades y actitudes necesarias para alcanzar metas o afrontar desafíos, así como para percibir su propia autoeficacia (Phelps et al., 2020; Buchanan et al., 2020). En concordancia con esta perspectiva, la Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (Unesco, 2018) refiere que a nivel global han destacado la importancia de evaluar a los docentes de manera anual, considerando aspectos como rendimiento, conocimiento, dominio de la materia, gestión del entorno en el aula, actitudes, autonomía durante las clases y oportunidades de desarrollo profesional en el ejercicio docente.
Asimismo, la Unesco señaló que alrededor del 20% de los educadores en todo el mundo tienen una formación mínima, destacando la necesidad de fortalecer la eficacia docente y los conocimientos esenciales en áreas como la educación, el liderazgo pedagógico, el aprendizaje inclusivo y la gestión en el aula (Unesco, 2020; Chien-Hsiang y Ching-Shan, 2021). Además, no existen estándares absolutos en cuanto a las evaluaciones del desempeño docente (Bi, 2020). A pesar de ello, se observa un nivel elevado en el desempeño docente de los maestros de educación islámica en la etapa intermedia (Freeh y Hussein, 2021).
En el contexto peruano, el Ministerio de Educación [MINEDU] (2018) ha destacado la histórica exigencia de calidad en el ámbito educativo, eficacia en la labor docente y condiciones laborales apropiadas. Como respuesta a estas demandas, se llevaron a cabo significativas modificaciones en el sistema educativo, y se desarrolló una estrategia centrada en el desempeño docente con el objetivo de garantizar una enseñanza de calidad. Asimismo, se inició la evaluación del desempeño de los docentes en el primer nivel del sistema educativo, específicamente en el nivel inicial. Esta evaluación abarcó a un total de 5,437 docentes de los ciclos I y II, y de este grupo, el 0.7%, equivalente a 38 docentes, no logró aprobar la evaluación.
A pesar de contar con docentes que poseen autoeficacia, esta competencia parece no ser suficiente para asegurar la sostenibilidad de la calidad en la enseñanza, el aprendizaje y la atención a las necesidades y desafíos tanto en el aula como en la institución educativa. Esto podría desviar la atención del papel que esta última cumple en la gestión y liderazgo de sus colaboradores, así como en la formulación de lineamientos y estrategias para llevar a cabo sus funciones. En este sentido, Chegini et al., (2019) señalan la existencia de una fuerza relativa que impulsa la identificación con la institución, el deseo de permanencia y la maximización de los esfuerzos en su favor, conocida como compromiso organizacional. No obstante, investigaciones revelan que los centros educativos carecen de políticas que permitan revalorizar, motivar y estimular la mejora profesional de los docentes, lo que resulta en desinterés y desánimo por parte de estos últimos (Estrada y Mamani, 2020).
Es importante mencionar La autoeficacia puede ser específica, enfocada en habilidades concretas en contextos particulares, o general, relacionada con la capacidad global para manejar situaciones diversas (Ceniceros y Hernández, 2018; Lazarides et al., 2021). En este estudio, se utiliza la Escala de Autoeficacia Docente del Profesor Universitario de Prieto (2007), un instrumento de 44 ítems distribuidos en cuatro dimensiones: Planificación, que mide la capacidad de estructurar objetivos y recursos de enseñanza; Implicación, centrada en el compromiso para motivar y fomentar la participación estudiantil; Interacción, que evalúa la habilidad de generar un clima de confianza y respeto en el aula; y Evaluación, enfocada en la reflexión y adaptación de la enseñanza mediante retroalimentación efectiva. Estas dimensiones permiten una evaluación integral del docente, desde la planificación hasta la evaluación de su práctica, garantizando un proceso educativo más efectivo y enfocado en el aprendizaje de los estudiantes.
El estudio tiene como objetivo analizar la validez y confiabilidad de la Escala de Autoeficacia Docente de Prieto (2007) en el contexto peruano, específicamente en docentes de nivel inicial. Esto permitirá determinar la pertinencia y robustez del instrumento para medir de manera efectiva las dimensiones críticas de la autoeficacia docente: planificación, implicación, interacción y evaluación. Validar este instrumento garantiza no solo su aplicación confiable en futuras investigaciones, sino también su utilidad como herramienta diagnóstica para el diseño de estrategias de formación docente que impacten positivamente en la calidad educativa.
MÉTODO
El estudio se clasificó como de tipo aplicada, ya que su propósito fue generar conocimiento orientado a evaluar la confiabilidad y validez de la Escala de Autoeficacia Docente, con el fin de facilitar su uso en contextos educativos. Se adoptó un diseño instrumental, centrado en el análisis de las propiedades psicométricas del instrumento (Ato y Vallejo, 2007).
La investigación fue de tipo no experimental, debido a que no se manipuló ninguna variable independiente. En su lugar, se analizaron datos recolectados directamente del entorno natural de los participantes. Además, se implementó un diseño de campo, dado que los datos fueron obtenidos en los espacios donde los docentes desarrollaban sus actividades, lo que permitió obtener una perspectiva contextualizada del fenómeno estudiado.
La muestra estuvo conformada por 350 docentes de nivel inicial pertenecientes a la UGEL 04 de Comas. Se utilizó un muestreo no probabilístico por conveniencia, seleccionando participantes según su accesibilidad y disposición para colaborar con el estudio. Este enfoque permitió obtener una representación adecuada del contexto educativo analizado.
Para la recolección de datos se utilizó la Escala de Autoeficacia Docente del Profesor Universitario, desarrollada por Prieto (2007). Este cuestionario constó de 44 ítems distribuidos en cuatro dimensiones:
Planificación (12 ítems): Evaluó la capacidad del docente para estructurar el proceso de enseñanza, incluyendo la identificación de objetivos, diseño de materiales, planificación de evaluaciones y flexibilidad para ajustarse a las necesidades de los estudiantes. También abarcó la preparación y dominio del contenido.
Implicación (10 ítems): Midió el compromiso del docente para motivar e involucrar a los estudiantes en el aprendizaje, fomentando la participación activa, la autonomía y la confianza de los alumnos.
Interacción (8 ítems): Analizó la habilidad del docente para establecer un ambiente de confianza y respeto, promover actitudes positivas hacia el aprendizaje y manejar situaciones problemáticas con calma.
Evaluación (14 ítems): Examinó la capacidad del docente para reflexionar sobre su práctica, implementar métodos variados de evaluación y utilizar los resultados para mejorar la enseñanza, incluyendo la retroalimentación significativa.
Procedimientos de análisis
Se llevó a cabo una distribución de frecuencias para cada dimensión, junto con el cálculo de medidas estadísticas como la media, desviación estándar, sesgo y curtosis. Para evaluar las relaciones entre dimensiones, se utilizó el coeficiente de correlación de Pearson. En cuanto a la confiabilidad del instrumento, se emplearon diversos métodos, como el Alfa de Cronbach, el método de las dos mitades y los coeficientes omega (jerárquico y total). Asimismo, se aplicó la prueba de adecuación muestral KMO. Para determinar la estructura dimensional del instrumento, se realizó un análisis de componentes principales (PCA), seguido de una rotación ortogonal mediante el método Varimax para optimizar la interpretación de los factores. Finalmente, se evaluó la bondad de ajuste del modelo mediante índices como el CFI, TLI, RMSEA y SRMR.
Se aplicaron pruebas de diferencia de medias, utilizando la distribución t de Student, para explorar posibles diferencias en las puntuaciones de la escala según el sexo y la edad de los participantes.
RESULTADOS Y DISCUSIÓN
La Tabla 1 muestra el estadístico de la variable frecuencia de autoeficacia y sus dimensiones. En todos los factores se observa un patrón creciente, siendo en todos los casos la categoría Muy Alto la modal, con frecuencias que van desde 165 (D2 - Implicación) hasta 307 (D1 - Planificación) casos. El menor promedio registrado es 39.88 (de un máximo posible de 48 puntos) y corresponde a la dimensión Interacción, mientras que el máximo promedio tiene un valor de 68.43 (de un máximo posible de 84 puntos) y corresponde a la dimensión Evaluación. La menor desviación estándar tiene un valor de 4.34 y corresponde a la dimensión Interacción, mientras que la máxima dispersión es de 5.70 y corresponde a la dimensión Evaluación.
La Tabla 2 muestra el resumen estadístico de la variable frecuencia de autoeficacia y sus dimensiones. Para la dimensión Interacción (D3), la categoría más frecuente es Alto, con 141 casos, mientras que, para el resto de factores, la categoría Medio es la modal, con frecuencias que van desde 128 (D1 - Planificación) hasta 162 (D4 - Evaluación) casos. El menor promedio registrado tiene un valor de 30.67 y corresponde a la dimensión Interacción (D3), mientras que el mayor promedio pertenece a la dimensión Evaluación (D4), con un valor de 49.88. La menor desviación estándar tiene un valor de 7.30 y corresponde a la dimensión Interacción, mientras que la máxima dispersión es de 12.30 y corresponde a la dimensión Evaluación.
Las Tablas 3 y 4 reportan las correlaciones para las dimensiones de la variable Frecuencia y Capacidad, respectivamente. Para todos los casos, las correlaciones reportadas son significativas (p<0.05); para la variable Frecuencia, el menor valor reportado es de 0.6347 y corresponde a la correlación entre D1 y D2, mientras que el mayor valor es de 0.8540 y representa la relación entre la variable Frecuencia y la dimensión Evaluación (D4). En el caso de la variable Capacidad, el menor grado de ajuste tiene un valor de 0.7651 y representa la relación entre las dimensiones Interacción (D3) e Implicación (D2); por otra parte, el mayor valor reportado es de 0.8858 y corresponde a la relación entre la variable Capacidad y la dimensión Planificación (D1).
Para verificar la confiabilidad de los dos modelos, se utilizaron los modelos de Alfa de Cronbach, el modelo de las dos mitades y omega, los resultados se muestran en la Tabla 5. Verificando los valores de Alfa de Cronbach, los valores del coeficiente estandarizado para las variables Frecuencia y Capacidad son 0.8352 y 0.8793, respectivamente; los intervalos de confianza al 95% están dentro del rango considerado como aceptable. A través del método de las dos mitades, se reportan valores de 0.8351 para Frecuencia y 0.8793 para Capacidad, valores muy similares a los obtenidos con el Alfa de Cronbach; todos los valores están dentro del rango de los considerado como aceptable. Analizando el valor del coeficiente omega, se reporta que el modelo es capaz de explicar el 84.23% de la variabilidad de la Frecuencia y el 88.07% de la Capacidad; adicionalmente, al análisis de la omega jerárquica revela que el 96.17% de la variabilidad de la Frecuencia y el 95.29% de la variabilidad de la Capacidad son atribuibles al factor general de cada modelo.
Para medir la adecuación del muestreo y por tanto la idoneidad de los datos, se realiza un test KMO a ambas variables, el resultado para la variable Frecuencia revela que el valor medio es de 0.8188, con valores que oscilan entre 0.7462 (ítem 14) y 0.8519 (ítem 03). Por otra parte, para la variable Capacidad, la adecuación promedio es de 0.8802, con un abanico de valores que se extiende entre 0.8883 (ítem 30) y 0.8509 (ítem 12). En base a las cifras obtenidas, puede afirmarse que ambas variables poseen un grado de varianza común de los datos que puede considerarse meritorio y que por tanto puede realizarse un análisis de componentes principales (PCA).
Las Tablas 6 y 7 muestran los resultados del Análisis de Componentes Principales para las dos variables analizadas. En ambos casos, los primeros cuatros componentes reportan cargas factoriales superiores a 1, por lo que se decide utilizar esa cantidad de componentes para ambos modelos; el modelo de la variable Frecuencia es capaz de explicar el 88.86% de la variabilidad, mientras que el modelo de la variable Capacidad logra aglutinar el 60.68% de la dispersión natural de los datos.
El resultado de la rotación ortogonal usando el método varimax se muestran en las Tablas 8 (Frecuencia) y 9 (Capacidad). Para ambas variables, cada una de las cuatro dimensiones del modelo original coinciden con los 4 componentes del modelo desarrollado. Para el caso de la variable Frecuencia, los coeficientes del modelo oscilan entre 0.7155 (D1) y 0.8864 (D4), mientras que para capacidad el rango va desde 0.6312 (D3) hasta 0.7894 (D4).
Finalmente, para evaluar la calidad del modelo desarrollado, se calculan algunos índices de bondad de ajuste, cuyos valores se reportan en la Tabla 10. Se reporta que todos los parámetros calculados se encuentran dentro del rango considerado como normal o regular, por lo que se afirma que los modelos desarrollados poseen una estructura consistente o válida.
Para determinar si el sexo es un factor capaz de condicionar el puntaje, se desarrolla una prueba t de diferencia de medias, cuyos resultados se reportan en la Tabla 11. Para todos los factores analizados, se reporta que p>0.05, es decir, no se encontraron diferencias significativas entre sexos para los puntajes de las variables y dimensiones del estudio.
Discusión
Los modelos desarrollados por la presente investigación lograron obtener valores de Alfa de Cronbach de 0.8316 para Frecuencia y 0.8787 para Capacidad; ambos valores están por debajo del valor de 0.89 reportado por García-Méndez y Rivera-Ledesma (2021). Otros trabajos que reportan un Alfa superior al de la presente investigación son el de Sáez-Delgado et al., (2020) quienes obtuvieron un coeficiente de 0.93 y Menghi et al., (2015), quien logra un valor de 0.90. Todos estos valores están dentro del marco de los valores comúnmente aceptados como válidos, por lo que todas las muestras acá mencionadas se consideran consistentes.
Respecto a la proporción de varianza explicada por los modelos, el presente trabajo reporta que logra condensar el 81.01% de la varianza para la variable Frecuencia y 83.92% para la variable Capacidad; ambos valores son superiores al 59.5% reportado por García-Méndez y Rivera-Ledesma (2021), el 44.12% de Galindo- Domínguez (2020) y el 63.53% de Menghi et al., (2015). Otro autor que reporta un valor inferior al obtenido por esta investigación es verificando la adecuación de la muestra, el KMO obtenido es de 0.8188 para Frecuencia y 0.8802 para Capacidad, ambos valores son inferiores al 0.936 obtenido por Galindo- Domínguez (2020); otro trabajo que reporta su valor es el de Sáez-Delgado et al., (2020) quien logra un coeficiente de 0.83, el cual es mayor al obtenido para Frecuencia, pero menor al obtenido para Capacidad. Respecto al rango de valores, todos los autores consultados coinciden con el presente trabajo en haber obtenido valores aceptables, lo que garantiza la idoneidad de la muestra.
Este estudio develó que, no fue necesario modificar el número de ítems o de dimensiones del modelo inicial, a diferencia de trabajos como el de Galindo-Domínguez (2020) quien pasa de 44 a 22 ítems, o el de Sáez-Delgado et al., (2020) quienes eliminan 1 ítem del instrumento original, además de desarrollar un modelo unidimensional; finalmente, Sarmiento (2020) detecta que es posible eliminar 1 ítem del modelo original, pasando de 24 a 23 elementos para la encuesta. Este hallazgo indica que instrumento es adecuado para recopilar la información procedente de la muestra, es decir, es idóneo para poder desarrollar investigaciones sobre el fenómeno de la autoeficacia docente.
CONCLUSIONES
El estudio permitió evaluar exhaustivamente la validez y confiabilidad de la Escala de Autoeficacia Docente, cumpliendo con el objetivo planteado. En términos de análisis descriptivo, se identificaron las principales características de la distribución de los datos en cada dimensión del instrumento mediante medidas como la media, desviación estándar, sesgo y curtosis. Este análisis proporcionó información relevante sobre la variabilidad y consistencia en las respuestas de los participantes.
La correlación entre dimensiones reveló patrones significativos, destacando interrelaciones importantes que contribuyen a comprender el constructo de autoeficacia docente de manera integral. Estas asociaciones son fundamentales para validar la estructura del instrumento y su aplicabilidad en diferentes contextos educativos.
En cuanto a la confiabilidad del instrumento, los resultados mostraron altos niveles de consistencia interna. El coeficiente Alfa de Cronbach, junto con los coeficientes omega (jerárquico y total) y el método de las dos mitades, confirmaron la estabilidad y solidez del instrumento. Adicionalmente, la prueba KMO validó la adecuación de la muestra, garantizando la representatividad de los datos obtenidos.
El análisis de componentes principales (PCA) permitió identificar las dimensiones subyacentes del instrumento, optimizando su interpretación mediante la rotación ortogonal Varimax. Esta técnica evidenció que las dimensiones planteadas reflejan fielmente la estructura teórica del constructo, lo que refuerza la validez de la escala.
Finalmente, los índices de ajuste del modelo, como CFI, TLI, RMSEA y SRMR, confirmaron que el modelo propuesto es adecuado y consistente con los datos observados. Estos resultados validan la estructura y aplicación del instrumento en el contexto educativo, permitiendo su uso confiable para futuras investigaciones y evaluaciones.
CONFLICTO DE INTERESES. La autora declara que no existe conflicto de intereses para la publicación del presente artículo científico.

























