<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1683-0789</journal-id>
<journal-title><![CDATA[Acta Nova]]></journal-title>
<abbrev-journal-title><![CDATA[RevActaNova.]]></abbrev-journal-title>
<issn>1683-0789</issn>
<publisher>
<publisher-name><![CDATA[Universidad Católica Boliviana]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1683-07892018000200004</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Factores que intervienen en el rendimiento académico en la Universidad]]></article-title>
<article-title xml:lang="en"><![CDATA[Factors that affect Academic Performance at the University]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Arteaga Sabja]]></surname>
<given-names><![CDATA[Wendoline]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Sandoval]]></surname>
<given-names><![CDATA[Juan Pablo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Católica Boliviana  ]]></institution>
<addr-line><![CDATA[Cochabamba ]]></addr-line>
<country>Bolivia</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2018</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2018</year>
</pub-date>
<volume>8</volume>
<numero>4</numero>
<fpage>552</fpage>
<lpage>563</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_arttext&amp;pid=S1683-07892018000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_abstract&amp;pid=S1683-07892018000200004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_pdf&amp;pid=S1683-07892018000200004&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La minería de datos es ampliamente utilizada en el área de negocios, industrial o de servicio al consumidor. En este estudio se pretende darle una aplicación menos comercial y un poco más académica, que apoye en la toma de decisiones a los involucrados en el proceso de enseñanza-aprendizaje en la Universidad. El objetivo de este estudio es identificar factores que afectan el rendimiento académico de los estudiantes, mediante técnicas del aprendizaje supervisado utilizando árboles de decisión, para lograrlo se analizan los datos de las materias cursadas desde el año 2012 al año 2015 en pre grado de la Universidad Católica Boliviana, regional Cochabamba. Los resultados muestran que los factores que más afectaron el rendimiento académico fueron: la inscripción temprana, el mayor espacio libre en aula, repetir las materias, la hora de inicio de clases, el número de alumnos inscritos, la edad del estudiante y la experiencia del docente.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Data mining is widely used in business, industrial or consumer service areas. This study uses a data mining technique in academic scenarios, in order to support in decision-making to whom are involved in the teaching-learning process at the university. The goal of this study is to identify factors that affect the academic performance of students, using supervised learning techniques with decision trees. For this purpose, this study analyzes the undergraduate student records from 2012 to 2015 of the Bolivian Catholic University, regional Cochabamba. The study shows that the factors that most affect students' performance are: early registration, the largest free space in the classroom, repeating the subjects, the start time of classes, the number of students enrolled, the age of the student and the experience of the teacher.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Minería de datos]]></kwd>
<kwd lng="es"><![CDATA[rendimiento académico]]></kwd>
<kwd lng="es"><![CDATA[educación superior]]></kwd>
<kwd lng="en"><![CDATA[Data mining]]></kwd>
<kwd lng="en"><![CDATA[student performance]]></kwd>
<kwd lng="en"><![CDATA[higher education]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><b>Art&iacute;culo Cient&iacute;fico</b></font></p>     <p align="center">&nbsp;</p>     <p align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="4"><b>Factores que intervienen en el rendimiento académico en la Universidad</b></font></p>     <p align="center">&nbsp;</p>     <p align="center"><b><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><i>Factors that affect Academic Performance at the University</i></font></b></p>     <p align="center">&nbsp;</p>     <p align="center">&nbsp;</p>     <p align="center"><b><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Wendoline Arteaga Sabja &amp; Juan Pablo Sandoval</font></b></p>     <p align="center"><b><font face="Verdana, Arial, Helvetica, sans-serif" size="2"></font></b><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Universidad Católica Boliviana, Cochabamba, Bolivia</font></p>     <p align="center"><font size="2" face="Verdana, Arial, Helvetica, sans-serif"><a href="mailto:arteaga@ucbcba.edu.bo">arteaga@ucbcba.edu.bo</a></font></p>     ]]></body>
<body><![CDATA[<p align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Recibido: julio 2017    <br> Aceptado: agosto 2018</font></p>     <p align="justify">&nbsp;</p>     <p align="justify">&nbsp;</p> <hr align="JUSTIFY" noshade>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Resumen: </b>La minería de datos es ampliamente utilizada en el área de negocios, industrial o de servicio al consumidor. En este estudio se pretende darle una aplicación menos comercial y un poco más académica, que apoye en la toma de decisiones a los involucrados en el proceso de enseñanza-aprendizaje en la Universidad.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El objetivo de este estudio es identificar factores que afectan el rendimiento académico de los estudiantes, mediante técnicas del aprendizaje supervisado utilizando árboles de decisión, para lograrlo se analizan los datos de las materias cursadas desde el año 2012 al año 2015 en pre grado de la Universidad Católica Boliviana, regional Cochabamba.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los resultados muestran que los factores que más afectaron el rendimiento académico fueron: la inscripción temprana, el mayor espacio libre en aula, repetir las materias, la hora de inicio de clases, el número de alumnos inscritos, la edad del estudiante y la experiencia del docente.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Palabras clave: </b>Minería de datos, rendimiento académico, educación superior</font></p> <hr align="JUSTIFY" noshade>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Abstract: </b>Data mining is widely used in business, industrial or consumer service areas. This study uses a data mining technique in academic scenarios, in order to support in decision-making to whom are involved in the teaching-learning process at the university.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">The goal of this study is to identify factors that affect the academic performance of students, using supervised learning techniques with decision trees. For this purpose, this study analyzes the undergraduate student records from 2012 to 2015 of the Bolivian Catholic University, regional Cochabamba.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">The study shows that the factors that most affect students' performance are: early registration, the largest free space in the classroom, repeating the subjects, the start time of classes, the number of students enrolled, the age of the student and the experience of the teacher.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Key words: </b>Data mining, student performance, higher education</font></p> <hr align="JUSTIFY" noshade>     <p align="justify">&nbsp;</p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>1</b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="2">&nbsp; &nbsp; &nbsp;<b></b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Introducción</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Ciertamente no es fácil analizar todos los factores que intervienen en el rendimiento académico de los estudiantes en la Universidad. Algunos son bastante evidentes, como el nivel académico al ingresar a una carrera y el ambiente universitario, mientras que otros resultan más personales como la vocación por la profesión elegida, la motivación y la responsabilidad.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Si bien hay varios estudios interesantes al respecto, como el de K. P. Shaleena et al. 2015 y Abeer Badr et al. 2014, que predicen el rendimiento académico mediante el uso de técnicas de clasificación y minería de datos, en el presente trabajo más que predecir, se identificaron algunos factores que intervienen en la aprobación de los estudiantes en las carreras de pregrado en la Universidad Católica Boliviana San Pablo, regional Cochabamba.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>1.1 Aprendizaje Supervisado</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este estudio se utilizaron técnicas del aprendizaje supervisado, que se refiere al hecho de dotar al algoritmo de un conjunto de datos de entrenamiento donde se dan las &quot;respuestas correctas&quot; y se espera que el algoritmo con nuevos datos encuentre una &quot;respuesta adecuada&quot;, teniendo la idea de que hay una relación entre la entrada y la salida, de acuerdo a STANFORD, 2016.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este trabajo se aplicaron árboles de decisión para descubrir la información que almacenan los datos.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>1.2 Árboles de decisión</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los árboles de decisión son estructuras de datos jerárquicas que permiten obtener de forma visual las reglas de decisión bajo las cuales responden los estudiantes, a partir de datos históricos almacenados.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Un árbol de decisiones está compuesto por nodos de decisión. Dada una entrada, en cada nodo, se aplica una prueba y se toma una de las ramas dependiendo del resultado, este proceso empieza en la raíz y se repite recursivamente hasta llegar a un nodo hoja, en este punto el valor escrito en el nodo hoja constituye la salida, según explica Ethem Alpaydm, 2010. Además aclara que la estructura del árbol no se fija a priori, pero el árbol crece, las ramas y las hojas se agregan durante el aprendizaje dependiendo de la complejidad del problema inherente a los datos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este estudio se utilizaron árboles CHAID (del inglés <i>Chi-squared Automatic Interaction Detection</i>) ya que &quot;producen resultados intuitivamente atractivos y estadísticamente válidos&quot; de acuerdo al trabajo de Baron y Phillips, 1994. El algoritmo CHAID analiza todos los valores de cada variable predictora potencial a través del Chi-cuadrado, el cual refleja cuan relacionadas están las variables. A partir</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">de aquí, según Sanz Arazuri <i>et al. </i>2010 se selecciona el predictor más significativo para formar la primera partición en el árbol de decisión.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">De acuerdo al sitio de IBM Knowledge Center, 2017, si el predictor cuenta con más de dos categorías, se compararán estas categorías y se contraerán las que no presenten diferencias en los resultados. Este proceso de fusión de categorías se detiene cuando todas las categorías restantes difieren entre sí en el nivel de comprobación especificado.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La técnica de segmentación jerárquica utilizada por el algoritmo CHAID, según Magidson 1994, permite establecer una relación jerárquica de las variables explicativas en función de su nivel de significación a la hora de explicar la variable dependiente.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>2</b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="2">&nbsp; &nbsp; &nbsp;<b></b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Metodología</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El proceso que dirige este proyecto es conocido como KDD (<i>Knowledge Discovery in Databases</i>) y se refiere el proceso de descubrir de conocimiento de bases de datos, se lo usa en trabajos de investigación como el de Brijesh <i>et al, </i>2011, que analizan el rendimiento académico usando técnicas de minería de datos. A continuación, se detallan cada una de las fases del proceso.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>2.1     Selección de datos</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los datos se extrajeron mediante consultas a la base de datos del Sistema de Información Académico Administrativo, SIAA. De más de quinientas tablas que contiene el SIAA, se seleccionaron 15 tablas, que fueron relacionadas para mantener la integridad en los datos. Durante los años 2012 al 2015 se cursaron 8 semestres regulares, además de algunas materias dictadas en invierno y verano, se recopilaron, integraron y depuraron más de 68 mil registros en ese periodo. Cada registro representa la calificación de un estudiante de una carrera en una materia y un semestre dado.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En la <a href="#t1">Tabla 1</a> se presentan las variables que se seleccionaron para el estudio, luego de varias iteraciones en el proceso de extracción e integración.</font></p>     <p align="center"><a name="t1"></a><img src="/img/revistas/ran/v8n4/a04_tabla_01.gif" width="548" height="853"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>2.2</b> <b>Preparación de datos</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En esta etapa se utilizaron diversas estrategias para manejar datos faltantes o en blanco, datos inconsistentes o que están fuera de rango, Han y Kamber, 2001.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Se verificó que las variables tanto dependientes como independientes no contengan valores nulos o fuera de rango y se obtuvieron más de 57 mil registros de calificaciones. Cuando los datos encontrados fueron erróneos se decidió excluirlos como sugiere IBM, 2017, para incluir en el análisis solo datos correctos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>2.3 Transformación</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Una de las primeras variables generadas fue la nota total que es una variable dependiente, que está en el rango de 0 a 100 puntos, es un dato métrico resultado de sumar la evaluación continua que está valorada sobre 50 puntos, con la calificación del primer o segundo examen final también valorado sobre 50 puntos cada uno. Hay que tomar en cuenta que el estudiante se puede presentar a la primera sesión o a la segunda sesión, y en caso de ser necesario a ambas sesiones.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por otro lado, se generó la variable dependiente Aprobación que es categórica, que tiene uno de dos posibles valores [s/n] que representa que el estudiante si aprobó la materia con una nota total de más de 50 puntos o que no aprobó la materia con una nota total menor a 51 puntos, este dato se calculó en base a la nota total.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Otras variables que se generaron mediante consultas SQL a partir de datos ya existentes son: el espacio en aula, repetición de materias, cantidad de materias que se cursan en el semestre, inscripción, edad del estudiante, edad y experiencia del docente en la materia.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>2.4</b> <b>Descripción de datos</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">A continuación, se listan las carreras que son parte del estudio, junto a los registros de 4 años de notas de estudiantes y el porcentaje de registros de aprobación con una nota total mayor a 50 puntos.</font></p>     <p align="center"><img src="/img/revistas/ran/v8n4/a04_tabla_02.gif" width="523" height="545"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las carreras de Ingeniería Química, Ingeniería de Sistemas y Contaduría Pública son las que tienen registros con el menor porcentaje de aprobación. Cabe mencionar que Ingeniería Mecatrónica es una carrera nueva que tiene registros desde el año 2013.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El tipo de colegio del que viene el alumno determina su procedencia. Los estudiantes que provienen de instituciones privadas tienen mejores porcentajes de aprobación con 72%, los que proceden de colegios estatales alcanzan un 63% y si provienen del CEMA, Centro de Educación Media Acelerada, logran solo el 38% de aprobación.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Se tiene el registro de notas de 29 314 varones y de 28 554 mujeres. Los porcentajes de aprobación varían de acuerdo al género de los estudiantes ya que el 66% de varones aprobaron sus asignaturas, frente al 74% de mujeres.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En la siguiente figura se aprecia que el porcentaje de aprobación más alto se da cuando el estudiante ha tomado 6 materias en el semestre, con un 80%.</font></p>     <p align="center"><img src="/img/revistas/ran/v8n4/a04_figura_01.gif" width="499" height="314"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Al visualizar los porcentajes de aprobación de acuerdo al período académico en el que se dicta la materia, se aprecia un incremento en la aprobación en las materias que se dictan en invierno y verano.</font></p>     <p align="center"><img src="/img/revistas/ran/v8n4/a04_tabla_03.gif" width="504" height="155"></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los datos muestran que el 99% de los estudiantes son de nacionalidad boliviana y casi el 100% de los estudiantes son solteros.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>2.5      Minería de datos</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Una vez que se seleccionaron, integraron, prepararon y depuraron los datos, empieza el trabajo de minería de datos, según Cesar Pérez Lopez, 2007, &quot;La minería de datos es un proceso de descubrimiento de nuevas y significativas relaciones, patrones y tendencias al examinar grandes cantidades de datos&quot;.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este estudio se aplicaron árboles de decisión CHAID, para explicar la variable objetivo Aprobación que tiene una salida binaria [s/n] que representa si un estudiante aprueba o no una materia. Luego de aplicar el algoritmo CHAID a los datos de entrenamiento equilibrados, obtenidos de la mitad de la muestra aleatoriamente, se</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">genera un árbol que permite establecer una relación jerárquica de las variables predictoras que explican la variable dependiente Aprobación.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Finalmente se aplica el árbol generado en la otra mitad de la muestra con los datos de prueba para verificar la precisión del árbol.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>3</b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="2">&nbsp; &nbsp; &nbsp;<b></b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Resultados</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El árbol de decisión CHAID encuentra que la primera partición es la inscripción, que resulta ser el predictor más significativo. La inscripción es la diferencia entre la fecha de matriculación y la fecha de inicio del semestre, representada en días.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El algoritmo CHAID agrupó en siete categorías la variable Inscripción. Se aprecia que la moda en este árbol es: s, significa que, SI aprobó la materia, si la inscripción se realiza 3 días antes del inicio del semestre. En este árbol se trabajó con un el nivel de significación para la fusión de categorías de 0,05.</font></p>     <p align="center"><img src="/img/revistas/ran/v8n4/a04_codigo_01.gif" width="310" height="130"></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En la <a href="#t4">Tabla 4</a> se muestra la cantidad de registros y los porcentajes de aprobación de los datos de entrenamiento en cada categoría.</font></p>     <p align="center"><a name="t4"></a><img src="/img/revistas/ran/v8n4/a04_tabla_04.gif" width="556" height="127"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para conseguir un árbol más simple de interpretar, se cambió el nivel de significación para la fusión de categorías a 0,01. El resultado fue un árbol con menos nodos y con las categorías de las variables predictoras más fusionadas, en este caso la inscripción sigue siendo la primera partición del árbol y el predictor más significativo, ahora agrupada en solo dos categorías.</font></p>     <p align="center"><img src="/img/revistas/ran/v8n4/a04_codigo_02.gif" width="180" height="40"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este segundo árbol la moda continúa siendo aprobación si la inscripción se realiza 3 días antes del inicio del semestre, con 56 % de aprobados. Si la inscripción se da después del tercer día, solo el 39 % de los registros de entrenamiento son de aprobación.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Al analizar las ramas del último árbol, se aprecia en la <a href="#f2">Figura 2:</a> que, si la inscripción es menor o igual a -3 y el alumno está repitiendo la materia la moda es No aprobar. En el caso de que sea la primera vez que cursa la materia en las carreras de Contaduría Pública, Ingeniería Civil, Ingeniería de Sistemas e Ingeniería Química la moda es No aprobar, excepto cuando la materia inicia pasadas las 11 de la mañana y la edad del estudiante es menor o igual a 21 años. En caso que la materia inicie antes de las 11 de la mañana solo se aprueba si hay espacio libre mayor a 4.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para el resto de las carreras la moda es aprobar si la inscripción es temprana, y es la primera vez que se cursa la materia.</font></p>     <p align="center"><a name="f2"></a><img src="/img/revistas/ran/v8n4/a04_figura_02.gif" width="607" height="261"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La <a href="#f3">Figura 3:</a> muestra el segundo sub-árbol, donde se aprecia la relación jerárquica de las variables explicativas cuando la inscripción es mayor a -3.</font></p>     <p align="center"><a name="f3"></a><img src="/img/revistas/ran/v8n4/a04_figura_03.gif" width="488" height="259"></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Si la inscripción es posterior a tres días antes del inicio del semestre, la moda es reprobar en todos los casos, salvo que se tengan menos o igual a 33 alumnos inscritos en la materia, no se haya repetido la materia y se esté en carreras como: Comunicación, Derecho, Filosofía, Ing. Financiera, Ambiental, Mecatrónica, Telecomunicaciones o Psicología.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>4</b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="2">&nbsp; &nbsp; &nbsp;<b></b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Discusión</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este estudio se detectaron patrones en la matriculación, características de los estudiantes y docentes que afectan en el rendimiento académico, sin embargo no se cuenta con datos como el ambiente familiar o social, la vocación del estudiante y sus motivaciones, que son temas trascendentales a la hora de analizar el rendimiento académico, este es solo un primer paso con el objetivo de apoyar a estudiantes, docentes y administrativos a mejorar las decisiones que se tomen en torno al rendimiento académico en la Universidad.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>5</b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="2">&nbsp; &nbsp; &nbsp;<b></b></font><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Conclusiones</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los árboles de decisión son simples de interpretar, pero pueden dar resultados muy específicos si no se configura correctamente la división y fusión de categorías. Permiten visualizar las reglas de decisión, por lo tanto, favorecen el análisis de los datos ya que se pueden ver las condiciones bajo las cuales se realiza la selección.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En cuanto a los factores que intervienen en el rendimiento académico de los estudiantes se puede concluir que:</font></p>     <blockquote>       <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">• En ambos árboles CHAID, independiente del nivel de fusión, la inscripción es la primera partición y por lo tanto el predictor más significativo. Si bien la inscripción temprana no garantiza por si sola la mejora del rendimiento académico, junto a un mayor espacio libre en aula, un horario de clases acorde a las necesidades del estudiante y no haber reprobado antes la materia son variables que afectan en el rendimiento académico de los estudiantes en la Universidad. Estos resultados coinciden con estudios como el de Corral, 2006.</font></p>       ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">• De acuerdo con OXFORD 2015, las horas de inicio tempranas para la escuela a menudo no concuerdan con los ritmos circadianos del cuerpo. Tomando en cuenta este y otros estudios no sorprende que el rendimiento de los estudiantes mejore cuando la hora de inicio de clases se da pasadas las 11 am., especialmente para estudiantes menores a 21 años, ya que según Troxel 2017, los horarios de inicio antes de las 8:30 de la mañana impiden a los adolescentes dormir durante el momento de sus vidas que más lo necesitan.</font></p>       <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">• Un número de inscritos menor también ayuda a mejorar las oportunidades de aprobar una materia. La investigación de Aitken 1982, encontró que la nota promedio en la universidad se incrementa si mejora la calidad del ambiente físico en el cual el estudiante realizaba su trabajo académico. Esto indica que cursos concentrados no ofrecen las condiciones ideales de estudio.</font></p>       <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">• Es interesante observar que la edad o género del docente no son significativos en los árboles estudiados, y que en los niveles inferiores del árbol a mayor experiencia docente en una materia se produce un incremento en la reprobación. Este resultado coincide con Martí 2012, lo que sugiere que los docentes con mayor experiencia son más exigentes.</font></p>       <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">• La edad de los estudiantes ideal para aprobar asignaturas en la Universidad es antes de los 22 años. Este resultado coincide con el estudio de Kotsiantis <i>et al, </i>2005, donde indican que los estudiantes mayores tienden a reprobar materias en la Universidad. Esto puede deberse a que con el pasar de los años las personas deben empezar a trabajar o deciden formar familia, lo que los aleja de la concentración y motivación necesarias para culminar sus estudios.</font></p> </blockquote>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Referencias Bibliográficas</b></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[1] Abeer Badr El Din Ahmed,  Ibrahim Sayed Elaraby (2014). <i>Data Mining: A prediction for Student's  Performance Using Classification Method, </i>World Journal of Computer  Application and Technology. Vol. 2(2), pp. 43 - 47 </font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[2] Aitken M. (1982) <i>A  personality profile of the college student procrastinator. </i>Doctoral  dissertation, University of Pittsburgh. </font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=788533&pid=S1683-0789201800020000400002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[3] Bar&oacute;n, S. y Phillips, D.  (1994). <i>Attitude Survey Data Reduction Using CHAID: An Example in Shopping  Centre Market Research. </i>En Hooley, G. J. y Hussey M. K., Quantitative  Methods in Marketing (75-88). Londres: Academic Press. </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[4] Brijesh Kumar, Saurabh  (2011). <i>Mining educational data to analyze students' performance, </i>IJACSA  Vol. 2, No. 6. </font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[5] Cesar P&eacute;rez Lopez, (2007). <i>Miner&iacute;a de datos. T&eacute;cnicas y  herramientas. </i>Editorial Paraninfo, Espa&ntilde;a, Madrid. </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[6] Corral Verdugo, Xochitl D&iacute;az N&uacute;&ntilde;ez (2006). <i>Factores asociados a la  reprobaci&oacute;n de los estudiantes de la universidad de Sonora</i>, X Congreso  nacional de investigaci&oacute;n educativa, M&eacute;xico. </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[7] Ethem Alpayd&#305;n (2010). <i>Introduction  to Machine Learning</i>, Segunda Edici&oacute;n, The MIT Press Cambridge,  Massachusetts </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[8] Han , Kamber (2006). <i>Data  Mining: concepts and techniques, 2nd edition </i></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[9] IBM Knowledge center (2017).  . Recuperado el 20 de noviembre de 2017 de: <a href="https://www.ibm.com/support/knowledgecenter" target="_blank">https://www.ibm.com/support/knowledgecenter</a></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[10] K. P. Shaleena , Shaiju Paul (2015). <i>Data mining  techniques for predicting student performance, </i>Engineering and Technology  (ICETECH), IEEE. </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[11] Kotsiantis, Pintelas, P.E (2005). <i>Predicting  students marks in Hellenic Open University, ICALT 2005. </i>Fifth IEEE  international conference on advanced learning technologies, Kaohsiung, pp. </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[12] Magidson and Vermunt (2005<i>). An Extension of the  CHAID Tree-based Segmentation Algorithm to Multiple Dependent Variables</i>. Statistical Innovations  Inc., USA and Department of Methodology and Statistics, Tilburg University, </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[13] Magidson, J. (1994). <i>The CHAID Approach to  Segmentation Modeling: Chi-square Automatic Interaction Detection. </i>En  Bagozzi, R. P., (Ed.) Advanced Methods of Marketing Research (pp. 118-159). Oxford: Blackwell </font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[14] Mart&iacute; Ballester (2012)<i>. &iquest;Influyen las  caracter&iacute;sticas del profesor en el rendimiento acad&eacute;mico del estudiante? </i>Departamento  de Econom&iacute;a de la Empresa Universitat Aut&ograve;noma de Barcelona </font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[15] OXFORD University (2015). <i>Wake-up call over sleep and public health needed  performance. </i> </font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=788546&pid=S1683-0789201800020000400015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[16] Sanz Arazuri, Eva, Ponce de Le&oacute;n Elizondo, Ana  (2010)<i>. Claves en la aplicaci&oacute;n del algoritmo Chaid. Un estudio del ocio  f&iacute;sico deportivo universitario</i>. Revista de Psicolog&iacute;a del Deporte,  Universitat de les Illes Balears, Espa&ntilde;a </font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=788547&pid=S1683-0789201800020000400016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[17] STANFORD, Andrew Yan-Tak (2016), <i>Machine Learning  Course</i>. Recuperado el 12 de octubre de  2016 de: <i><a href="https://es.coursera.org/instructor/andrewng" target="_blank">https://es.coursera.org/instructor/andrewng</a></i></font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=788548&pid=S1683-0789201800020000400017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">[18] Troxel (2017). <i>Senior Behavioral and Social  Scientist at RAND and Adjunct Professor of Psychiatry and Psychology at the  University of Pittsburgh</i>. Recuperado  el 7 de octubre de 2017 de: <i><a href="https://www.ted.com/talks/wendy_troxel_why_school_should_start_later_for_teens#t-508869" target="_blank">https://www.ted.com/talks/wendy_troxel_why_school_should_start_later_for_teens#t-508869</a></i></font></p>     <p align="justify">&nbsp;</p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Abeer Badr]]></surname>
<given-names><![CDATA[El Din Ahmed]]></given-names>
</name>
<name>
<surname><![CDATA[Ibrahim]]></surname>
<given-names><![CDATA[Sayed Elaraby]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Data Mining: A prediction for Student's Performance Using Classification Method]]></article-title>
<source><![CDATA[World Journal of Computer Application and Technology]]></source>
<year>2014</year>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>43 – 47</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aitken]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[A personality profile of the college student procrastinator]]></source>
<year>1982</year>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Barón]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Phillips]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Attitude Survey Data Reduction Using CHAID: An Example in Shopping Centre Market Research]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Hooley]]></surname>
<given-names><![CDATA[G.J.]]></given-names>
</name>
<name>
<surname><![CDATA[Hussey]]></surname>
<given-names><![CDATA[M.K.]]></given-names>
</name>
</person-group>
<source><![CDATA[Quantitative Methods in Marketing]]></source>
<year>1994</year>
<month>19</month>
<day>94</day>
<page-range>75-88</page-range><publisher-loc><![CDATA[Londres ]]></publisher-loc>
<publisher-name><![CDATA[Academic Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brijesh Kumar]]></surname>
<given-names><![CDATA[Saurabh]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mining educational data to analyze students' performance]]></article-title>
<source><![CDATA[IJACSA]]></source>
<year>2011</year>
<volume>2</volume>
<numero>6</numero>
<issue>6</issue>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pérez Lopez]]></surname>
<given-names><![CDATA[Cesar]]></given-names>
</name>
</person-group>
<source><![CDATA[Minería de datos. Técnicas y herramientas]]></source>
<year>2007</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Paraninfo]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Verdugo]]></surname>
<given-names><![CDATA[Corral]]></given-names>
</name>
<name>
<surname><![CDATA[Díaz Núñez]]></surname>
<given-names><![CDATA[Xochitl]]></given-names>
</name>
</person-group>
<source><![CDATA[Factores asociados a la reprobación de los estudiantes de la universidad de Sonora]]></source>
<year>2006</year>
<conf-name><![CDATA[ X Congreso nacional de investigación educativa]]></conf-name>
<conf-loc> </conf-loc>
<publisher-loc><![CDATA[México ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ethem]]></surname>
<given-names><![CDATA[Alpaydn]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to Machine Learning]]></source>
<year>2010</year>
<edition>2</edition>
<publisher-loc><![CDATA[Cambridge^eMassachusetts Massachusetts]]></publisher-loc>
<publisher-name><![CDATA[The MIT Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kamber]]></surname>
<given-names><![CDATA[Han]]></given-names>
</name>
</person-group>
<source><![CDATA[Data Mining: concepts and techniques]]></source>
<year>2006</year>
<edition>2</edition>
</nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="">
<collab>IBM Knowledge center</collab>
<source><![CDATA[IBM Knowledge center]]></source>
<year>2017</year>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shaleena]]></surname>
<given-names><![CDATA[K. P.]]></given-names>
</name>
<name>
<surname><![CDATA[Shaiju]]></surname>
<given-names><![CDATA[Paul]]></given-names>
</name>
</person-group>
<source><![CDATA[Data mining techniques for predicting student performance]]></source>
<year>2015</year>
<publisher-name><![CDATA[Engineering and Technology (ICETECH), IEEE]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kotsiantis]]></surname>
<given-names><![CDATA[Pintelas]]></given-names>
</name>
</person-group>
<source><![CDATA[Predicting students marks in Hellenic Open University]]></source>
<year>2005</year>
<publisher-loc><![CDATA[Kaohsiung ]]></publisher-loc>
<publisher-name><![CDATA[ICALT]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Magidson]]></surname>
</name>
<name>
<surname><![CDATA[Vermunt]]></surname>
</name>
</person-group>
<source><![CDATA[An Extension of the CHAID Tree-based Segmentation Algorithm to Multiple Dependent Variables]]></source>
<year>2005</year>
<publisher-name><![CDATA[Statistical Innovations Inc., USA and Department of Methodology and Statistics, Tilburg University]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Magidson]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The CHAID Approach to Segmentation Modeling: Chi-square Automatic Interaction Detection]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Bagozzi]]></surname>
<given-names><![CDATA[R.P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Advanced Methods of Marketing Research]]></source>
<year>(199</year>
<month>4)</month>
<day>19</day>
<publisher-loc><![CDATA[Oxford ]]></publisher-loc>
<publisher-name><![CDATA[Blackwell]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ballester]]></surname>
<given-names><![CDATA[Martí]]></given-names>
</name>
</person-group>
<source><![CDATA[¿Influyen las características del profesor en el rendimiento académico del estudiante?]]></source>
<year>2012</year>
<publisher-loc><![CDATA[Barcelona ]]></publisher-loc>
<publisher-name><![CDATA[Departamento de Economía de la Empresa Universitat Autònoma de Barcelona]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="">
<collab>OXFORD University</collab>
<source><![CDATA[Wake-up call over sleep and public health needed performance]]></source>
<year>2015</year>
</nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sanz Arazuri]]></surname>
<given-names><![CDATA[Eva]]></given-names>
</name>
<name>
<surname><![CDATA[Ponce de León Elizondo]]></surname>
<given-names><![CDATA[Ana]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Claves en la aplicación del algoritmo Chaid. Un estudio del ocio físico deportivo universitario]]></article-title>
<source><![CDATA[Revista de Psicología del Deporte]]></source>
<year>2010</year>
<publisher-name><![CDATA[Universitat de les Illes Balears]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[STANFORD]]></surname>
<given-names><![CDATA[Andrew Yan-Tak]]></given-names>
</name>
</person-group>
<source><![CDATA[Machine Learning Course]]></source>
<year>2016</year>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Troxel]]></surname>
<given-names><![CDATA[Wendy]]></given-names>
</name>
</person-group>
<source><![CDATA[Senior Behavioral and Social Scientist at RAND and Adjunct Professor of Psychiatry and Psychology at the University of Pittsburgh]]></source>
<year>2017</year>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
