<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2074-4706</journal-id>
<journal-title><![CDATA[Revista Latinoamericana de Desarrollo Económico]]></journal-title>
<abbrev-journal-title><![CDATA[rlde]]></abbrev-journal-title>
<issn>2074-4706</issn>
<publisher>
<publisher-name><![CDATA[Universidad Católica Boliviana "San Pablo"]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2074-47062019000200005</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Clustering, mediterraneidad y comercio internacional: aplicación empírica de los algoritmos Partitioning Around Medoids y K-means]]></article-title>
<article-title xml:lang="en"><![CDATA[Clustering, Landlockedness and International Trade: Empirical Application of the Partitioning Around Medoids and K-means algorithms]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Gonzáles Argote]]></surname>
<given-names><![CDATA[Heynz Roberth]]></given-names>
</name>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Ticona Gonzáles]]></surname>
<given-names><![CDATA[Ulises Amaru]]></given-names>
</name>
</contrib>
</contrib-group>
<aff id="A">
<institution><![CDATA[,  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>11</month>
<year>2019</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>11</month>
<year>2019</year>
</pub-date>
<numero>32</numero>
<fpage>95</fpage>
<lpage>129</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_arttext&amp;pid=S2074-47062019000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_abstract&amp;pid=S2074-47062019000200005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.bo/scielo.php?script=sci_pdf&amp;pid=S2074-47062019000200005&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[El tema de la mediterraneidad ha generado bastante interés en el debate geopolítico, siendo Bolivia uno de los actores principales. Este hecho, junto con las nuevas herramientas de análisis de datos, como la inteligencia artificial y la minería de datos, motivan el presente estudio, el cual es pionero dentro de la literatura en el marco del análisis de países sin salida marítima mediante algoritmos no supervisados de minería de datos. En este sentido, se estudia y aplica la teoría de formación de clusters a través de los algoritmos K-means y PAM (Partitioning Around Medoids) con información de indicadores de comercio internacional de 188 países de un periodo de diez años, con el propósito de detectar si la condición de mediterraneidad es un factor limitante en la dinámica comercial de los países. Los resultados muestran que un subconjunto reducido de los países mediterráneos, entre ellos Bolivia, habrían aliviado, durante la última década, las restricciones que la mediterraneidad implica en los costos y tiempos de exportación e importación.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Landlockedness has generated significative interest in the geopolitical debate, particularly in Bolivia. This fact, along with innovative methodologies such as artificial intelligence and data mining, has motivated this research, which is unprecedented in the literature concerning landlockedness analysis through unsupervised algorithms of data mining. Consequently, the theory of cluster formation is studied and applied through the K-means and PAM (Partitioning Around Medoids) algorithms using international trade information of one hundred eighty-eight countries over a period of ten years, in order to test whether the landlockedness condition is a limiting factor in the commercial dynamics of countries. The results show that a reduced subset of the landlocked countries, including Bolivia, would have eased restrictions such as international trade costs and times, during the last decade.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Cluster]]></kwd>
<kwd lng="es"><![CDATA[mediterraneidad]]></kwd>
<kwd lng="es"><![CDATA[litoral]]></kwd>
<kwd lng="es"><![CDATA[comercio internacional]]></kwd>
<kwd lng="es"><![CDATA[minería de datos]]></kwd>
<kwd lng="en"><![CDATA[Cluster]]></kwd>
<kwd lng="en"><![CDATA[landlocked countries]]></kwd>
<kwd lng="en"><![CDATA[littoral]]></kwd>
<kwd lng="en"><![CDATA[international trade]]></kwd>
<kwd lng="en"><![CDATA[data mining]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="center">&nbsp;</p>     <p align="center">&nbsp;</p>     <p align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="4"><i><b>Clustering, </b></i><b>mediterraneidad y comercio internacional: aplicación empírica de los algoritmos <i>Partitioning Around Medoids y K-means</i></b></font></p>     <p align="center">&nbsp;</p>     <p align="center"><b><font face="Verdana, Arial, Helvetica, sans-serif" size="3">Clustering, Landlockedness and International Trade: Empirical Application of the Partitioning Around Medoids and K-means algorithms</font></b></p>     <p align="center">&nbsp;</p>     <p align="center">&nbsp;</p>     <p align="center"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i><b>Heynz Roberth Gonzáles Argote*, Ulises Amaru Ticona Gonzáles </b></i><b>**</b></font></p>     <p align="center">&nbsp;</p>     <p align="center">&nbsp;</p> <hr align="JUSTIFY" noshade>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Resumen</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El tema de la mediterraneidad ha generado bastante interés en el debate geopolítico, siendo Bolivia uno de los actores principales. Este hecho, junto con las nuevas herramientas de análisis de datos, como la inteligencia artificial y la minería de datos, motivan el presente estudio, el cual es pionero dentro de la literatura en el marco del análisis de países sin salida marítima mediante algoritmos no supervisados de minería de datos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este sentido, se estudia y aplica la teoría de formación de <i>clusters </i>a través de los algoritmos <i>K-means </i>y PAM (<i>Partitioning Around Medoids</i>) con información de indicadores de comercio internacional de 188 países de un periodo de diez años, con el propósito de detectar si la condición de mediterraneidad es un factor limitante en la dinámica comercial de los países.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los resultados muestran que un subconjunto reducido de los países mediterráneos, entre ellos Bolivia, habrían aliviado, durante la última década, las restricciones que la mediterraneidad implica en los costos y tiempos de exportación e importación.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Palabras clave: </b><i>Cluster, </i>mediterraneidad, litoral, comercio internacional, minería de datos.</font></p> <hr align="JUSTIFY" noshade>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Abstract</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Landlockedness has generated significative interest in the geopolitical debate, particularly in Bolivia. This fact, along with innovative methodologies such as artificial intelligence and data mining, has motivated this research, which is unprecedented in the literature concerning landlockedness analysis through unsupervised algorithms of data mining.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Consequently, the theory of cluster formation is studied and applied through the K-means and PAM (Partitioning Around Medoids) algorithms using international trade information of one hundred eighty-eight countries over a period of ten years, in order to test whether the landlockedness condition is a limiting factor in the commercial dynamics of countries.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">The results show that a reduced subset of the landlocked countries, including Bolivia, would have eased restrictions such as international trade costs and times, during the last decade.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Keywords: </b>Cluster, landlocked countries, littoral, international trade, data mining. </font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Clasificación/Classification JEL: </b>C82, F43, F55, O11, O57</font></p> <hr align="JUSTIFY" noshade>     <p align="justify">&nbsp;</p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>1.   Introducción</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El comercio que realiza un país no puede ser significativo si se tiene que recurrir a distintos canales de transporte poco eficientes, además de tener que transitar necesariamente por otro país antes de llegar a la costa. De esta forma, siempre estará en poder del país vecino con salida</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">al mar facilitar u obstruir la comunicación entre el país enclaustrado y las costas. Así, Smith (1796) reconocía los desafíos que enfrentaban los países sin litoral, también denominados mediterráneos, en términos de distancia y también de dependencia de un país de tránsito soberano para el comercio internacional.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">¿Por qué los países mediterráneos en desarrollo (LLDC)<sup>1</sup> enfrentan tales retos? Una corriente sugiere que la principal razón es la dificultad en el comercio: los sitios alejados geográficamente muestran rezagos a la hora de percibir las ganancias de la especialización y los beneficios asociados. Otra línea de pensamiento se deriva de la anterior hipótesis: la institucionalidad y tecnología que se genera en toda la dinámica del comercio internacional, logística, infraestructura y procesos productivos es menos avanzada en los países mediterráneos en desarrollo, debido a su menor escala y mayores costos administrativos para su ejecución.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">De esta manera, se examinarán los patrones de asociación de variables de comercio internacional que distinguen a los LLDC del resto de países. Se considera inédita la presente aplicación de herramientas de minería de datos no supervisadas, como los <i>clusters, </i>sobre el análisis de indicadores mundiales, relacionado a la mediterraneidad. Consecuentemente, en las dos secciones posteriores se hará una revisión de la literatura existente sobre las características de los LLDC y se presentarán hechos estilizados con énfasis en variables de comercio internacional sujetas a estudio. La sección posterior describe la metodología de técnicas de minería de datos de <i>machine learning </i>(método de aprendizaje supervisado), junto con los resultados. Finalmente, se presentan las conclusiones del documento.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>2.   Revisión de la literatura</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Hasta donde se pudo evidenciar en la búsqueda del estado del arte de la temática, la metodología empleada es nueva en el análisis de la mediterraneidad, por lo que los estudios revisados serán útiles sobre todo para explicar los resultados de <i>clusters </i>de países. En general la literatura se ha enfocado en emplear variables de comercio internacional para medir los costos de la mediterraneidad. También se encontraron múltiples estudios que miden el costo en el crecimiento económico y las interdependencias entre países con y sin litoral. En general, esos estudios encuentran impactos negativos de la mediterraneidad de distintos tipos (<a href="#c1">Cuadro 1</a>):</font></p>     ]]></body>
<body><![CDATA[<p align="center"><a name="c1"></a><img src="/img/revistas/rlde/n32/a05_cuadro_01.gif" width="530" height="1012"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Asimismo, el documento de UN-OHRLLS<sup>2</sup> (2013) analiza a detalle el impacto de la mediterraneidad sobre las perspectivas de desarrollo de los LLDC, mediante indicadores económicos, institucionales y sociales. Este estudio desarrolla un modelo econométrico estructural para estimar empíricamente el costo de la mediterraneidad en el desarrollo. El modelo pone énfasis en los múltiples canales de vínculo entre la mediterraneidad y el desarrollo, además del comercio internacional. Al mismo tiempo, a través de la construcción de umbrales específicos de los países, la metodología provee una medida de costo en el desarrollo para cada LLDC que se investiga. Se consideran las siguientes variables: ingreso <i>per cápita, </i>calidad institucional, integración económica, latitud, <i>dummy </i>de mediterraneidad, población económicamente activa, superficie terrestre y un indicador de recursos naturales.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Este trabajo recurre a cuatro métodos para estimar los coeficientes del modelo: Mínimos Cuadrados Ordinarios, Mínimos Cuadrados en 2 Etapas, Regresiones Aparentemente no Relacionadas y Método Generalizado de Momentos. La distancia al Ecuador (latitud) y la </font><font face="Verdana, Arial, Helvetica, sans-serif" size="2">condición de mediterraneidad presentan coeficiente negativo, indicando la existencia de una brecha entre los LLDC y los países con litoral, además de cierta influencia de la condición geográfica aproximada por la latitud. El nivel de ingresos, la institucionalidad y la integración económica inciden positivamente en el desarrollo, en concordancia con la literatura. Los resultados son robustos a la metodología de estimación.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>3.   Hechos estilizados</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En línea con la literatura revisada, se han seleccionado un conjunto de indicadores de comercio a ser utilizados como datos de ingreso a los algoritmos <i>K-means </i>y PAM (<i>Partitioning Around Medoids</i>). Estos indicadores, extraídos del <i>World Development Indicators </i>del Banco Mundial, son descritos a continuación:</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Costo de exportación (US$ por contenedor) - IC.EXP.COST.CD. El costo mide los honorarios cobrados para un contenedor de 20 pies en dólares de EE.UU. Se incluyen todas las tarifas asociadas para completar los procedimientos para exportar los bienes. Estos incluyen los costos de los documentos, los aranceles administrativos para el despacho de aduanas y el control técnico, los honorarios de los agentes de aduanas, los cargos por manipulación de terminales y el transporte terrestre. La medida del costo no incluye aranceles ni impuestos comerciales. Solo se registran los costos oficiales<sup>3</sup>.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Costo de importación (US$ por contenedor) - IC.IMP.COST.CD. El costo mide los honorarios cobrados para un contenedor de 20 pies en dólares de EE. UU. Se incluyen todas las tarifas asociadas para completar los procedimientos para importar los bienes. Estos incluyen los costos de los documentos, los aranceles administrativos para el despacho de aduanas y el control técnico, los honorarios de los agentes de aduanas, los cargos por manipulación de terminales y el transporte terrestre. La medida del costo no incluye aranceles ni impuestos comerciales. Solo se registran los costos oficiales.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Tiempo para exportar (días) - IC.EXP.DURS. Es el tiempo necesario para cumplir con todos los procedimientos requeridos para exportar bienes, y se registra en días naturales. El cálculo del tiempo para un procedimiento comienza desde el momento en que se inicia y se ejecuta hasta que se completa. Si se puede acelerar un procedimiento por un costo adicional, se elige el procedimiento legal más rápido. Se supone que el exportador no pierde el tiempo y se compromete a completar cada procedimiento restante sin demora. Los procedimientos que se pueden completar en paralelo se miden como simultáneos. El tiempo de espera entre los procedimientos, por ejemplo, durante la descarga de la carga, se incluye en la medida.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Tiempo para importar (días) - IC.IMP.DURS. Es el tiempo necesario para cumplir con todos los procedimientos requeridos para importar bienes, y se registra en días naturales. El cálculo del tiempo para un procedimiento comienza desde el momento en que se inicia y se ejecuta hasta que se completa. Si se puede acelerar un procedimiento por un costo adicional, se elige el procedimiento legal más rápido. Se supone que el importador no pierde el tiempo y se compromete a completar cada procedimiento restante sin demora. Los procedimientos que se pueden completar en paralelo se miden como simultáneos. El tiempo de espera entre los procedimientos, por ejemplo, durante la descarga de la carga, se incluye en la medida.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para el proceso de formación del set de datos, se consideró la generación de dimensiones de información relacionadas a país-continente, cualidad marítima y georreferenciación de los países (<a href="#g1">Gráfico 1</a>). Se recurre a herramientas de inteligencia de negocios como <i>Power BI </i>para realizar cálculos auxiliares y sobre todo para la visualización de los datos y presentación de los resultados del estudio.</font></p>     <p align="center"><a name="g1"></a><img src="/img/revistas/rlde/n32/a05_grafico_01.gif" width="529" height="359"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Es importante acudir al cálculo de las medidas de tendencia central para un mejor entendimiento de la distribución de los datos de las variables de estudio. Una comparación del promedio de los costos de exportación entre los países con salida al mar y los LLDC de cinco continentes entre dos periodos 2005 y 2014 permite observar que la relación entre los promedios de los costos de exportación en Asia y África supera el 200% entre los países con salida marítima y los LLDC. Esta diferencia no es tan evidente para los países de América, y en el caso de los países europeos es prácticamente inexistente (<a href="#c2">Cuadro 2</a>).</font></p>     <p align="center"><a name="c2"></a><img src="/img/revistas/rlde/n32/a05_cuadro_02.gif" width="529" height="440"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La relación porcentual de las diferencias de las medias entre los LLDC respecto a los países con salida marítima brinda un panorama altamente diferenciado en Asia, seguido por África, y mucho menos diferenciado en América. Sin embargo, en Europa esta diferencia es prácticamente nula para el periodo 2005 (<a href="#c3">Cuadro 3</a>).</font></p>     <p align="center"><a name="c3"></a><img src="/img/revistas/rlde/n32/a05_cuadro_03.gif" width="528" height="185"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Una década después, la diferencia de las medias entre los países con salida al mar y los LLDC muestra un escenario aún más polarizado, donde los países mediterráneos de Asia revelan costos de exportación e importación por contenedor superiores en 405% y 410%, respectivamente. Sin embargo, en América la diferencia de las medias de los costos de exportación disminuyó de 131% el año 2005 a 129% el año 2014. Los tres indicadores adicionales también mostraron un incremento no tan significativo como el reflejado por los países asiáticos y africanos (<a href="#c4">Cuadro 4</a>).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los incrementos en la diferencia de las medias de los indicadores en el año 2014 en Europa también sufrieron un incremento, pero no es significativo, indicando que los países mediterráneos tienen costos y tiempos de exportación similares a los países que no son mediterráneos.</font></p>     <p align="center"><a name="c4"></a><img src="/img/revistas/rlde/n32/a05_cuadro_04.gif" width="535" height="295"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Europa también mostró incrementos en la diferencia de las medias para la gestión 2014, <b>aunque </b>no tan significativos como en el resto de continentes, demostrando que los países mediterráneos de esta región tienen costos y tiempos de exportación similares a los países no mediterráneos. También se percibe que los países LLDC del continente europeo tienen condiciones similares, en costos y tiempos de exportación, a los países no mediterráneos. En América, estas diferencias son porcentualmente más grandes que en Europa, pero los países africanos y asiáticos muestran diferencias significativas respecto a estas variables (<a href="#c5">Cuadro 5</a>).</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Un indicador importante para evaluar la homogeneidad y heterogeneidad de los datos es el coeficiente de variación (CV). Los cálculos para esta medida de tendencia central se entienden bajo los siguientes criterios:</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Si el CV es mayor a 25%, son datos heterogéneos o dispersos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Si el CV es menor a 25%, son datos homogéneos.</font></p>     <p align="center"><a name="c5"></a><img src="/img/revistas/rlde/n32/a05_cuadro_05.gif" width="532" height="446"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En América y Europa los países mediterráneos presentan cifras mucho más homogéneas. Esto quiere decir que los datos están mucho más agrupados respecto a la media. En cambio, en el resto, se evidencia mayor dispersión debido al CV mayor a 25% (<a href="#c6">Cuadro 6</a>).</font></p>     <p align="center"><a name="c6"></a><img src="/img/revistas/rlde/n32/a05_cuadro_06.gif" width="539" height="370"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Finalmente, para visualizar de manera integral los indicadores seleccionados, en el <a href="#g2">Gráfico 2</a> se presentan mapas de calor de las variables de comercio internacional:</font></p>     <p align="center"><a name="g2"></a><img src="/img/revistas/rlde/n32/a05_grafico_02.gif" width="532" height="440"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>4.   Estrategia empírica</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>4.1. Machine Learning</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El aprendizaje automático, o <i>Machine Learning, </i>es un área de investigación en constante expansión. Derivada de la inteligencia artificial, puede ser aplicada en diversos campos, como son las ciencias computacionales, estadística y en el caso de este trabajo de investigación, con la economía a través del comercio exterior. Como definición, el aprendizaje automático, mediante un proceso de inducción del conocimiento, busca generalizar comportamientos y reconocer patrones a partir de los datos. Los diferentes algoritmos de aprendizaje automático, de acuerdo a la salida o resultado al que llegan los mismos, son agrupados en:</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Aprendizaje supervisado. Pretende determinar una función que puede mapear una entrada de datos a una salida basada en ejemplos anteriores.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Aprendizaje no supervisado. Se tienen conjuntos de datos de entrada y se busca establecer patrones para realizar el etiquetado de los nuevos datos. Uno de los métodos más comunes es el análisis de conglomerados (<i>clustering</i>).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Aprendizaje semi-supervisado. Es una combinación de los dos algoritmos anteriores, teniendo en cuenta ejemplos clasificados y no clasificados.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Aprendizaje por refuerzo. Los algoritmos aprenden observando el mundo que les rodea y con un continuo flujo de información en las dos direcciones (del mundo a la máquina, y de la máquina al mundo), realizando un proceso de ensayo-error y reforzando aquellas acciones que reciben una respuesta positiva en el mundo.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Transducción. Similar al aprendizaje supervisado, pero su objetivo no es construir de forma explícita una función, sino únicamente tratar de predecir las categorías en las que caen los posteriores ejemplos, basándose en los ejemplos de entrada, sus respectivas categorías y los ejemplos nuevos al sistema. Es decir, estaría más cerca del concepto de aprendizaje supervisado dinámico.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">•&nbsp; Aprendizaje multitarea. Engloba todos aquellos métodos de aprendizaje que usan conocimiento previamente aprendido por el sistema, de cara a enfrentarse a problemas parecidos a los ya vistos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Tomando en cuenta el marco de la presente investigación nos enfocaremos en los algoritmos de clasificación no supervisados, ya que, a partir de datos e indicadores de un set de datos generado, se pretende lograr una agrupación (<i>clustering</i>).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>4.2. Agrupamiento <i>&quot;Clustering&quot;</i></b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El análisis por agrupamiento, a través de los algoritmos, pretende realizar la clasificación de observaciones en subgrupos <i>-clusters- </i>para que las observaciones en cada grupo se asemejen entre sí según ciertos criterios. Teóricamente, los puntos de datos que están en el mismo grupo deben tener propiedades y/o características similares, mientras que los puntos de datos en diferentes grupos deben tener propiedades y/o características muy diferentes. La agrupación</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">es un método de aprendizaje no supervisado y es una técnica común para el análisis estadístico de datos que se utiliza en muchos campos.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Dentro de los algoritmos de clasificación no supervisados tenemos al <i>K-means </i>y al <i>K-medoids, </i>ambos algoritmos de partición cuyos datos de ingreso (observaciones) pueden ser vectores reales d-dimensionales.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>4.2.1.  <i>K-means</i></b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Uno de los algoritmos más utilizados para realizar agrupamientos es el <i>K-means, </i>o, en su traducción al español, K-medias. MacQueen (1967) indica que este algoritmo tiene el propósito central de particionar un conjunto de observaciones (n) en k agrupaciones, donde cada observación es asignada a un grupo cuyo valor medio es más cercano a un centroide.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Dado un conjunto de observaciones:</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_01.gif" width="517" height="32"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">donde cada observación es un vector real de d dimensiones, k-medias construye una partición de las observaciones en k conjuntos donde (k </font><font size="2">&le;</font><font face="Verdana, Arial, Helvetica, sans-serif" size="2"> n), a fin de minimizarla suma de los cuadrados dentro de cada grupo (WCSS):</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_02.gif" width="514" height="57"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Donde <i>&#956;<sub>i</sub> </i>es la media de los puntos en <i>S<sub>i</sub> </i>Esto es equivalente a minimizar las desviaciones cuadradas por pares de puntos en el mismo <i>cluster:</i></font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_03.gif" width="516" height="51"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La equivalencia se puede deducir de la identidad:</font></p>     ]]></body>
<body><![CDATA[<p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_04.gif" width="518" height="44"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Debido a que la varianza total es constante, esto también es equivalente a maximizar el BCSS, que se desprende fácilmente de la ley de la varianza total.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>a) Interacción del algoritmo</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El algoritmo se divide en cuatro pasos al momento de su ejecución; el primer paso se enfoca en realizar las asignaciones de las observaciones a los grupos y el segundo al cálculo de los nuevos centroides.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso1</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Selección arbitraria de los k objetos que serán los centroides iniciales.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso 2</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Asignaciones. Se asigna a cada observación con el centroide más cercano, con base en el valor medio de las observaciones.</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_05.gif" width="517" height="40"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso 3</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Actualización. Se recalculan los centros de los subgrupos y se actualiza la media.</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_06.gif" width="515" height="57"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso 4</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Se iteran los pasos 1 y 2, hasta que el algoritmo llegue a una convergencia, que se da cuando las asignaciones generadas ya no cambian.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>b) K-medoids</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los algoritmos basados en el método de <i>K-medoids </i>tienen el propósito de dividir un conjunto de observaciones en grupos, teniendo como principal diferencia con el algoritmo <i>K-means </i>la utilización de los datos que forman parte del conjunto de datos a ser analizados como representantes de las agrupaciones, que son denominados <i>&quot;medoids&quot;. </i>Cada observación restante es agrupada con el <i>medoid </i>más cercano. Estos algoritmos tienen características más robustas ante el ruido que se puede dar en las observaciones, siendo uno de los más representativos el algoritmo Partición Alrededor de <i>Medoids </i>(PAM).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>4.2.2. Algoritmo PAM (<i>Partitioning Around Medoids</i>)</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Este algoritmo pretende determinar las k agrupaciones de las n observaciones, identificando los objetos representativos de cada agrupación. La identificación de los k <i>medoids </i>inicia con la selección arbitraria de k objetos representativos. Cada interacción del algoritmo busca mejorar la calidad del agrupamiento. El algoritmo cuenta con cinco pasos en su ejecución:</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso1</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Selección arbitraria de los <i>k-medoids </i>iniciales.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso 2</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Cálculo de TCij para todos los pares de objetos Oi, Oh donde Oi es el <i>medoid </i>actual y Oh no lo es.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso 3</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Seleccionar el par Oi, Oh que corresponda al mínimo Oi, Oh (TCih). Si el mínimo TCih es negativo, se intercambia Oi con Oh; y se vuelve al paso 2.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso 4</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Repetir los pasos 2 y 3 hasta que no se presenten cambios.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Paso 5</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Asignar cada objeto a su <i>medoid </i>más cercano. La convergencia del algoritmo se da cuando se obtiene el menor costo y las asignaciones a las agrupaciones no se modifican.</font></p>     <p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>5.   Aplicación y resultados</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.1.</b>&nbsp; <b>Datos y fuentes</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Una fuente de datos importante y pública, utilizada por los investigadores, es la del Banco Mundial, entidad que a través de la aplicación <i>DataBank</i><sup>4</sup> permite el acceso a 70 bases de datos. La base de datos seleccionada en este trabajo es la <i>World Development Indicators, </i>que comprende información de 264 países y con series temporales mayores a los 20 años.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.</b>&nbsp; <b>Metodología empleada</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La metodología empleada comprende la utilización del proceso de extracción de conocimiento, KDD<sup>5</sup>, que para esta investigación tiene como núcleo a la minería de datos mediante la metodología de agrupamiento o <i>Clustering </i>(<a href="#g3">Gráfico 3</a>).</font></p>     <p align="center"><a name="g3"></a><img src="/img/revistas/rlde/n32/a05_grafico_03.gif" width="666" height="284"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.1.</b>&nbsp; &nbsp;<b>Selección</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La serie temporal de los datos utilizados en este trabajo comprende un periodo de diez años (2004 a 2014) de 217 países, con indicadores relacionados al comercio y otros indicadores macroeconómicos. Sin embargo, ha sido necesaria la depuración, en el set de datos, de países que no tienen información o presentan muchos datos nulos, quedándonos con 188 países de cinco continentes.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.2.</b>&nbsp; &nbsp;<b>Procesamiento</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El cargado y procesamiento de los datos ha sido realizado con la herramienta <i>data integration</i><sup>6 </sup>de <i>Pentaho, </i>para lo cual se crearon varios procesos ETL para integrar los datos descargados de <i>DataBank </i>y almacenarlos en un solo repositorio de datos. Asimismo, se diseñó y generó una base de datos de países y continentes con dimensiones adicionales con las que no contaba el set de datos del Banco Mundial; una de las dimensiones adicionales e importantes es la relacionada con la mediterraneidad de los países.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.3.</b>&nbsp; &nbsp;<b>Transformación</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La transformación de los datos también fue realizada mediante procesos ETL, debido a que las bases de datos del Banco Mundial identifican los nombres de los países en inglés, y para hacer la integración con otras bases de datos se tuvo que generar enlaces a partir del código de tres caracteres que tienen los países. Asimismo, para facilitar la georreferenciación, la visualización de los países y las agrupaciones, se ha integrado información georreferenciada de los países que son objeto de estudio.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.4.</b>&nbsp; &nbsp;<b>Minería de datos</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Es importante, al momento de realizar un proceso de análisis y generación de conocimiento a través de la exploración de volúmenes grandes de información, contar con una herramienta que facilite el proceso de generación de conocimientos. En este sentido, un lenguaje de programación que tiene un entorno de fácil acceso y a su vez un enfoque de análisis estadístico, es el lenguaje R, que fue desarrollado inicialmente por Robert Gentleman y Ross Ihaka, del Departamento de Estadística de la Universidad de Auckland, en 1993. R brinda un entorno</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">colaborativo y abierto, por lo cual se cuenta con una amplia gama de herramientas estadísticas a través de librerías de acceso gratuito.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>a)</b>&nbsp;<b>Cálculo del error cuadrático en la formación del <i>cluster</i></b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Es necesario identificar el número de <i>clusters </i>a ser formados antes de ejecutar los algoritmos <i>K-means </i>y PAM, por lo que se apeló al cálculo del error cuadrático SSE de cada agrupación y su visualización, para determinar la cantidad de agrupaciones a ser generadas (<a href="#a1">Anexo 1</a>). Producto del cálculo realizado, se observa que el incremento menos significativo para determinar el número de agrupaciones se da entre 2 a 3 <i>clusters. </i>Las disminuciones siguientes son cada vez menores, por lo que se identifica que la formación óptima se da para la generación de dos agrupaciones.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>b)</b>&nbsp;<b>Aprendizaje no supervisado   <i>Clustering</i></b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>i. Algoritmo K-medoids, PAM (<i>Partitioning Around Medoids</i>)</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los <i>clusters </i>generados con el algoritmo PAM para la gestión 2005 agrupan a 111 países dentro del <i>cluster </i>1 y los restantes 62 países en el <i>cluster </i>2. Para la gestión 2014 se incrementa el número de países que integran el <i>cluster </i>1, llegando a 161, afectando de esta manera a la cantidad de países que integran el <i>cluster </i>2, que se reduce a 27 (<a href="#g4">Gráfico 4</a>).</font></p>     <p align="center"><a name="g4"></a><img src="/img/revistas/rlde/n32/a05_grafico_04.gif" width="444" height="213"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En una década, muchos países que fueron parte del <i>cluster </i>2, pasaron a integrar el <i>cluster </i>1. Este hecho será parte de un análisis posterior, debido a la importancia que suscita para el estudio.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>ii. Algoritmo <i>K-means</i></b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los resultados de la ejecución del algoritmo <i>K-means </i>para el periodo 2005-2014 generan una distribución de las observaciones representada en dos grupos de datos o <i>clusters. </i>Para el periodo 2005, el <i>cluster </i>2 se forma con 148 países, cantidad que se incrementa en la gestión 2014, llegando a 167 países. El <i>cluster </i>1 reduce su composición de 25 a 21 países (<a href="#g5">Gráfico 5</a>).</font></p>     <p align="center"><a name="g5"></a><img src="/img/revistas/rlde/n32/a05_grafico_05.gif" width="464" height="184"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En esta etapa, la composición de los <i>clusters </i>ya muestra una segmentación de países que debe ser evaluada para nutrir el análisis de este estudio.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.5. Evaluación de los algoritmos mediante <i>silhouette</i></b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los resultados del algoritmo PAM son evaluados en dos periodos, dando como producto un promedio de <i>silhouette </i>de 0.54 para la gestión 2005, siendo éste aceptable para el emparejamiento de las observaciones. Sin embargo, para el periodo 2014 el emparejamiento muestra un promedio que llega a 0.74, que denota un escenario mucho más favorable en la asignación de las observaciones a los <i>clusters </i>(<a href="#a2">Anexo 2</a>).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En la evaluación del algoritmo <i>K-means, </i>el promedio <i>silhouette </i>para la gestión 2005 es de 0.60, por lo que se puede decir que la solución de los <i>clusters </i>de emparejamiento de cada observación es adecuada. Los <i>clusters </i>formados para la gestión 2014 tienen un promedio más alto, llegando a 0.77, por lo que se puede concluir que el emparejamiento es mejor que el del primer periodo (<a href="#a2">Anexo 2</a>).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.6. Resultados</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Se han seleccionado cuatro variables de 188 países por un periodo de diez años; mediante el cálculo del error cuadrático en la formación de <i>clusters, </i>se ha identificado que el óptimo se da para la generación de dos agrupaciones (<a href="#a1">Anexo 1</a>). Los <i>clusters </i>formados mediante el algoritmo <i>K-means </i>separan en el año 2014 a 167 países en el <i>cluster </i>1 como los países con costos más bajos y tiempos más cortos de exportación e importación, y agrupa en el <i>cluster </i>2 a 21 países cuyos tiempos y costos de exportación e importación son más altos.</font></p>     <p align="center"><a name="g6"></a><img src="/img/revistas/rlde/n32/a05_grafico_06.gif" width="534" height="342"></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los <i>clusters </i>formados mediante el algoritmo PAM separan en 2014 a 161 países en el <i>cluster </i>1, como los países con costos más bajos y tiempos más cortos de exportación e importación, y agrupan en el <i>cluster </i>2 a 27 países cuyos tiempos y costos de exportación e importación son más altos.</font></p>     <p align="center"><a name="g7"></a><img src="/img/revistas/rlde/n32/a05_grafico_07.gif" width="535" height="349"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En un periodo de diez años, según los resultados del algoritmo PAM, algunos países que formaron parte del <i>cluster </i>2 (países con tiempos y costos más altos de exportación e importación) en el año 2005, como Colombia, Bolivia, Argentina y Paraguay, dejaron de ser asignados a esta agrupación y se trasladaron al <i>cluster </i>1. En el caso de Bolivia, durante el periodo 2005-2014 mejoraron sus indicadores en tiempos de exportación, pasando de 24 a 19 días. Un avance aún más importante se manifiesta en los tiempos de importación, pasando de 36 a 23 días, mostrando una reducción de 13 días en un periodo de 10 años.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Durante el periodo de estudio, también se han encontrado disminuciones en los costos de exportación e importación, pasando de US$ 1440 a 1425 en la exportación de un contenedor, y para la importación de US$ 1747 a 1452, durante el periodo 2005-2014. Las mejoras en estos indicadores han provocado que Bolivia pase del <i>cluster </i>2 durante las gestiones 2005 y 2006, al <i>cluster </i>1 de la gestión 2007 en adelante.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los mapas de <i>clusters </i>(<a href="#g6">Gráficos 6</a> y <a href="#g7">7</a>) sugieren que existirían barreras más fuertes que el enclaustramiento marítimo, dado que, en algunos casos, países que sí tienen salida al mar presentan características en comercio internacional similares a los países mediterráneos,</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">o incluso menos favorables que este último grupo. Así lo evidencia la transición de <i>clusters, </i>comparandolos años 2005 y 2014. Tales el caso de Canadá, Colombia, Argentina y algunos países de Europa, los cuales en 2005 fueron clasificados por el algoritmo PAM en el <i>cluster </i>donde radicaban la mayoría de los países mediterráneos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">También se encuentra que existen países sin litoral que han sido capaces de aliviar los efectos negativos de la condición de mediterraneidad; como son los casos de Bolivia y Paraguay en Latinoamérica. Estos países, hasta el año 2006, pertenecían al <i>cluster </i>de países clasificados como mediterráneos. A partir de la gestión 2007, los algoritmos sugieren que Bolivia, particularmente, habría acortado las brechas en las variables de comercio internacional de mejor manera que la mayoría de los países mediterráneos. También resulta interesante la incorporación de Venezuela, mediante el algoritmo <i>K-means </i>(<a href="#g7">Gráfico 7</a>), al <i>cluster </i>de países mediterráneos en 2014; sugiriendo que la situación económica actual que se vive en ese país habría reducido las ventajas con las que contaba en materia de costos y tiempos en el comercio exterior.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Estos resultados son coherentes con las relaciones de variables de comercio propuestas por el modelo de gravedad de comercio internacional. Encuadrado dentro de la economía internacional, el modelo establece que el comercio entre dos países (o conjuntos de países, para efectos del documento) es proporcional al tamaño económico de ambos, medido por el PIB e inversamente proporcional a la distancia que existe entre ambos. Matemáticamente, se expresa de la siguiente forma:</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_07.gif" width="516" height="56"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Donde <i>F<sub>ij</sub> </i>representa el flujo comercial entre el país <i>&quot;i&quot; </i>y el país <i>&quot;j”; G </i>es una constante; <i>D </i>es la distancia entre los dos países; y <i>M</i> representa el tamaño de la economía de los países. En esta línea, siguiendo a Raballand (2003), el modelo de gravedad puede extenderse de la siguiente forma:</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_08.gif" width="517" height="31"></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Donde <b><i>PIB </i></b>es el Producto Interno Bruto del país i; <b><i>Instit<sub>i</sub> </i></b>es el desarrollo institucional; <b><i>Acceso<sub>i</sub> </i></b>representa la menor distancia entre el país i y un mercado mundial mayor; <b><i>Medit<sub>i</sub> </i></b>identifica la condición de mediterraneidad; <b><i>Infra<sub>i</sub> </i></b>es la calidad de infraestructura vial; y <b><i>Tarifa<sub>i</sub> </i></b>es una medida del costo de exportaciones e importaciones.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este sentido, la clasificación de Bolivia y Paraguay como países no mediterráneos, además de ser explicada por los costos del comercio internacional, podría haberse suscitado por la mejora en términos económicos de estos países. Bolivia ha tenido tasas de crecimiento del PIB por encima del promedio regional, principalmente por su fuerte componente de demanda interna e inversión en infraestructura; Paraguay, por su parte, es una de las economías emergentes que también ha mostrado un notable crecimiento, principalmente por la inversión extranjera que atrae, lo cual es resultado de la mejora de su institucionalidad. El caso de Venezuela es particular y atípico para la muestra, por lo que la recesión que enfrenta en este periodo ha influido notablemente en su desempeño en comercio internacional, a tal punto que ha mostrado características de enclaustrado.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>5.2.7. Análisis discriminante</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El análisis discriminante es una técnica estadística multivariante cuya finalidad es describir las diferencias significativas (si existen) entre g grupos de objetos (g &gt; 1) sobre los que se observan p variables (variables discriminantes). Más concretamente, se comparan y describen las medias de las p variables clasificadoras a través de los g grupos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En caso de que estas diferencias existan, se intentará explicar en qué sentido se dan, y proporcionar procedimientos de asignación sistemática de nuevas observaciones con grupo desconocido a uno de los grupos analizados, utilizando para ello sus valores en las p variables clasificadoras (éstos sí son conocidos).</font></p>     <p align="center"><a name="c7"></a><img src="/img/revistas/rlde/n32/a05_cuadro_07.gif" width="532" height="199"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La exactitud, o <i>&quot;accuracy&quot; </i>en inglés, permite calcular la relación de aciertos respecto al total de observaciones realizadas, siendo para el caso más óptimo el valor 1 (100%) o en el otro extremo 0. Para el algoritmo PAM, los niveles de exactitud al momento de comparar los resultados de los <i>clusters </i>generados con la realidad de los países mediterráneos, muestran para los años 2005 y 2014 un porcentaje de 74.57% y 89.36%, respectivamente (<a href="#c7">Cuadro 7</a>).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para el caso del algoritmo <i>K-means </i>(<a href="#c8">Cuadro 8</a>), los porcentajes de exactitud en la formación de <i>clusters </i>relacionados a los países mediterráneos y no mediterráneos, llegan a un 89.02% en 2005 y 87.23% en 2014. Los resultados de la evaluación discriminante de ambos algoritmos permiten apreciar que la formación de los <i>clusters </i>a partir de los datos de costos y tiempos de exportación, tiene un alto porcentaje de exactitud, llegando a aproximadamente a un 89% de efectividad en el caso de PAM para la gestión 2014 y <i>K-means </i>para la gestión 2005.</font></p>     <p align="center"><a name="c8"></a><img src="/img/revistas/rlde/n32/a05_cuadro_08.gif" width="533" height="213"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>6.   Conclusiones</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los países mediterráneos enfrentan diferentes restricciones económicas identificadas en la literatura, debido principalmente a las grandes distancias que tienen para transar en los grandes mercados, la dependencia en la política exterior de los países vecinos con salida al mar y los altos costos del comercio internacional. En el modelo propuesto de <i>clustering </i>de las variables costo y tiempo para la exportación e importación mediante los algoritmos <i>K-means </i>y PAM, se explora la dinámica de los países sin litoral para evidenciar si efectivamente la posición mediterránea condiciona a estos países a enfrentar permanentemente brechas significativas en los costos y tiempos para el comercio internacional.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Con ambos algoritmos se ha llegado a determinar la formación óptima de dos <i>clusters, </i>con información de 188 países; posteriormente, mediante pruebas de silueta, se ha comprobado esta optimización. El primer <i>cluster </i>agrupa a una gran cantidad de países no mediterráneos, entre desarrollados y en desarrollo; mientras que el segundo <i>cluster </i>agrupa a la mayoría de economías mediterráneas en desarrollo (LLDC).</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las soluciones de los algoritmos han sido probadas y evaluadas en su consistencia. Para ello, se recurrió al análisis discriminante, el cual indica, mediante la tasa de exactitud, precisión y especificidad, que es significativo no rechazar la hipótesis de que los países identificados por los <i>clusters </i>1 y 2 pertenecen en gran medida a tales grupos; en otras palabras, la &quot;clusterización&quot; fue eficiente. Es preciso enfatizar que, para este proceso, no se introdujo al modelo información <i>a priori </i>sobre si cada país es mediterráneo o no.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">De esta forma, los resultados sugieren que existirían barreras más fuertes que el enclaustramiento marítimo, dado que, en algunos casos, países que sí tienen salida al mar presentan características similares a los países mediterráneos, o incluso menos favorables que este último grupo. Así lo evidencia la transición de <i>clusters </i>comparando los años 2005 y 2014. Tal es el caso de Canadá, Colombia, Argentina y algunos países de Europa, los cuales en 2005 fueron clasificados por el algoritmo PAM en el <i>cluster </i>donde radicaban la mayoría de los países mediterráneos.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por otra parte, se evidencia que existen países sin litoral que han sido capaces de aliviar los efectos negativos de la condición de mediterraneidad; como son los casos de Bolivia y Paraguay</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">en Latinoamérica. Estos países pertenecían hasta el año 2006 al <i>cluster </i>de países clasificados como mediterráneos. A partir de 2007, los algoritmos sugieren que Bolivia, particularmente, habría acortado las brechas en las variables de comercio internacional de mejor manera que la mayoría de los países mediterráneos. También es notable la incorporación de Venezuela, mediante el algoritmo <i>K-means, </i>al <i>cluster </i>de países mediterráneos en 2014; sugiriendo que la situación económica actual que se vive en ese país, habría reducido las ventajas con las que contaba en materia de costos y tiempos en comercio exterior.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para Bolivia, esta reducción de brechas se explicaría por razones cuyo estudio puede dar continuidad a esta investigación. La estabilidad del tipo de cambio, el subsidio a los hidrocarburos, la mayor apertura comercial por los acuerdos de integración comercial y el impulso a la demanda interna, incluida la inversión en infraestructura que se dio a partir de 2007, habrían repercutido en mejoras en costos y tiempos para la exportación e importación de bienes y servicios. De hecho, en el ámbito mundial, en 2004, de 188 países, Bolivia se situaba en el puesto 130 respecto al indicador de costos de exportación (un mayor ranking equivale a menores costos), mientras que en 2014 ascendió al puesto 124. En el ámbito regional, respecto al mismo indicador, de 34 países de América, Bolivia habría escalado del puesto 29 al 26 en 2014.</font></p>     <p align="justify">&nbsp;</p>     <p><b><font size="3" face="Verdana, Arial, Helvetica, sans-serif">Notas</font></b></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">* Contacto: <a href="mailto:heynzg@gmail.com">heynzg@gmail.com</a></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">  ** Contacto: <a href="mailto:uticona@gmail.com">uticona@gmail.com</a></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">1 <i>Landlocked developing countries, </i>en ingl&eacute;s, es su denominaci&oacute;n conocida en la literatura.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">2    United Nations of the High Representative for the Least Developed Countries, Landlocked Developing Countries and Small Island Developing States.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">3 Se hacen varias suposiciones para el negocio encuestado: tiene 60 o m&aacute;s empleados; est&aacute; ubicado en la ciudad m&aacute;s poblada del pa&iacute;s; es una compa&ntilde;&iacute;a privada de responsabilidad limitada; no opera dentro de una zona de procesamiento de exportaciones o un pol&iacute;gono industrial con privilegios especiales de exportaci&oacute;n o importaci&oacute;n; es de propiedad nacional sin propiedad extranjera; y exporta m&aacute;s del 10% de sus ventas. Tambi&eacute;n se realizan suposiciones sobre los bienes comercializados: el producto comercializado viaja en una carga seca, son cargas de contenedores completos de 20 pies. Finalmente, las suposiciones sobre el producto: no es peligroso ni incluye art&iacute;culos militares; no requiere refrigeraci&oacute;n ni ning&uacute;n otro entorno especial; no requiere ninguna norma de seguridad ambiental o fitosanitaria especial que no sea una norma internacional aceptada.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">4 <a href="http://databank.worldbank.org/data/reports.aspx?source=world-development-indicators" target="_blank">http://databank.worldbank.org/data/reports.aspx?source=world-development-indicators</a></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">5 <i>Knowledge Discovery in Databases </i>(KDD), que se refiere al proceso no trivial de descubrir conocimiento informaci&oacute;n potencialmente &uacute;til dentro de los datos contenidos en alg&uacute;n repositorio de informaci&oacute;n.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">6 <a href="https://www.hitachivantara.com/en-us/products/big-data-integration-analytics/pentaho-data-integration.html" target="_blank">https://www.hitachivantara.com/en-us/products/big-data-integration-analytics/pentaho-data-integration.html</a></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">7    La silueta se puede calcular con cualquier medida de distancia, como la distancia euclidiana o la distancia de Manhattan.</font></p>     <p align="justify">&nbsp;</p>     <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i>Fecha de recepción: 3 de abril de 2019</i></font>    <br> <font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i>Fecha de aceptación: 16 de septiembre de 2019    ]]></body>
<body><![CDATA[<br> </i></font><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i>Manejado por ABCE/SEBOL/IISEC</i></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Referencias</b></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">1. Arvis,  J. F., Marteau, J. F. y Raballand, G. (2010). &ldquo;The cost of being landlocked: logistics costs and  supply chain reliability&rdquo;. <i>The  World Bank</i>.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">2. De, Prabir. (2006). &ldquo;Trade, infrastructure and  transaction costs: the imperatives for Asian economic cooperation&rdquo;. <i>Journal of Economic  Integration</i>, 21(4),  708-735.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">3. Driffield, N. y Jones, C. (2013). &ldquo;Impact of FDI,  ODA and migrant remittances on economic growth in developing countries: A  systems approach&rdquo;. <i>The  European Journal of Development Research</i>, 25(2), 173-196.</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">4. Faster, D. S. (2014). <i>Pentaho Data Integration</i>.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=537026&pid=S2074-4706201900020000500004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">5. Faye, M. L., McArthur, J. W., Sachs, J. D. y Snow,  T. (2004). &ldquo;The challenges facing landlocked developing countries&rdquo;. <i>Journal of Human  Development</i>, <i>5</i>(1), 31-68.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">6. Fayyad, U., Piatetsky-Shapiro, G. y Smyth, P.  (1996). &ldquo;The KDD process for extracting useful knowledge from volumes of data&rdquo;. <i>Communications  of the ACM</i>, 39(11),  27-34.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">7. Grigoriou, C. (2007). &ldquo;Landlockedness,  infrastructure and trade: new estimates for central Asian countries&rdquo;. <i>The World Bank,  Development, Research Group.</i></font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">8. Kaufman, L. y Rousseeuw, P. J. (2009). <i>Finding groups in data: an  introduction to cluster analysis </i>(Vol. 344). Nueva York: John Wiley &amp; Sons.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">9.  Lahiri, B. y Masjidi, F. K. (2012). &ldquo;Landlocked countries: A way to integrate with coastal  economies&rdquo;. <i>Journal  of Economic Integration</i>, 27(4),  505-519.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">10.  Leiva-Valdebenito, S. A. y Torres-Avil&eacute;s, F. J. (2010). &ldquo;Una revisi&oacute;n de los  algoritmos de partici&oacute;n m&aacute;s comunes en el an&aacute;lisis de conglomerados: un estudio  comparativo&rdquo;. <i>Revista Colombiana de  Estad&iacute;stica</i>, 33(2), 321-339.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">11.  MacKellar, L., W&ouml;rg&ouml;tter, A. y W&ouml;rz, J. (2000). &ldquo;Economic development problems of landlocked countries&rdquo;. <i>Transition  Economic Series</i>, N&ordm; 14.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">12. MacQueen, J. (1967). &ldquo;Some methods for  classification and analysis of multivariate observations&rdquo;. <i>Proceedings of the fifth  Berkeley symposium on mathematical statistics and probability </i>1(14), 281-297.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">13.  Mendoza, R., C&eacute;spedes, A., Ticona, U. <i>et al. </i>(2018).  &ldquo;Restricciones al comercio y al desarrollo econ&oacute;mico en pa&iacute;ses mediterr&aacute;neos:  Impacto en el crecimiento, la pobreza y el comercio, el caso de Bolivia&rdquo;. <i>Revista de An&aacute;lisis del BCB</i>,  28(1), 231-301.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">14. Paudel, R. C. (2014). &ldquo;Economic Growth in  Developing Countries: Is Landlockedness Destiny?&rdquo; <i>Economic Papers: A journal  of applied economics and policy</i>, 33(4), 339-361.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">15.  P&eacute;rez-L&oacute;pez, C. (2008). <i>Miner&iacute;a de datos: t&eacute;cnicas y  herramientas</i>. Madrid, Espa&ntilde;a: Thomson Ediciones.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">16.  Radelet, S. y Sachs, J. D. (1998). &ldquo;Shipping costs, manufactured exports, and economic growth&rdquo;. <i>Annual  Meeting of the American Economics Association, </i>Chicago.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">17. Raballand, G. (2003). &ldquo;Determinants of the  negative impact of being landlocked on trade: an empirical investigation  through the Central Asian case&rdquo;. <i>Comparative Economic Studies</i>, 45(4), 520-536.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">18. Shrestha, H. y Heffley, D. (2003). &ldquo;Regional  Integration and Industrial Location in a Landlocked Spatial Economy&rdquo;. Economics  Working Papers, University of Connecticut.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">19. Smith, A. (1796) <i>An Inquiry into the Nature  and Causes of the Wealth of Nations</i>, 2 vols. Editado por Edwin Caanan. University of  Chicago, Chicago, IL.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">20. UN-OHRLLS. (2013). <i>The development economics  of landlockedness: understanding the development costs of being landlocked</i>. Nueva York: United Nations.</font></p>     <p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">21. Wagstaff, K., Cardie, C., Rogers, S. y Schr&ouml;dl, S.  (2001, June). &ldquo;Constrained k-means clustering with background knowledge&rdquo;. <i>ICML</i>, (1), 577-584.</font></p>     <!-- ref --><p align="justify"><font size="2" face="Verdana, Arial, Helvetica, sans-serif">22. Wamboye, E. (2012). <i>External debt, trade and  FDI on economic growth of least developed countries</i>. Pennsylvania State University. </font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=537044&pid=S2074-4706201900020000500022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify">&nbsp;</p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Anexos</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b><a name="a1"></a>Anexo 1</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Optimización de <i>clusters</i></font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_z_grafico_a1.gif" width="537" height="308"></p>     <p align="center"></p>     ]]></body>
<body><![CDATA[<p align="center"><img src="/img/revistas/rlde/n32/a05_z_grafico_a2.gif" width="536" height="296"></p>     <p align="center"></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_z_grafico_a3.gif" width="529" height="298"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b><a name="a2"></a>Anexo 2</b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Evaluación de los algoritmos mediante <i>silhouette</i></b></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para la evaluación se recurrió a un método de interpretación y validación de consistencia dentro de grupos de datos, denominado &quot;silueta&quot;. La técnica proporciona una representación gráfica sucinta de la exactitud en la que cada objeto se encuentra dentro de su grupo.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El valor de silueta es una medida de cuán similar es un objeto a su propio <i>cluster </i>(cohesión) en comparación con otros <i>clusters </i>(separación). La silueta varía de -1 a +1, donde un valor alto indica que el objeto está bien adaptado a su propio <i>cluster </i>y está poco relacionado con los <i>clusters </i>vecinos. Si la mayoría de los objetos tienen un valor alto, entonces la configuración de agrupamiento es apropiada. Si muchos puntos tienen un valor bajo o negativo, entonces la configuración del <i>cluster </i>puede tener demasiados o muy pocos <i>clusters<sup>7</sup>.</i></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Supongamos que los datos se han agrupado a través de cualquier técnica, como <i>K-means, </i>en k <i>clusters. </i>Para cada dato i, permita que a (i) sea la distancia promedio entre i y todos los demás datos dentro del mismo <i>cluster. </i>Se puede interpretar a (i) como una medida de qué tan bien i está asignado a su <i>cluster </i>(cuanto menor es el valor, mejor es la asignación). Luego definimos la</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">disimilitud promedio (diferencia / varianza) del punto i a un <i>cluster </i>c como el promedio de la distancia desde i a todos los puntos en c.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Sea b (i) la distancia promedio más pequeña de i a todos los puntos en cualquier otro <i>cluster, </i>de los cuales i no es miembro. Se dice que el <i>cluster </i>con la menor diferencia promedio (diferencia/ varianza) es el &quot;<i>cluster </i>vecino&quot; de i porque es el siguiente <i>cluster </i>que mejor se ajusta para el punto i. Ahora se define una silueta:</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_b1.gif" width="519" height="58"></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La ecuación (7) puede también escribirse como:</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_b2.gif" width="517" height="174"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">De la definición anterior en (8), es evidente que:</font></p>     <p align="center"><img src="/img/revistas/rlde/n32/a05_ecuacion_b3.gif" width="514" height="27"></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Además, se debe tener en cuenta que la puntuación es 0 para <i>clusters </i>con tamaño = 1. Esta restricción se agrega para evitar que la cantidad de <i>clusters </i>aumente significativamente.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para s(i) estar cerca de 1, se requiere a(i)&lt;b (i). Como a (i) es una medida de cuán diferente es i para su propio <i>cluster, </i>un valor pequeño significa que está bien emparejado. Además, un b(i) grande implica que i está mal adaptado a su <i>cluster </i>vecino. Por lo tanto, un s(i) cercano</font> <font face="Verdana, Arial, Helvetica, sans-serif" size="2">a uno significa que los datos están agrupados apropiadamente. Si s(i) está cerca del negativo, entonces, con la misma lógica, se ve que i sería más apropiado si estuviera agrupado en su cluster vecino. Un  s(i) cerca de cero significa que el dato está en el borde de dos <i>clusters </i>naturales.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">El s(i) promedio de todos los puntos de un <i>cluster </i>es una medida de cuán estrechamente agrupados están todos los puntos del <i>cluster. </i>Por lo tanto, el s(i) promedio sobre todos los datos es una medida de qué tan apropiadamente se han agrupado los datos. Si hay demasiados o muy pocos conglomerados, como puede ocurrir cuando se utiliza una mala elección de k en el algoritmo de agrupación, algunos de los <i>clusters </i>típicamente mostrarán siluetas mucho más estrechas que el descanso. Por lo tanto, los gráficos de silueta y los promedios se pueden usar para determinar el número natural de conglomerados dentro de un conjunto de datos. También se puede aumentar la probabilidad de que la silueta se maximice en el número correcto de <i>clusters </i>al volver a escalar los datos utilizando pesos de entidades que son específicos del <i>cluster.</i></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Una forma de evaluar los datos de salida del algoritmo es generando un gráfico de silueta de <i>K-means </i>y de PAM. Este cálculo es realizado para cada dato, de manera de visualizar qué tan bien se adapta al <i>cluster </i>al que fue asignado. Esto se hace comparando la cercanía de la observación con las otras observaciones dentro del mismo <i>cluster.</i></font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los valores cerca de 1 indican que el dato está bien ubicado en su <i>cluster, </i>mientras que los valores cercanos a 0 indican que es probable que el dato realmente deba pertenecer a otro <i>cluster. </i>Dentro de cada <i>cluster, </i>el valor se muestra de menor a mayor. En caso de que la mayoría de los valores estén cerca de 1, se concluye que el ajuste es bueno, pero si hay muchas observaciones cercanas a 0, es una indicación de la deficiencia del ajuste.</font></p>     <p align="justify"><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Las soluciones encontradas por los algoritmos <i>K-means </i>y PAM son evaluadas en dos momentos: la primera evaluación para el periodo 2005 y la otra para el periodo 2014, cuyas representaciones gráficas permiten observarlo siguiente (<a href="#gb1">Gráficos B1</a> y <a href="#gb2">B2</a>):</font></p>     ]]></body>
<body><![CDATA[<p align="center"><a name="gb1"></a><img src="/img/revistas/rlde/n32/a05_z_grafico_b1.gif" width="548" height="336"></p>     <p align="center">&nbsp;</p>     <p align="center"><a name="gb2"></a><img src="/img/revistas/rlde/n32/a05_z_grafico_b2.gif" width="545" height="339"></p>     <p align="center">&nbsp;</p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Arvis]]></surname>
<given-names><![CDATA[J. F.]]></given-names>
</name>
<name>
<surname><![CDATA[Marteau]]></surname>
<given-names><![CDATA[J. F.]]></given-names>
</name>
<name>
<surname><![CDATA[Raballand]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<source><![CDATA[The cost of being landlocked: logistics costs and supply chain reliability]]></source>
<year>2010</year>
<publisher-name><![CDATA[The World Bank]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[De]]></surname>
<given-names><![CDATA[Prabir]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Trade, infrastructure and transaction costs: the imperatives for Asian economic cooperation]]></article-title>
<source><![CDATA[Journal of Economic Integration]]></source>
<year>2006</year>
<volume>21</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>708-735</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Driffield]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
<name>
<surname><![CDATA[Jones]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Impact of FDI, ODA and migrant remittances on economic growth in developing countries: A systems approach]]></article-title>
<source><![CDATA[The European Journal of Development Research]]></source>
<year>2013</year>
<volume>25</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>173-196</page-range></nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Faster]]></surname>
<given-names><![CDATA[D. S.]]></given-names>
</name>
</person-group>
<source><![CDATA[Pentaho Data Integration]]></source>
<year>2014</year>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Faye]]></surname>
<given-names><![CDATA[M. L.]]></given-names>
</name>
<name>
<surname><![CDATA[McArthur]]></surname>
<given-names><![CDATA[J. W.]]></given-names>
</name>
<name>
<surname><![CDATA[Sachs]]></surname>
<given-names><![CDATA[J. D.]]></given-names>
</name>
<name>
<surname><![CDATA[Snow]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The challenges facing landlocked developing countries]]></article-title>
<source><![CDATA[Journal of Human Development]]></source>
<year>2004</year>
<volume>5</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>31-68</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fayyad]]></surname>
<given-names><![CDATA[U.]]></given-names>
</name>
<name>
<surname><![CDATA[Piatetsky-Shapiro]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Smyth]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The KDD process for extracting useful knowledge from volumes of data]]></article-title>
<source><![CDATA[Communications of the ACM]]></source>
<year>1996</year>
<volume>39</volume>
<numero>11</numero>
<issue>11</issue>
<page-range>27-34</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Grigoriou]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<source><![CDATA[Landlockedness, infrastructure and trade: new estimates for central Asian countries]]></source>
<year>2007</year>
<publisher-name><![CDATA[The World Bank, Development Research Group]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kaufman]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Rousseeuw]]></surname>
<given-names><![CDATA[P. J.]]></given-names>
</name>
</person-group>
<source><![CDATA[Finding groups in data: an introduction to cluster analysis]]></source>
<year>2009</year>
<publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley & Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lahiri]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
<name>
<surname><![CDATA[Masjidi]]></surname>
<given-names><![CDATA[F. K.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Landlocked countries: A way to integrate with coastal economies]]></article-title>
<source><![CDATA[Journal of Economic Integration]]></source>
<year>2012</year>
<volume>27</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>505-519</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Leiva-Valdebenito]]></surname>
<given-names><![CDATA[S. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Torres-Avilés]]></surname>
<given-names><![CDATA[F. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo]]></article-title>
<source><![CDATA[Revista Colombiana de Estadística]]></source>
<year>2010</year>
<volume>33</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>321-339</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MacKellar]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Wörgötter]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Wörz]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Economic development problems of landlocked countries]]></article-title>
<source><![CDATA[Transition Economic Series]]></source>
<year>2000</year>
<numero>14</numero>
<issue>14</issue>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[MacQueen]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Some methods for classification and analysis of multivariate observations]]></article-title>
<source><![CDATA[Proceedings of the fifth Berkeley symposium on mathematical statistics and probability]]></source>
<year>1967</year>
<volume>1</volume>
<numero>14</numero>
<issue>14</issue>
<page-range>281-297</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mendoza]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Céspedes]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Ticona]]></surname>
<given-names><![CDATA[U.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Restricciones al comercio y al desarrollo económico en países mediterráneos: Impacto en el crecimiento, la pobreza y el comercio, el caso de Bolivia]]></article-title>
<source><![CDATA[Revista de Análisis del BCB]]></source>
<year>2018</year>
<volume>28</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>231-301</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Paudel]]></surname>
<given-names><![CDATA[R. C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Economic Growth in Developing Countries: Is Landlockedness Destiny?]]></article-title>
<source><![CDATA[Economic Papers: A journal of applied economics and policy]]></source>
<year>2014</year>
<volume>33</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>339-361</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pérez-López]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<source><![CDATA[Minería de datos: técnicas y herramientas]]></source>
<year>2008</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Thomson Ediciones]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Radelet]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Sachs]]></surname>
<given-names><![CDATA[J. D.]]></given-names>
</name>
</person-group>
<source><![CDATA[Shipping costs, manufactured exports, and economic growth]]></source>
<year>1998</year>
<conf-name><![CDATA[ Annual Meeting of the American Economics Association]]></conf-name>
<conf-loc>Chicago </conf-loc>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Raballand]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Determinants of the negative impact of being landlocked on trade: an empirical investigation through the Central Asian case]]></article-title>
<source><![CDATA[Comparative Economic Studies]]></source>
<year>2003</year>
<volume>45</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>520-536</page-range></nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shrestha]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Heffley]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<source><![CDATA[Regional Integration and Industrial Location in a Landlocked Spatial Economy]]></source>
<year>2003</year>
<publisher-name><![CDATA[University of Connecticut]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Smith]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[An Inquiry into the Nature and Causes of the Wealth of Nations]]></source>
<year>1796</year>
<publisher-loc><![CDATA[Chicago^eIL IL]]></publisher-loc>
<publisher-name><![CDATA[University of Chicago]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="book">
<collab>UN-OHRLLS</collab>
<source><![CDATA[The development economics of landlockedness: understanding the development costs of being landlocked]]></source>
<year>2013</year>
<publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[United Nations]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wagstaff]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
<name>
<surname><![CDATA[Cardie]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[Rogers]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Schrödl]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Constrained k-means clustering with background knowledge]]></article-title>
<source><![CDATA[ICML]]></source>
<year>2001</year>
<month>, </month>
<day>Ju</day>
<numero>1</numero>
<issue>1</issue>
<page-range>577-584</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wamboye]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<source><![CDATA[External debt, trade and FDI on economic growth of least developed countries]]></source>
<year>2012</year>
<publisher-name><![CDATA[Pennsylvania State University]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
