MIME-Version: 1.0 Content-Type: multipart/related; boundary="----=_NextPart_01D90411.6650B260" Este documento es una página web de un solo archivo, también conocido como "archivo de almacenamiento web". Si está viendo este mensaje, su explorador o editor no admite archivos de almacenamiento web. Descargue un explorador que admita este tipo de archivos. ------=_NextPart_01D90411.6650B260 Content-Location: file:///C:/D23738F9/945-GALLEY.htm Content-Transfer-Encoding: quoted-printable Content-Type: text/html; charset="windows-1252"
https://doi.org/10.37815/rte.v34n3.945
Artículos originales
Movilidad humana hacia Ecuador, una visión desde el
análisis de datos<=
span
style=3D'font-size:10.0pt;mso-ansi-language:ES-EC'>
Human mob=
ility to
Ecuador, a vision from data analysis
Paúl Córdova1 <=
/span>https://orcid.org/0000-0=
002-5686-7370,
Andrés Tobar2 =
https://orcid.org/0000-0=
003-4822-0515
1
2
Enviado: 2022/06/18
Aceptado: 2022/09/16
Publicado:
2022/11/30
Resumen
La movilidad humana hacia Ecuador ha sido una
temática en creciente difusión en la coyuntura actual, por las condiciones =
post
pandemia que atraviesa el país. En tal motivo, este artículo examina la
información concerniente a los ciudadanos que han recibido su visado por pa=
rte
del Ministerio de Relaciones Exteriores y Movilidad Humana. Con base en los
datos disponibles, el análisis se ha enfocado en los solicitantes que se
encuentran en territorio nacional provenientes de Colombia y Venezuela. Se =
han
empleado dos modelos de aprendizaje automático con la finalidad de destacar=
y
validar una posible relación entre las características socioeconómicas de l=
os
ciudadanos con respeto a su categoría migratoria; identificando si variables
como la edad, género, estado civil y nacionalidad pueden influir en la
solicitud de visado respecto al tipo de residencia. Según los hallazgos
encontrados, ciudadanos colombianos solteros independiente de su edad optan=
por
una residencia temporal; mientras que, para el caso de los divorciados, por=
una
residencia permanente. Para los ciudadanos venezolanos solteros con una edad
menor a 23 años la mayoría posee una residencia permanente; no obstante,
aquellos con una edad mayor acceden a una residencia temporal.
=
Pa=
labras
clave: =
Árbol d=
e decisión,
movilidad humana, análisis de datos, regresión logística.
Sumario: Introducción, Materiales y Métodos, Resultados y Discusión. Como citar: Córdova, P. & Tobar=
, A.
(2022). Movilidad humana hacia Ecuador, una visión desde el análisis d=
e datos.
Revista Tecnológica - Espol, 34(3), 31-45. http://www.rte.espol.e=
du.ec/index.php/tecnologica/article/view/945
Abstract
Human mobility to Ecuador has been a topic of
increasing diffusion in the current situation, due to the post-pandemic
conditions that the country is going through. For this reason, this article
examines the information concerning the citizens who have received a visa f=
rom
the Ministerio de Relaciones Exteriores y Movilidad Humana. Based on the
available data, the analysis has focused on applicants from Colombia and
Venezuela. Two machine learning models have been used in order to highlight=
and
validate a possible relationship between the socioeconomic characteristics =
of
citizens with respect to their migratory category; identifying whether vari=
ables
such as age, gender, marital status, and nationality can influence the visa
application with respect to the type of residence. According to the finding=
s,
single Colombian citizens, regardless of their age, opt for temporary
residency, while divorced Colombians opt for permanent residency. For single
Venezuelan citizens under 23 years of age, the majority have permanent
residency; however, those older than 23 years of age opt for temporary
residency.
Keywords: Decision tree=
, human
mobility, data analysis, logistic regression.=
Introducción
La movilidad humana es una temática recurrente en las agendas de est=
ado
de los gobiernos a lo largo del mundo por concepto de fenómenos biológicos,
políticos y sociales. Una necesidad imperante de los países es poder trabaj=
ar
en conjunto para garantizar una movilidad digna para los ciudadanos y crear
ciudades inclusivas que pueda acoger a los migrantes del exterior.
En la actualidad, la Covid-19 ha demostrado la fragilidad del sistema
migratorio dado que las restricciones fronterizas y la reducción del acceso
mediante la imposición normativa, han generado afectaciones a los derechos =
de
los ciudadanos inmersos en los flujos migratorios.
En una investigación realizada por Nueva Sociedad (Liberona Concha, =
2020),
se identificaron que las políticas migratorias en los países de América Lat=
ina
se han encaminado a la restricción de la movilidad humana, provocando
desregularización y mayores afectaciones para los migrantes. Estos aspectos=
han
ocasionado la vulneración de derechos y afectaciones sociales para aquellos=
que
huyen de la violencia, estados fallidos o crisis económicas.
En Ecuador se han normado algunos requisitos para la obtención de la
visa de residencia temporal, entre los principales se encuentran: la
documentación oficial, pasaporte válido y vigente, certificado de anteceden=
tes
penales del país de origen, no ser considerado una amenaza para la seguridad
interna, acreditar los medios de vida lícitos para la subsistencia, pago de=
la
tarifa y presentación de la solicitud.
Históricamente en Ecuador ha existido una tendencia a que ciudadanos=
del
país vecino, Colombia, ingresen con intención de establecer sus vidas. A pa=
rtir
de una instigación nacional se afirma que, basado en los datos del censo de
2010, la mayoría de los inmigrantes dentro del país son colombianos,
comportamiento que se ha conservado con el tiempo (Loor Valeriano, 2012).
Por otra parte, las circunstancias que ha atravesado la República
Bolivariana de Venezuela han generado que su población migre en busca de as=
ilo
y con intenciones de mejorar su calidad de vida (Gandini, 2019). No obstant=
e,
según datos obtenidos por parte de Colectivo Geografía Crítica de Ecuador
respecto de la situación de inmigrantes en pandemia, se observa que el 86,7=
% de
los migrantes venezolanos no cuentan con afiliación a la seguridad social y=
el
89,9% no tiene seguro de salud privado (Proyecto Inmovilidad en las América=
s,
s.f.).
Durante esta investigación se busca describir las características de=
los
ciudadanos que han recibido un visado para su permanencia en Ecuador,
profundizando por medio del análisis de las condiciones socioeconómicas de =
los
migrantes y su categoría migratoria. A partir de los datos provistos por el
Registro de Movilidad Humana se pretende aplicar un enfoque de aprendizaje
supervisado (Yaser S. et al 2012), emplean=
do a
la categoría migratoria como variable dependiente, por medio del uso del
algoritmo de árbol de decisión (J. R. Quinlan, =
1996).
La correcta comprensión de los posibles patrones en las solicitudes =
de
visado permitirá conceptualizar formas para una adecuada inserción de los
flujos migratorios provenientes principalmente de Colombia y Venezuela.
Logrando, de esta manera, generar ideas para promover una inclusión social y
económica, prevenir y contrarrestar la discriminación, y gestionar una polí=
tica
de gobernanza inclusiva.
La sección metodológica de este estudio se estructuró en las siguien=
tes
secciones de acuerdo con el flujo de un proyecto de ciencia de datos. Se
comenzó por el análisis exploratorio para identificar las características de
las variables dentro del conjunto de conjunto de datos. Posterior se realiz=
ó la
preparación de los datos seleccionados mediante proceso de ingeniería de
variable con la finalidad de generar el conjunto de datos de entrada que se=
ría
empleado en el modelamiento. Finalmente, se ejecutó un algoritmo supervisado
para identificar las reglas de decisión que influenciaron el entrenamiento =
del
modelo estadístico.
Se optó por empelar el lenguaje de programación Python por su
versatilidad para ejecutar procesos de extracción, transformación y carga de
datos. Igualmente, por su amplia disponibilidad de librería para desarrollar
ciencia de datos e implementar modelos de aprendizaje automático.
C=
onjunto de
datos
Del portal de datos abiertos de las instituciones públicas de Ecuado=
r,
se recuperó el registro de movilidad humana (visado) provisto por el Minist=
erio
de Relaciones Exteriores y Movilidad Humana. Este archivo contiene informac=
ión
de las visas que han sido otorgadas a los ciudadanos de diferentes
nacionalidades en el ámbito nacional y en el exterior desde el mes de enero=
de
2021 hasta marzo de 2022. A continuación, se muestra el diccionario de datos
con las descripciones de los campos que componen la información de la movil=
idad
humana:
Tabla 1Tabla
2.
Descripció=
n de la
partición de datos
CONJUNTO =
DE
DATOS |
CANTIDAD<=
/span> |
RESIDENCIA
TEMPORAL |
RESIDENCIA
PERMANENTE |
Modelamiento |
27068 |
19324 |
7744 |
Validación |
4713 |
2955 |
1758 |
A partir de los datos de modelamiento se aplicó la técnica “One Hot Encoding” (M. K. =
Dahouda & I. Joe, 2021), que consiste en la creac=
ión de
una variable tipo dummy por cada una de las
categorías que posee la variable de origen. Adicionalmente para variables
binarias únicamente se consideró una de las dos particiones que se generan =
al
momento de ejecutar dicha técnica, esto es para el caso de las variables:
género, país de nacionalidad y categoría migratoria. La Tabla
3 contiene el n=
ombre
de las variables creadas a partir de la técnica mencionada.
Variables On=
e
Hot Encoding
NO. |
VARIABLE
CODIFICADA |
1 |
Género femenino |
2 |
Nacionalidad colombiana |
3 |
Estado civil casado |
4 |
Estado civil divorciado |
5 |
Estado civil no definido |
6 |
Estado civil soltero |
7 |
Estado civil unión de hecho |
8 |
Estado civil viudo |
9 |
Residente temporal |
La preparación de los datos o ingeniería de variables es un paso
esencial antes de la ejecución de los modelos de aprendizaje automático, co=
n la
finalidad de garantizar la correcta lectura de los datos por los algoritmos=
.
M=
odelos de
aprendizaje supervisado
Es trascendental comprender que: “el aprendizaje automático (ML=
) se
refiere a la capacidad de un sistema para adquirir e integrar conocimiento a
través de observaciones a gran escala, y para mejorar y expandirse mediante=
el
aprendizaje de nuevos conocimientos en lugar de ser programado con ese cono=
cimiento”.
(Park & Woolf, 2009). En este sentido, busca observar y aprender los
patrones para luego replicar estos resultados sobre un nuevo conjunto de
observaciones con la finalidad de seguir perfeccionándose.
En el ámbito del aprendizaje automático existen tres tipos de
aprendizaje supervisado, no supervisado y de reforzamiento (Yaser S. et al, 2012).
Enfocando el análisis en el primero, desde el punto de vista supervi=
sado
se conoce toda la información referente a la clasificación de las observaci=
ones
por lo que se pretende que el algoritmo a emplearse analice los patrones de=
ntro
de los datos, con la finalidad de que se adapte a cualquier tipo de procede=
ncia
de las observaciones. Se divide a los datos en un conjunto de entrenamiento=
y
otro de testeo empleando al primer conjunto para aprender el comportamiento=
de
las observaciones y el segundo para evaluar el desempeño del modelo o regla=
que
se ha obtenido dentro del primer conjunto. Considerando este enfoque se rea=
liza
la división en entrenamiento y testeo particionando los datos de modelamien=
to
en el 70% y 30% respectivamente.
“Un árbol de decisión es una estructura en forma de árbol con ramas =
que
representan grupos de decisiones. Estas decisiones conducen a un conjunto de
reglas para categorizar una colección de datos en subgrupos disjuntos y
exhaustivos. La ramificación recursiva se realiza hasta que se cumplen los
requisitos de parada especificados” (Goicoechea, 2002). La construcción vis=
ual
se representa en una imagen que se lee de abajo hacia arriba, destacando las
reglas de clasificación en cada instancia para la separación de las
observaciones en subgrupos.
En aprendizaje automático un árbol de decisión (Quinlan, 1996), es una estructura de fácil interpretación debi=
do a
que su comportamiento que es similar a un diagrama de flujo, donde cada una=
de
sus ramas representa una decisión y cada hoja un atributo, una condición. Se
encuentra compuesto por:
· =
Nodo Raíz:
nodo superior del árbol. El nodo raíz se considera como la decisión que gui=
ará
a las ramificaciones.
· = Ramificaciones: caminos que unen los nodos y muestran la acción que se va a tomar.<= o:p>
· =
Nodo de decisión: Muestra la decisión que se va a tomar.
· =
Nodos terminales o hojas: indica el resultado definitivo.
Dado que la variable dependiente es de tipo categórica se utilizará =
un
árbol de clasificación, empleando el Índice Gini para la creación de
ramificaciones para las posibles divisiones. Es importante destacar que este
algoritmo se encuentra implementado en la librería ski=
cit-learn (Pedregosa et al, 2011); especializada en
Machine Learning en el lenguaje de programación Python.
Un aspecto de interés en el análisis de los resultados corresponde al
evaluar la importancia de cada uno de los predictores que conforman el árbo=
l de
decisión respecto a la variable dependiente (M.
R. A. Iqbal et al, 2012). La Figura
1, destacó que =
el poder
predictivo de la nacionalidad fue determinante al discriminar la categoría
migratoria. Por lo cual, su relevancia es trascendental en lo que respecta =
al
otorgamiento del visado de residencia permanente o temporal. Posterior en
importancia se encontraron las variables referentes a la edad de los
ciudadanos, si el estado civil es soltero/divorciado, y el género femenino.=
Figura =
1=
Top 5 importancia de variables
A continuación=
, en
la Figura
2 se muestra las
reglas de decisión optimizadas mediante el entrenamiento del árbol.
Mediante un análisis detallado de los resultados determinado por el
árbol de clasificación mostrados en la Figura
2, se observan =
las
siguientes características en cuanto a la categoría migratoria:
· =
Resi=
dente
temporal:
o
Naci=
onalidad
colombiana y estado civil soltero.
o
Naci=
onalidad
colombiana y su estado civil no es soltero ni divorciado.
o
Naci=
onalidad
venezolana, estado civil soltero y edad menor a 22 años.
o
Naci=
onalidad
venezolana, su estado civil no es soltero, pero no está determinado en el
sistema.
· =
Resi=
dente
permanente:
o Naci= onalidad colombiana, su estado civil no es soltero, pero si consta como divorciado.<= o:p>
o
Naci=
onalidad
venezolana, estado civil soltero y edad mayor a 22 años.
o
Naci=
onalidad
venezolana y su estado civil es distinto de soltero y no determinado en el
sistema.
Figura =
2=
Árbol de decisión
Nota: Para una lectura de las reglas de decisión mediante la visuali=
zación
del árbol de decisión, se analiza al interior de cada nodo la condición
evaluada. A la derecha se encuentra la condición verdadera y a la izquierda=
la
condición falsa.
Para contrarrestar los resultados obtenidos a partir del árbol de decisión, se emplea un modelo de regresión logística (Salcedo & Poma, 2002) utilizado para evaluar el efecto de las variables consideradas en el estudio sobre la probabilidad de solicitar una visa de tipo permanente o temporal.<= o:p>
Figura =
3=
Resumen Regresión logística (Toda= s las variables)
La Figura
3 contiene el r=
esumen
estadístico obtenido para el modelo de regresión logística, al considerar l=
os
estadísticos asociados a la significancia de cada una de las variables
(P>|z|). Se tiene que el valor asociado a la edad actualizada, género
femenino y estado civil ND es mayor a 0.05 (Shaffer,
1995), por lo que no son decisivos al momento de analizar la categor=
ía
migratoria del solicitante. A continuación, se muestra el resumen del model=
o al
omitir las variables nombradas anteriormente.
Enfocando el análisis en el valor de los coeficientes mostrados en l=
a Figura
4 (coef), se poseen las siguientes características respe=
cto al
efecto de las variables seleccionadas para explicar la categoría migratoria=
:
·
El
valor positivo en el coeficiente asociado al País de Nacionalidad Colombia,
indica que las personas de esta nacionalidad poseen una mayor propensión a =
solicitar
un visado temporal, en comparación a aquellas de nacionalidad venezolana.
·
Los
valores negativos asociados a los coeficientes de los distintos tipos de Es=
tado
Civil indican que la propensión a solicitar un visado temporal de las perso=
nas
que conforman estos grupos es menor respecto a aquellas que poseen un estado
civil no definido. Adicionalmente, se puede observar que aquellos perfiles =
que
pueden ser asociados con poseer un núcleo familiar tienen una probabilidad
menor de solicitar un visado temporal frente a la posibilidad de uno perman=
ente
(el valor de los coeficientes tiende a ser menor).
Figura =
4=
Resumen Regresión logística (Vari=
ables
significantes)
Finalmente, se emplearon las siguientes métricas calculadas a partir=
de
la matriz de confusión que sirven para evaluar tanto el rendimiento del mod=
elo
y la precisión de sus clasificaciones (
Fernández Casal & Costa, 2021).
Matriz de confusión
|
1 |
0 |
1 |
Verdaderos Positivos =
(TP) |
Falsos Negativos (FN)=
|
0 |
Falsos Positivos (FP)=
|
Verdaderos Negativos =
(TN) |
Las métricas utilizadas para medir el desempeño del modelo se obtien=
en a
partir de los valores mostrados en la Tabla
4. Estos son:
· =
Exac=
titud:
Porcentaje de datos clasificados correctamente.
· =
Tasa=
de
error: Porcentaje de datos clasificados incorrectamente.
·
Tasa=
de
verdaderos positivos (sensibilidad)]: El porcentaje de datos clasificados
correctamente cuando pertenecen al grupo 1.
=
·
Espe=
cificidad:
El porcentaje de datos clasificados correctamente cuando pertenecen al grup=
o 0.
<=
![if !msEquation]>
·
Prec=
isión:
Mide los datos es clasificado como 1s con qué frecuencia es etiquetado
correctamente.
<=
![if !msEquation]>
·
Curva
AUC-ROC: El área bajo la curva ROC sirve para medir el rendimiento de los
problemas de clasificación binaria al variar el umbral
Se obtuvieron los siguientes resultados en cuanto al modelamiento (<=
/span>Tabla 5<=
/span>)=
:
Matriz de confusión modelamiento = Árbol decisión
|
1 |
0 |
1 |
4733 |
1037 |
0 |
685 |
1666 |
A partir de la Tabla
5 se procede a
calcular las métricas de evaluación en el modelamiento. Los valores obtenid=
os
son: tasa de error (21.20%), exactitud (78.80%), sensibilidad (82.03%),
especificidad (70.86%) y precisión (87.36%) indican un desempeño adecuado al
momento de clasificar entre los grupos de interés.
Figura =
5=
Curva AUC-ROC modelamiento Árbol = decisión
<= o:p>
El comportamiento ideal de la curva se da cuando la línea azul se
encuentra cercana al eje superior izquierdo, puesto que indica que el model=
o es
efectivo al momento de juzgar entre los grupos de clasificación. La =
Figura
5 muestra el
resultado sobre este conjunto de datos obteniendo un AUC de 76.45%, siendo =
una
métrica adecuada por su cercanía al 80%.
Matriz de confusión modelamiento Regresión
|
1 |
0 |
1 |
4588 |
1182 |
0 |
551 |
1800 |
Al igual que en el caso del Árbol de decisión se calculan las métric=
as
asociadas a su desempeño a partir de los valores de la Tabla
6: tasa de error
(21.34%), exactitud (78.66%), sensibilidad (79.51%), especificidad (76.56%)=
y
precisión (89.28%) obteniendo valores bastante similares al caso anterior c=
on
excepción de la sensibilidad y especificidad.
Figura =
6=
Curva AUC-ROC modelamiento Regres= ión
Al igual que en las métricas de evaluación, la Figura
6 muestra un
comportamiento parecido en cuanto a la forma de juzgar entre grupos obtenie=
ndo
un AUC del 78.04%, por lo que en el modelamiento se tiene que la Regresión
logística posee mejor desempeño que el Árbol de decisión.
Se calcularon las métricas para la evaluación del desempeño en cuant=
o a
las clasificaciones realizadas con los datos de validación con la finalidad=
de
mostrar que no existe sobreajuste en el modelo.
Matriz de confusión validación Árbol de decisión
|
1 |
0 |
1 |
2780 |
175 |
0 |
481 |
1277 |
Los valores mostrados en la Tabla
7 se asocian a =
una
tasa de error (13.92%), exactitud (86.08%), sensibilidad (94.08%),
especificidad (72.64%) y precisión (85.25%) que coligen que el modelo basad=
o en
un árbol de decisión conserva un buen desempeño al momento de clasificar en=
tre
los grupos de interés. Mientras que la Figura
7 se muestra qu=
e el
comportamiento de la curva ROC es bastante cercano al ideal (cercano al eje=
),
lo que se traduce en un AUC del 83,36%; reforzando las conclusiones de un
correcto desempeño en las clasificaciones obtenidas por el modelo.
<= o:p>
Figura =
7=
Curva AUC-ROC validación Árbol de
decisión
<= o:p>
Matriz de confusión validación Re= gresión
|
1 |
0 |
1 |
2724 |
231 |
0 |
356 |
1402 |
<= o:p>
En el caso de la regresión logística, los valores de las métricas
asociadas a la Tabla
8 son: tasa de =
error
(12.45%), exactitud (87.55%), sensibilidad (92.18%), especificidad (79.75%)=
y
precisión (88.44%). Al igual que en el caso del Árbol el modelo de Regresión
conserva un desempeño bastante similar al del modelamiento, lo que se tradu=
ce
en un AUC del 85.97% como se muestra en la Figura
8.
Figura =
8=
Curva AUC-ROC validación Regresió= n
Resultados y Dis= cusión
Al momento de
comparar los modelos se tiene que el desempeño de la regresión logística es
ligeramente mejor que del Árbol de decisión; no obstante, es recomendable f=
ijar
el objeto del análisis para poder seleccionar en método a emplearse. Siendo=
así
que si el objetivo fuese analizar aquellas personas que solicitan un visado=
de
tipo permanente el modelo de regresión posee una mejor especificidad (Tabla 8<=
/span>); y, por otro lado, si se pretende estudiar las
características de aquellas personas que solicitan un visado temporal el mo=
delo
de árbol posee una mayor sensibilidad (Tabla 7<=
/span>).
Sin embargo, d=
ado
que el estudio se enfoca en la plausibilidad de emplear un modelo de
aprendizaje para la identificación de las características predominantes al
momento de solicitar una visa de tipo permanente o temporal, se debe tener =
en
cuenta el efecto de las variables independientes en cada uno de los modelos
sobre la variable dependiente (Figura 4=
y Figura 2=
). Siendo así, que las conclusiones halladas en
cada modelo son bastante similares, contrastando la validez del método.
Finalmente, se
considera al modelo del Árbol de decisión para poder explicar los hallazgos
encontrados dentro del conjunto de datos, por la practicidad que este prese=
nta
al momento de realizar las clasificaciones. Se concluye que l=
as características predominantes al momen=
to
de otorgar una visa de residencia temporal a una persona de nacionalidad
colombiana es que sean solteras, que se encuentren con una pareja o una fam=
ilia
establecida. Mientras que para el caso de las personas con nacionalidad
venezolana se encuentra principalmente predominada por una población relati=
vamente
joven (edad menor a 23 años) y soltera.
En el caso de =
las
visas para residencia permanente en su mayoría se encuentran concentradas en
personas de nacionalidad venezolana solteras y con una edad mayor a 23 años,
asociando a estas características a personas que podrían pertenecer a la fu=
erza
de trabajo dentro del país. Seguidas por personas de la misma nacionalidad =
que
poseen una pareja o familia establecida, y en menor cantidad por personas de
nacionalidad colombiana cuyo estatus civil consta como divorciado.
El conjunto de datos fue separado en subconj=
unto
de modelamiento y otro de validación para realizar un contraste mediante
métricas de evaluación. Se determinó en datos que no fueron entrenados con =
el
modelo se obtuvo una exactitud del 86%; lo que representa, que el modelo de
clasificación tiene un error únicamente del 14% con respecto al total de ca=
sos
analizados para el conjunto de datos de validación.
Es importante
aclarar la forma en que el modelo de aprendizaje automático empleado para el
presente estudio se acopla al análisis presentado, dado que el funcionamien=
to
de un Árbol de decisión permite analizar las características conjuntas de l=
as
personas que se les ha otorgado una visa de tipo permanente o temporal y cu=
ya
nacionalidad corresponde a las de interés.
Cabe recalcar =
que se
ejecutó individualmente un modelo de Árbol para Colombia y otro para Venezu=
ela.
No obstante, los resultados no determinaron una correcta separación de la
variable objetivo lo cual conlleva a identificar que la nacionalidad ejerci=
ó un
aporte fundamental con regla de decisión primaria, validando lo obtenido al
analizar la importancia de las variables.
Finalmente, se
recomienda que al momento de considerar trabajar con datos abiertos el
investigador debe estar consiente que deberá atenerse a la información brin=
dada
por la respectiva fuente y que en varios casos el tratar de acceder a datos
adicionales puede conllevar procesos burocráticos que no aseguran que se pu=
eda
conseguir la información solicitada.
Referencias
Beverly =
Park
Woolf, Editor(s): Beverly Park Woolf, Building Intelligent Interactive Tuto=
rs,
Morgan Kaufmann, 2009, ISBN 978-0-12-373594-2,
https://doi.org/10.1016/B978-0-12-373594-2.X0001-9
Gandini,
Luciana & Prieto Rosas, Victoria & Lozano-Ascencio, Fernando. (2019=
).
El éxodo venezolano: migración en contexto de crisis y respuestas de los pa=
íses
latinoamericanos.
Goicoechea,
A. P. (2002). Imputación basada en árboles de clasificación. Eustat. Available in: htt=
p://www.
eustat. es/documentos/datos/ct,
4.
Jaime Cerda y Lorena Cifuentes. Uso de curvas ROC en investigación clínica. Aspec= tos teórico-prácticos. Revista chilena de infectología, 29:138 – 141, 04 2012.<= o:p>
J.
R. Quinlan. 1996. Learning decision tree classifiers.
ACM Comput. Surv.
28, 1 (March 1996), 71–72. https://doi.org/10.1145/234313.234346
Liberona
Concha, N. (2020). Fronteras y movilidad humana en América Latina. Nueva
sociedad, (289), 49-58.
Loor
Valeriano, Katherine (2012). Estadísticas y distribución espacial de la
migración en el Ecuador según censo 2010. Dspace=
span> espol. http://www.dspace.espol.edu.ec/handle/123456789/2=
4824
M. K. Dahouda and I. Joe, "A Deep-Learned Embedding Te=
chnique
for Categorical Features Encoding," in IEEE Access, vol. 9, pp.
114381-114391, 2021, doi: 10.1109/ACCESS.2021.3=
104357
M. R. A.=
Iqbal,
S. Rahman, S. I. Nabil and I. U. A. Chowdhury,
"Knowledge based decision tree construction with feature importance do=
main
knowledge," 2012 7th International Conference on Electrical and
Computer Engineering, 2012, pp. 659-662, doi:
10.1109/ICECE.2012.6471636.
Pedregosa, Fabian & Varoquaux=
span>,
Gael & Gramfort, Alexandre & Michel, Vi=
ncent
& Thirion, Bertrand & Grisel, Olivier &=
amp;
Blondel, Mathieu & Prettenhofer, Peter &
Weiss, Ron & Dubourg, Vincent & Vanderplas, Jake & Passos,
Alexandre & Cournapeau, David & Brucher, Matthieu & Perrot, Matthieu & Duchesnay, Edouard & Louppe<=
/span>,
Gilles. (2012). Scikit-learn: Machine Learning in Python. Journal of Machine
Learning Research. 12.
Proyecto
(In)Movilidad En Las Américas, Ficha de Ecuador. Covid-19 e (In)movilidad en
las Américas, 2020, enlace: https://www.inmovilidadamer=
icas.org/ecuador.
Salcedo
Poma, Celia Mercedes, Estima=
ción
de la ocurrencia de incidencias en declaraciones de pólizas de
importación ,Informe Profesional (Lic.) Universidad
Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. EAP. de =
Estadística, 2002.
J P Shaf=
fer,
Multiple Hypothesis Testing, Journal Article, 1995, Annual Review of
Psychology, 561-584, https://www.annualreviews.org/doi/abs/10.1146/annurev.=
ps.46.020195.003021
Rojo,
J. M. (2006). Análisis descriptivo y exploratorio de datos. Laboratorio de
Estadística del Instituto de Economía y Geografía Consejo Superior de
Investigaciones Científicas, Madrid.
Rubén
Fernández Casal y Julián Costa. Aprendizaje estadístico. GitHub, 2020.
Yaser
S. Abu-Mostafa, Malik Magd=
on-Ismail,
and Hsuan-Tien Lin. 2012. Learning From Data. <=
span
class=3DSpellE>AMLBook.
5
Movilidad humana hacia
Ecuador, una visión desde el análisis de datos