Predicción y clasificación basada en distancias parcialmente observadas
Fecha: junio 2021
Aldo R. Franco Comas, Andrés M. Alonso Fernández
Aprendizaje de distancias, Clustering, Curvas de oferta, k-NN, Matrices de distancia
Análisis econométrico y big data
El procedimiento de vecinos más cercanos, k-NN en inglés, se utiliza para la clasificación de nuevas observaciones empleando la matriz de distancias entre las observaciones a clasificar y las observaciones en la muestra de entrenamiento. En este trabajo, desarrollamos un procedimiento k-NN para situaciones donde no es posible calcular todas las distancias entre las nuevas observaciones y las observaciones en la muestra de entrenamiento. Por otra parte, k-NN depende de la distancia utilizada y proponemos un procedimiento para el aprendizaje de la distancia a partir de las distancias en la muestra de entrenamiento. El procedimiento propuesto se ilustra utilizando conjuntos de datos reales.