Vol. 15 No. 1 (2024): AGLALA JOURNAL
Papers

Detection of criminal activity patterns through Machine Learning techniques

Héctor Andrés Mora Paz
Cesmag University
Jorge Albeiro Rivera Rosero
Cesmag University

Published 2024-06-30

Keywords

  • Criminal activity,
  • machine learning,
  • clustering,
  • geo interpolation

How to Cite

Mora Paz, H. A., & Rivera Rosero, J. A. (2024). Detection of criminal activity patterns through Machine Learning techniques. Aglala, 15(1), 311–324. Retrieved from https://revistas.uninunez.edu.co/index.php/aglala/article/view/2544

Abstract

San Andrés de Tumaco presents a public order situation that generates threats and extortions, being a  source  of   income for illegal armed groups (FIP - Ideas for Peace, 2022) and an instrument for

social and economic control. That is why this study proposes to carry out an application that contributes to the prediction of criminal activity in the municipality of Tumaco, as a tool to forecast the density of zoned criminal growth, as support to the actors in charge of security in the municipality to carry out mitigation plans and efficient use of the force. The public order situation that plagues some areas of the Nariño department, including the municipality of Tumaco; For its part, threats and extortions: a challenge to territorial peace, shows how "extortion networks configure mechanisms through which illegal or criminal armed groups appropriate the economic activities of the territories" (Defensoría Del Pueblo, 2022). The main objective of the project is to implement an experimental framework for comparing the commitment in quality metrics between quality metrics and computational cost in supervised and unsupervised Machine Learning algorithms to obtain a suboptimal model for predicting criminal activity for the municipality of Tumaco through the KDD methodology. The methodology was carried out using Knowledge Discovery in Databases (KDD) (Data, 2022). The results provide a crime database for all of Colombia for the years 2010 to 2019; transformation and cleaning scripts from which the training databases are obtained for both supervised and unsupervised techniques. It is concluded that the application of Kriging interpolation for the development of this research was the most favorable since the advanced geostatistical procedure generated an estimated surface from a set of criminal activity points dispersed with z values, thus obtaining an autocorrelation, that is, the statistical relationships between the measured points.

Downloads

Download data is not yet available.

References

  1. Alfredo. (2017). ¡Descubriendo información en bases de datos!
  2. Arsys. (2019). ¿Qué es Machine Learning y por qué es tan importante?
  3. BBC News Mundo. (n.d.). Por qué América Latina es la región más violenta del mundo (y qué lecciones puede tomar de la historia de Europa).
  4. BSG Institute. (n.d.). Geoestadística: Variograma Experimental.
  5. C. R. T. en el departamento de G. D. C. de T. G. where the puck is going to be. (2020). ¿Qué son las redes neuronales artificiales y cómo funcionan? - Thinkbig.
  6. Charte, F. (n.d.). Cómo es el proceso de extraer conocimiento a partir de bases de datos.
  7. Data, M. (2022). KDD: Knowledge Discovery in Databases.
  8. Defensoría del Pueblo. (2022).
  9. Definición de predicción — Definicion.de. (n.d.).
  10. Diario Del Sur. (2022).
  11. En Tumaco no cede criminalidad. (n.d.).
  12. F., S. (n.d.). NxKNN - K Barrios más cercanos (K-NN ) Regresión.FIP - Ideas para la paz. (2022). Dinámicas del conflicto armado en Tumaco y su impacto humanitario.
  13. Gabri. (2018). Geoestadística, interpolación con Kriging.
  14. Galindo, L. M., & Catalán, Y. H. (2007). Las actividades delictivas en el Distrito Federal. Revista Mexicana de Sociología, 29.
  15. Interpolacion y Extrapolacion – julianapinzon. (n.d.).
  16. Jiménez, J., Muñoz, A., Ramos, D., Muñoz, J., Gonzales, C., Guerrero, H., Santacruz, F., Leyton, G., & Eraso, A. (2020). Las tecnologías de las redes y los AVA. Editorial Universidad CESMAG. https://doi.org/10.15658/CESMAG20.12010129
  17. López, B. R. (2020). Librerías de Python para trabajar con datos espaciales.
  18. Los datos lo demuestran: Tumaco no sabe qué es el posconflicto. (n.d.).
  19. Minera, N. (2019). PRUEBA DEL KIT PYKRIGE EN PYTHON.
  20. Modeling reality generating software. (2020). Machine Learning Algorithms and Techniques.
  21. Pérez, R., & Luis, J. (2014). Técnicas de aprendizaje automático para la detección de intrusos en redes de computadoras. Revista Cubana de Ciencias Informáticas, 8(4), 52–73.
  22. Policía Nacional de Colombia. (2015). Observatorio del Delito de la Policía Nacional.
  23. ¿Qué es el error cuadrático medio RMSE? | El blog de franz. (n.d.).
  24. Tecnicas-de-mineria-de-datos-para-la-prevencion-de. (n.d.).
  25. Toledo, A. (2016). Métodos de selección de atributos para clasificación supervisada basados en teoría de información.
  26. Valenga, F., Perversi, I., Fernández, E., Merlino, H., Rodríguez, D., & Britos, P. (2016). APLICACION DE MINERIA DE DATOS PARA LA EXPLORACION Y DETECCION DE PATRONES DELICTIVOS EN ARGENTINA. 13.