Selección de zonas de interés en el Valle de Aburrá y San Nicolás con el método de identificación de clústeres basados en densidad y vecino cercano mejorado aplicado en redes sociales.

Selección de zonas de interés en el Valle de Aburrá y San Nicolás con el método de identificación de clústeres basados en densidad y vecino cercano mejorado aplicado en redes sociales.

Contenido principal del artículo

Esteban Zapata Rojas

Resumen

Selecting Areas of Interest in Valle de Aburrá and San Nicolás Town Using the Identification Method of Density-Based Clustering and Improved nearest Neighbor Applied in Social Networks.

Resumen

Más que nunca, las redes sociales han cobrado un importante puesto en la interacción y el comportamiento de los humanos en la última década. Esta valiosa posición hace que sea imperativo analizar diferentes aspectos de la vida cotidiana y la ciencia en general. En el presente artículo se ilustra cómo fue el proceso de captura y almacenamiento de la información, la aplicación de los métodos de Clustering basados en densidad y vecino cercano mejorado en los datos y un repaso por los resultados, mostrando los elementos utilizados en la identificación de las zonas de interés a través de clústeres, circunferencias y radios de cobertura obtenidos para realizar un análisis de segmentación demográfico de la información obtenida a través de las redes sociales Twitter y Flickr, permitiendo conclusiones más profundas sobre un tema o temática predefinida. Por último, se plantea la necesidad de elaborar una aplicación que automatice todos los procesos acá definidos, permitiendo que usuarios finales interesados en estos temas tengan acceso a ella y puedan obtener resultados importantes para su organización o interés.


Palabras clave: Clúster, redes sociales, identificación de clústeres, machine learning.

Abstract

More than ever, social networks have become an important place in the interaction and behaviour of humans in the last decade. This valuable position makes it imperative to analyze different aspects of everyday life and science in general. This paper illustrates the process of capturing and storing information, the application of density-based clustering and improved nearest neighbor, and a review of the results. The study also shows the elements used in the identification of areas of interest through clusters, circumferences and coverage radii obtained for a demographic segmentation analysis of the information procured from Twitter, Flickr and the like. This results in more profound conclusions about a predefined topic or theme. Finally, the need arises to develop an application that makes all the defined process automatic, allowing final users interested in those topics to have access to it and get important results for their organizations or interest.


Keywords: Clustering, social networks, clustering identification, machine learning.

Descargas

Los datos de descargas todavía no están disponibles.

Detalles del artículo

Referencias (VER)

April, R. & June, P. (2014). Inside Twitter€¯: An In-Depth Look Inside the Twitter World. Sysomos.

Condie, T., Mineiro, P., Polyzotis, N. & Weimer, M. (2013). Machine learning for big data. In Proceedings of the 2013 international conference on Management of data. Washington.

Cruz, J. A. & Wishart, D. S. (2006). Applications of machine learning in cancer prediction and prognosis. Cancer informatics, 2 (59).

Flurry. (2013). China Knocks Off U.S. to Become World’s Top Smart Device Market. February 18th. Recuperado de: http://www.flurry.com/bid/94352/China-Knocks-Off-U-S-to-Become-World-s-Top-Smart-Device-Market.

Fraley, C. & Raftery, A. E. (2002). Model-Based Clustering, Discriminant Analysis, and Density Estimation. Journal of the American Statistical Association, (97),
611-631.

Gershenfeld, N., Krikorian, R. & Cohen, D. (2004). The Internet of Things. Communications Engineer, 4, 76-81.

Global Web Index. (2013). Top 15 global apps: Vine and Flickr lead growth. Recuperado de: http://www.digitalstrategyconsulting.com/intelligence/2013/10/top_15_global_apps_vine_and_flickr_lead_growth.php.

Hijazi, H., Wu, M., Nath, A. & Chan, C. (2012). Ensemble Classification of Cancer Types and Biomarker Identification. Drug development research, 73 (7),
414-419.

Jiawei Han. (2011). Cluster Analysis: Basic concepts and Methods. In Data Mining: Concepts and Techniques (3rd ed.) Waltham: Morgan Kaufmann.

Kazi, M. (2014). Density-based clustering. In Data Mining and Analysis. Fundamental concepts and algorithms. Cambrige University Press.

Kononenko, I. (2001). Machine learning for medical diagnosis: history, state of the art and perspective. Artificial Intelligence in medicine, 23 (1),
89-109.

Kriegel, H., Sander, J. & Xu, X. (2011). Density-based clustering. Wiley Interdisciplinary Reviews Data Mining and Knowledge Discovery, 1, 231-240.

MacQueen, J. B. (1967). Kmeans Some Methods for classification and Analysis of Multivariate Observations. 5th Berkeley Symposium on Mathematical Statistics and Probability 1967.

Moseley, L. G. (1988). Introduction to machine learning. Engineering Applications of Artificial Intelligence, 1, 334.

Nelson, C. & Wake, N. (2003). Geodemographic Segmentation€¯: Do Birds of a Feather Flock Together€¯?. 1-9.

Oja, E. (2013). Machine learning for big data analytics. Communications in Computer and Information Science, 384. Recuperado de: http://www.scopus.com/inward/record.url?eid=2-s2.0-84885127371&partnerID=40&md5=6790e5b2150300e4a1458130a86288bd.

Pelleg, D., & Moore, A. (2000). X-means: Extending K-means with Efficient Estimation of the Number of Clusters. Seventeenth International Conference on Machine Learning, 727-734.

Rajagopal, S. (2011). C Ustomer Data Clustering Using D Ata. International Journal of Database Management Systems, 3 (4),
1-11.

Semiocast, (2012). Geolocation analysis of Twitter accounts by Semiocast, Recuperado de: http://www.seocolombia.com/blog/estadisticas-facebook-colombia-2012/.

Sinnott, R.W. (1984). Virtues of the Harvesine. Sky and Telescope, 68 (2),
158.

Tugores, A. & Colet, P. (2013). Mining online social networks with Python to study urban mobility. Euroscipy, 21-28.

Weng, J., Yao, Y., Leonardi, E. & Lee, F. (2011). Event Detection in Twitter. Development, (98) 401-408.