MODELO PARA EL ANÁLISIS DE SENTIMIENTOS DEL BANCO DE ENCUESTAS CON PREGUNTAS SOBRE CORONAVIRUS DE LA OMS EMPLEANDO PRINCIPIOS DE MINERÍA DE TEXTOS

Navira Gissela Angulo Murillo, Alex Alfonso Sánchez Arteaga, Gabriel Rodolfo García Murillo, Wilton Rafael Saltos Rivas

Resumen


La presente investigación tiene la finalidad de elaborar un modelo de Análisis de Sentimientos de un Banco de 250 instrumentos de recolección de Datos sobre Coronavirus, mismo que es guardado como referencia en el sitio web oficial de la Organización Mundial de la Salud, OMS. Para esto se ha empleado fundamentos de Minería de Textos mediante la plataforma Open Source de Minería de Datos, Orange, construyendo un modelo que analiza el Corpus de documentos y genera diagramas de distribución de sentimientos según la herramienta Valence Aware Dictionary and Sentiment Reasoner, VADER, y nube de palabras que ilustra el peso de las palabras según su frecuencia en el Corpus. Los resultados reflejan que las emociones Neutras son las que alcanzan valores más altos en todos los tipos de preguntas, las Negativas y Positivas guardan cierto patrón y alcanzan niveles medios en todos los tipos de preguntas, en tanto que las emociones Combinadas no tienen un patrón establecido, aunque son más frecuentes en preguntas relacionadas al Entorno, Conocimiento y Tratamiento de Salud de los posibles encuestados. Es de indicar que los tipos de preguntas son siete: Entorno, Exposición, Impacto, Conocimiento, Atención médica, Percepción y Miscelánea.

PALABRAS CLAVE: Big Data; Minería de Datos; Orange; Minería de Textos; Coronavirus.

MODEL FOR THE ANALYSIS OF FEELINGS OF THE SURVEY BANK WITH QUESTIONS ON WHO CORONAVIRUSES USING TEXT MINING PRINCIPLES

ABSTRACT

This is an academic paper, the purpose of which is to develop a Sentiment Analysis model of a Bank of 250 instruments for data collection on Coronavirus, which is kept as a reference on the official website of the World Health Organization, WHO . For this, Text Mining fundamentals have been used through the Open Source Data Mining platform, Orange, building a model that analyzes the Corpus of documents and generates diagrams of sentiment distribution according to the Valence Aware Dictionary and Sentiment Reasoner tool, VADER, and word cloud that illustrates the weight of words according to their frequency in Corpus. The results reflect that the Neutral emotions are those that reach higher values in all types of questions, the Negative and Positive ones maintain a certain pattern and reach medium levels in all types of questions, while the Combined emotions do not have an established pattern , although they are more frequent in questions related to the Environment, Knowledge and Treatment of Health of the possible respondents. It is to indicate that the types of questions are seven: Environment, Exposure, Impact, Knowledge, Medical attention, Perception and Miscellaneous.

KEYWORDS: Big Data; Data Mining; Orange; Text Mining; Coronavirus.


Texto completo:

DOC PDF HTML

Referencias


Amala, G. (2019). Orange tool approach for comparative analysis of supervised learning algorithm in classification mining. Journal of Analysis and Computation, 13(1), 1–10.

Bird, S., Klein, E., & Loper, E. (2008). NLTK Documentation. Online: Accessed April.

Jin, Y. (2017). Development of word cloud generator software based on python. Procedia Engineering, 174, 788–792.

Manguri, K., Ramadhan, R., & Mohammed Amin, P. (2020). Twitter Sentiment Analysis on Worldwide COVID-19 Outbreaks. Kurdistan Journal of Applied Research, 54–65. https://doi.org/10.24017/covid.8

Newman, H., & Joyner, D. (2018). Sentiment analysis of student evaluations of teaching. International Conference on Artificial Intelligence in Education, 246–250.

Peng, L., Yang, W., Zhang, D., Zhuge, C., & Hong, L. (2020). Epidemic analysis of COVID-19 in China by dynamical modeling. ArXiv Preprint ArXiv:2002.06563.

Vijaymeena, M. K., & Kavitha, K. (2016). A survey on similarity measures in text mining. Machine Learning and Applications: An International Journal, 3(2), 19–28.

World Health Organization. (2000). The world health report 2000: health systems: improving performance. World Health Organization.

World Health Organization. (2020). World Health Organization. Covid-19 Question Bank. https://tinyurl.com/y2tv8b7o




Contador de visitas: Resumen | 25 | y DOC | 0 | PDF | 3 | HTML | 10 |

Enlaces refback

  • No hay ningún enlace refback.


Copyright (c) 2020 Navira Gissela Angulo Murillo, Alex Alfonso Sánchez Arteaga, Gabriel Rodolfo García Murillo, Wilton Rafael Saltos Rivas

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento 4.0 Internacional.

Publicación bajo licencia

Grupo 2. Clasificación de Revistas Científicas de la República de Cuba.

Cátálogo 1.0 (36/36 criterios cumplidos).

Procedencia geográfica de los lectores de Revista Mikarimin

Map