Weka, áreas de aplicación y sus algoritmos: una revisión sistemática de literatura

Contenido principal del artículo

Marcos Antonio Espinoza Mina

Resumen

Actualmente se generan grandes cantidades de datos almacenados en dispositivos digitales que cada día, debido a los avances tecnológicos, crecen también en su capacidad de almacenamiento. Muchos de estos datos no se encuentran adecuadamente estructurados, resultando una tarea difícil su explotación. Ante estas realidades y dificultades es necesario hacer uso de técnicas automatizadas que permitan reducir, analizar y utilizar de forma eficiente los datos. Se han desarrollado variadas metodologías, programas y complementos aplicados específicamente al conjunto de datos con el que se trabaje; se destacan las herramientas informáticas que implementan técnicas para el aprendizaje automático y la minería de datos, una de ellas es Weka. El presente trabajo hace una revisión sistemática de la literatura cuyo objetivo fue buscar los campos o áreas de aplicación de Weka y los algoritmos más utilizados de este programa. Los resultados exponen que Weka está siendo empleada en campos como: informática, medicina, educación y agricultura. Los algoritmos más utilizados dependiendo del tipo de datos y propósito de la evaluación son: Naïve Bayes, J48, Decision Tree, Random Forest, Support Vector Machine (SMV) y Sequential Minimal Optimization (SMO).

Descargas

La descarga de datos todavía no está disponible.

Detalles del artículo

Cómo citar
Espinoza Mina, M. A. (2018). Weka, áreas de aplicación y sus algoritmos: una revisión sistemática de literatura. REVISTA CIENTÍFICA ECOCIENCIA, 5, 1–26. https://doi.org/10.21855/ecociencia.50.153
Sección
Artículos
Biografía del autor/a

Marcos Antonio Espinoza Mina, Docente de Universidad Tecnológica ECOTEC

Docente de la Universidad Agraria del Ecuador

Magíster en Negocios Internacionales y Gestión en Comercio Exterior (Ecuador).

Doctorando en Administración de Empresas Pontificia Universidad Católica Argentina Santa María de los Buenos Aires

Citas

Abdulla, R., & Tjahyanto, I. A. (2018). Evaluation of the Performance of a Machine Learning Algorithms in Swahili-English Emails Filtering System Relative to Gmail Classifier.
2018 International Conference on Information and Communications Technology
(ICOIACT). https://doi.org/10.1109/ICOIACT.2018.8350713
Arcila-Calderón, C., Ortega-Mohedano, F., Jiménez-Amores, J., & Trullenque, S. (2017). Análisis supervisado de sentimientos políticos en español: clasificación en tiempo real de tweets basada en aprendizaje automático. El Profesional de la Información,
26(5), 973. https://doi.org/10.3145/epi.2017.sep.18
Athani, S. S., Kodli, S. A., Banavasi, M. N., & Hiremath, M. (2017). Student Academic Performance and Social Behavior Predictor using Data Mining Techniques.
Presentado en IEEE International Conference on Computing, Communication and Automation (ICCCA-2017) on 5th-6th May, 2017: proceeding.
https://doi.org/10.1109/CCAA.2017.8229794
Baeza-Yates, R. (2009). Tendencias en minería de datos de la Web. El Profesional de la
Informacion, 18(1), 5-10. https://doi.org/10.3145/epi.2009.ene.01
Barbona, I. (2015). Comparación de métodos de clasificación aplicados a textos Científicos y No Científicos. Revista INFOSUR. Grupo INFOSUR. Rosario.
Bouza, C. N., & Santiago, A. (2012). La minería de datos: árboles de decisión y su aplicación en estudios médicos. Modelación Matemática de Fenómenos del Medio Ambiente y la Salud, 2.
Corso, C. L. (2009). Aplicación de algoritmos de clasificación supervisada usando Weka.
Córdoba: Universidad Tecnológica Nacional, Facultad Regional Córdoba. da Silva Pessoa, A. L., & Oleskovicz, M. (2017). Fault location in radial distribution systems based on decision trees and optimized allocation of power quality meters. En PowerTech, 2017 IEEE Manchester (pp. 1–6). IEEE.
https://doi.org/10.1109/PTC.2017.7980907
Domínguez, C., Heras, J., Mata, E., & Pascual, V. (2016). WekaBioSimilarity—Extending
Wek with Resemblance Measures. En O. Luaces, J. A. Gámez, E. Barrenechea, A.
Troncoso, M. Galar, H. Quintián, & E. Corchado (Eds.), Advances in Artificial Intelligence (Vol. 9868). Cham: Springer International Publishing.
https://doi.org/10.1007/978-3-319-44636-3
Duriqi, R., Raca, V., & Cico, B. (2016). Comparative analysis of classification algorithms on three different datasets using WEKA. En 2016 5th Mediterranean Conference on Embedded Computing (MECO). IEEE. https://doi.org/10.1109/MECO.2016.7525775
Engel, T. A., Charão, A. S., Kirsch-Pinheiro, M., & Steffenel, L.-A. (2015). Performance improvement of data mining in Weka through multi-core and GPU acceleration:
opportunities and pitfalls. Journal of Ambient Intelligence and Humanized Computing,
6(4), 377-390. https://doi.org/10.1007/s12652-015-0292-9
Febles Rodríguez, J. P., & González Pérez, A. (2002). Aplicación de la minería de datos en la bioinformática. Acimed, 10(2), 69–76.
Fernández, D. B., & Luján-Mora, S. (2017). Comparison of applications for educational data mining in Engineering Education. En World Engineering Education Conference (EDUNINE), IEEE (pp. 81–85). IEEE.
https://doi.org/10.1109/EDUNINE.2017.7918187
Fernández-Sainz, A., & Ivantchev, S. (2013). Cómo el aprendizaje automático y el big data pueden ayudarnos con el aprendizaje humano: un experimento con Introducción a la Econometría. Revista electrónica sobre la enseñanza de la Economía Pública Págs, 24, 35.
Gandhi, N., Armstrong, L. J., Petkar, O., & Tripathy, A. K. (2016). Rice crop yield prediction in India using support vector machines. En Computer Science and Software Engineering (JCSSE), 2016 13th International Joint Conference on (pp. 1–5). IEEE. https://doi.org/10.1109/JCSSE.2016.7748856
Garcés, D. A., & Castrillón, O. D. (2017). Diseño de una Técnica Inteligente para Identificar y
Reducir los Tiempos Muertos en un Sistema de Producción. Información
Tecnológica, 28(3), 157-170. https://doi.org/10.4067/S0718-07642017000300017
Georgiou, D., MacFarlane, A., & Russell-Rose, T. (2015). Extracting sentiment from healthcare survey data: An evaluation of sentiment analysis tools. En Science and Information Conference (SAI), 2015 (pp. 352–361). IEEE.
https://doi.org/10.1109/SAI.2015.7237168
Hamsagayathri, P., & Sampath, P. (2017). Priority based decision tree classifier for breast cancer detection. En Advanced Computing and Communication Systems (ICACCS), 2017 4th International Conference on (pp. 1–6). IEEE.
https://doi.org/10.1109/ICACCS.2017.8014598
Jhajharia, S., Verma, S., & Kumar, R. (2016). A cross-platform evaluation of various decision tree algorithms for prognostic analysis of breast cancer data. En Inventive Computation Technologies (ICICT), International Conference on (Vol. 3, pp. 1–7).
IEEE. https://doi.org/10.1109/INVENTIVE.2016.7830107
Kabli, F., Hamou, R. M., & Amine, A. (2017). New classification system for protein sequences. En Embedded & Distributed Systems (EDiS), 2017 First International Conference on (pp. 1–6). IEEE. https://doi.org/10.1109/EDIS.2017.8284029
Lee, P. Y., Loh, W. P., & Chin, J. F. (2016). Preprocessing compressed 3D kinect skeletal joints in enhancing human motion classification. En Computer and Information Sciences (ICCOINS), 2016 3rd International Conference on (pp. 357–362). IEEE. https://doi.org/10.1109/ICCOINS.2016.7783241
Livingston, F. (2005). Implementing Breiman’s random forest algorithm into Weka. En ECE591Q machine learning conference papers (Vol. 27). Citeseer.
Mahfuz, N., Ismail, W., Noh, N. A., Jali, M. Z., Abdullah, D., & Nordin, M. J. bin. (2015). A
Classification on Brain Wave Patterns for Parkinson’s Patients Using WEKA. En A. Abraham, A. K. Muda, & Y.-H. Choo (Eds.), Pattern Analysis, Intelligent Security and the Internet of Things (Vol. 355, pp. 21-33). Cham: Springer International Publishing.
https://doi.org/10.1007/978-3-319-17398-6_3
Mishra, S., Paygude, P., Chaudhary, S., & Idate, S. (2018). Use of Data Mining in Crop Yield
Prediction. En Proceedings of the Second International Conference on Inventive
Systems and Control (ICISC 2018). https://doi.org/10.1109/ICISC.2018.8398908
More, S., & Kalkundri, R. (2015). Evaluation of deceptive mails using filtering & WEKA. En Innovations in Information, Embedded and Communication Systems (ICIIECS), 2015 International Conference on (pp. 1–4). IEEE. https://doi.org/10.1109/ICIIECS.2015.7193262
Mosquera, R., Parra-Osorio, L., & Castrillón, O. D. (2016). Metodología para la Predicción del Grado de Riesgo Psicosocial en Docentes de Colegios Colombianos utilizando Técnicas de Minería de Datos. Información Tecnológica, 27(6), 259-272.
https://doi.org/10.4067/S0718-07642016000600026
Muthuselvan, S., & Soma, K. (2016). Prediction of Breast Cancer UsingClassification Rule Mining Techniques in Blood Test Datasets. En International Conference On Information Communication And Embedded System (ICICES 2016). IEEE. https://doi.org/10.1109/ICICES.2016.7518932
Olalere, M., Abdullah, M. T., Mahmod, R., & Abdullah, A. (2016). Identification and
Evaluation of Discriminative Lexical Features of Malware URL for Real-Time
Classification (pp. 90-95). IEEE. https://doi.org/10.1109/ICCCE.2016.31
Pandey, A. K., & Rajpoot, D. S. (2016). A comparative study of classification techniques by utilizing WEKA. En Signal Processing and Communication (ICSC), 2016 International Conference on (pp. 219–224). IEEE. https://doi.org/10.1109/ICSPCom.2016.7980579
Pereira, A., López, J., & Quintero, L. (2017). Estudio experimental para la comparación del desempeño de Naïve Bayes con otros clasificadores bayesianos. Revista Cubana de Ciencias Informáticas, 11, 67-84.
Perkasa, D. B., & Maulidevi, N. U. (2015). Beatmap generator for Osu Game using machine learning approach. En Electrical Engineering and Informatics (ICEEI), 2015 International Conference on (pp. 77–81). IEEE. https://doi.org/10.1109/ICEEI.2015.7352473
Phadikar, S., & Goswami, J. (2016). Vegetation Indices Based Segmentation for Automatic
Classification of Brown Spot and Blast Diseases of Rice. En 3rd Int’l Conf. on Recent Advances in Information Technology. IEEE. https://doi.org/10.1109/RAIT.2016.7507917
Rajesh, R., Maiti, J., & Reena, M. (2018). Decision Tree for Manual Material Handling Tasks
Using WEKA. En P. K. Ray & J. Maiti (Eds.), Ergonomic Design of Products and
Worksystems - 21st Century Perspectives of Asia (pp. 13-24). Singapore: Springer Singapore. https://doi.org/10.1007/978-981-10-5457-0_2
Rivero Pérez, J. L. (2014). Técnicas de aprendizaje automático para la detección de intrusos en redes de computadoras. Revista Cubana de Ciencias Informáticas, 8(4), 52–73.
Sewaiwar, P., & Verma, K. K. (2015). Comparative study of various decision tree classification algorithm using WEKA. International Journal of Emerging Research in Management &Technology, 4, 2278–9359.
Sivasakthi, M. (2017). Classification and Prediction based Data Mining Algorithms to Predict
Students’ Introductory programming Performance. 2017 International Conference on Inventive Computing and Informatics (ICICI), 346-350.
https://doi.org/10.1109/ICICI.2017.8365371
Smith, T. C., & Frank, E. (2016). Introducing Machine Learning Concepts with WEKA. En E.
Mathé & S. Davis (Eds.), Statistical Genomics (Vol. 1418, pp. 353-378). New York,
NY: Springer New York. https://doi.org/10.1007/978-1-4939-3578-9_17
Soares, E. F. de S., de MS Quintella, C. A., & Campos, C. A. V. (2017). Towards an Application for Real-Time Travel Mode Detection in Urban Centers. En Vehicular Technology Conference (VTC-Fall), 2017 IEEE 86th (pp. 1–5). IEEE.
https://doi.org/10.1109/VTCFall.2017.8288311
Sundaravadivel, P., Mohanty, S., Kougianos, E., Yanambaka, V., & Ganapathiraju, M.
(2018). Smart-Walk: An Intelligent Physiological Monitoring System for Smart
Families. En 2018 IEEE International Conference on Consumer Electronics (ICCE).
IEEE. https://doi.org/10.1109/ICCE.2018.8326065
Valero, C. S. (s. f.). Aplicación de métodos de aprendizaje automático en el análisis y la predicción de resultados deportivos (Application of automated learning methods for analyzing and predicting sports outcomes). Retos, (34), 377–382.
Verma, D., & Mishara, N. (2017). Comparative analysis of breast cancer and hypothyroid dataset using data mining classification techniques. En IEEE International Conference on Power, Control Signals and Instrumentation Engineering (ICPCSI-
2017). IEEE. https://doi.org/10.1109/ICPCSI.2017.8391987
Vijayan, V., & Anjali. (2015). Decision Support Systems for Predicting Diabetes Mellitus –A
Review. En Proceedings of 2015 Global Conference on Communication
Technologies(GCCT 2015). IEEE. https://doi.org/10.1109/GCCT.2015.7342631
Weka - University of Waikato. (2018). Recuperado de https://www.cs.waikato.ac.nz/ml/weka/