Predicción de la intencion de compras usando árboles de decisión

Autores/as

  • Dario Šebalj
  • Jelena Franjković
  • Kristina Hodak

DOI:

https://doi.org/10.29352/mill0204.01.00155

Palabras clave:

Modelo, Compra, Árbol de decisión

Resumen

Introducción: El precio se considera un elemento descuidado del marketing-mix debido a la complejidad de la gestión de precios y la sensibilidad de los clientes en los cambios de precios. Esto lleva a reacciones más rápidas de los clientes a ese cambio. En consecuencia, el proceso de toma decisiones de compra puede ser muy desafiante para el cliente.

Objetivo: Crear un modelo capaz de predecir la intención de la compra y clasificar a los encuestados en una de las dos categorías, dependiendo de si pretenden comprar o no. 

Métodos: La muestra de datos consta de 305 encuestados, que son personas mayores de 18 años involucrados en la compra de productos de alimentación para su hogar. La investigación se realizó en febrero de 2017. Con el fin de crear un modelo, se utilizó el método de árboles de decisión con sus diversos algoritmos de clasificación.

Resultados: Todos los modelos, excepto el que utilizó el algoritmo RandomTree, lograron una tasa de clasificación relativamente alta (más del 80%). La precisión de clasificación más alta del 84,75% se dio con los algoritmos J48 y RandomForest. Dado que no hay diferencia estadísticamente significativa entre los dos algoritmos, los autores decidieron elegir el algoritmo J48 y construir un árbol de decisión.

Conclusiones: El valor del dinero y el nivel de precios en la tienda fueron las variables más significativas para la clasificación de la intención de compra. Planes futuros de estudio para comparar este modelo con algunas otras técnicas de data mining, tales como redes neuronales o máquinas vectoriales de apoyo, ya que estas técnicas lograron muy buena precisión en algunas investigaciones previas en este campo. 

Descargas

Citas

Bouckaert, R. R., Frank, E., Hall, M., Kirkby, R., Reutemann, P., Seewald, A., & Scuse, D. (2016). WEKA Manual for Version 3-8-0.

Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5-32. doi: 10.1023/A:1010933404324

Crone, S. F., & Soopramanien, D. (2005). Predicting customer online shopping adoption-an evaluation of data mining and market modelling approaches. DMIN. pp. 215-221.

Franjković, J. (2017). Prices and price image of retailer. Thesis of the postgraduate specialist study. Osijek: Faculty of Economics in Osijek.

Ganchev, T., Zervas, P., Fakotakis, N., & Kokkinakis, G. (2006). Benchmarking Feature Selection Techniques on the Speaker Verification Task. Fifth International Symposium on Communication Systems, Networks And Digital Signal Processing, pp. 314-318.

Hall, M. A., & Holmes, G. (2003). Benchmarking Attribute Selection Techniques for Discrete Class Data Mining. IEEE Transactions on Knowledge and Data Engineering, 15(3), 1437-1447. doi: 10.1109/TKDE.2003.1245283

Hssina, B., Merbouha, A., Ezzikouri, H., & Erritali, M. (2014). A comparative study of decision tree ID3 and C4.5. International Journal of Advanced Computer Science and Applications, 4(2), 13-19.doi: 10.14569/SpecialIssue.2014.040203

Kalmegh, S. (2015). Analysis of WEKA Data Mining Algorithm REPTree, Simple Cart and RandomTree for Classification of Indian News. IJISET - International Journal of Innovative Science, Engineering & Technology, 2(2), 438-446. Retrieved from http://ijiset.com/vol2/v2s2/IJISET_V2_I2_63.pdf

Liaw, A., & Wiener, M. (2002). Classification and regression by randomForest. R news, 2(3), 18-22. Retrieved from https://www.r-project.org/doc/Rnews/Rnews_2002-3.pdf

Mitchell, T. M. (1997). Machine Learning. McGraw-Hill.

Oreški, D. (2014). Evaluation of contrast mining techniques for feature selection in classification. doctoral thesis, Varaždin: Faculty of Organization and Informatics.

Ozer, P. (2008). Data Mining Algorithms for Classification. BSc Thesis Artificial Intelligence, Radboud University Nijmegen.

Quinlan, R. J. (1987). Generating Production Rules from Decision Trees. IJCAI, 87, 304-307. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.98.9054&rep=rep1&type=pdf

Quinlan, R. J. (1996). Improved Use of Continuous Attributes in C4.5. Journal of Arti, 4, 77-90. doi: 10.1613/jair.279

Rokach, L., & Maimon, O. (2014). Data Mining with Decision Trees: Theory and Applications. World scientific.

Shi, F., & Ghedira, C. (2016). Intention-based Online Consumer Classification for Recommendation and Personalization. In Hot

Topics in Web Systems and Technologies (HotWeb), 2016 Fourth IEEE Workshop on, pp. 36-41.

Suchacka, G., & Stemplewski, S. (2017). Application of Neural Network to Predict Purchases in Online Store: Information Systems Architecture and Technology: Proceedings of 37th International Conference on Information Systems Architecture and Technology–ISAT 2016–Part IV, Springer International Publishing, pp. 221-231.

Vandamme, J.-P., Meskens, N., & Superby, J.-F. (2007). Predicting Academic Performance by Data Mining Methods. Education Economics, 15(4), 405-419. doi: 10.1080/09645290701409939

Vieira, A. (2015). Predicting online user behaviour using deep learning algorithms. arXiv preprint arXiv:1511.06247.

Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Burlington: Morgan Kaufmann Publishers.

Yulihasri, Islam, A., & Daud, K. A. K. (2011). Factors that Influence Customers’ Buying Intention on Shopping Online. International Journal of Marketing Studies. 3(1), 128-139. doi http://dx.doi.org/10.5539/ijms.v3n1p128

Zhang, M., Chen, G., & Wei, Q. (2015). Discovering Consumers' Purchase Intentions Based on Mobile Search Behaviors. In Andreasen T. et al. (Eds), Flexible Query Answering Systems 2015: Vol. 400. Advances in Intelligent Systems and

Computing (pp. 15-28). doi: 10.1007/978-3-319-26154-6_2

Zielke, S. (2010). How price image dimensions influence shopping intentions for different store formats. European Journal of Marketing, 44(6), 748-770. Doi: 10.1108/03090561011032702

Zielke, S. (2006). Measurement of retailers’ price images with a multiple-item scale. Journal of Retailing and Consumer Services.15(5), 335-347.

Zuo, Y., & Yada, K. (2014). Using bayesian network for purchase behavior prediction from RFID data. In 2014 IEEE International Conference on Systems, Man and Cybernetics (SMC), IEEE, pp. 2262-2267. doi: 10.1109/SMC.2014.6974262

Descargas

Archivos adicionales

Publicado

2017-09-29

Cómo citar

Šebalj, D., Franjković, J., & Hodak, K. (2017). Predicción de la intencion de compras usando árboles de decisión. Millenium - Journal of Education, Technologies, and Health, 2(4), 13–22. https://doi.org/10.29352/mill0204.01.00155

Número

Sección

Ingenierías, Tecnología, Gestión y Turismo