Алгоритм построения стабильных деревьев в задаче регрессии

Статья

Авторы:
Мышлянов А. В., Темкин И. О.
DOI:
Полный текст:
Данная статья посвящена описанию алгоритма решающих деревьев, применительно к задаче регрессии, учитывающих динамическую стабильность целевой переменной и данных в листьях. В статье приведен обзор существующих решений, в рамках которого обсуждаются недостатки известных подходов. Описаны возможные варианты функций потерь, по-разному учитывающих нестационарный характер независимых переменных относительно целевой переменной.
Мышлянов Алексей Владимирович
Ассистент
https://orcid.org/0009-0007-9186-5016
avmysh@gmail.com
НИТУ МИСиС (д. 4, стр. 1., пр-т Ленинский, 119049 Москва, Россия)
Темкин Игорь Олегович
Доктор технических наук
Профессор
https://orcid.org/00000001-8150-6529
asu@misis.ru
Национальный исследовательский технологический университет «МИСИС» (д. 4, пр-т Ленинский, 119049 Москва, Россия)
Ahmed A. M., Rızaner A., Ulusoy A. H. A Decision Tree Algorithm Combined with Linear Regression for Data Classification. 2018 International Conference on Computer, Control, Electrical, and Electronics Engineering (ICCCEEE). (Sudan, Khartoum, 12 - 14 August 2018). https://doi.org/10.1109/iccceee.2018.8515759
Baier L., Hofmann M., Kühl N., Mohr M., Satzger G. Handling Concept Drifts in Regression Problems - the Error Intersection Approach. Proceed of 15[th] International Conference on Wirtschaftsinformatik (WI2020 Zentale Tracks) (Germany, Potsdam), pp. 210 - 224. https://doi.org/10.30844/wi_2020_c1-baier Gacar B. K., Kocakoç İ. D. Regression Analyses or Decision Trees? anisa e lal a ar iv ersitesi os al i limler e rgisi, 2020, vol. 18 (4), pp. 251 - 260. https://doi.org/10.18026/cbayarsos.796172
Grabczewski K., Jankowski N. Feature selection with decision tree criterion. Fifth International Conference on Hybrid Intelligent Systems (HIS'05). (Brazil, Rio de Janeiro, 6 - 9 November 2005). Rio de Janeiro, 2005. https://doi.org/10.1109/ICHIS.2005.43
Ikonomovska E., Gama J., Sebastião R., Gjorgjevik D. Regression Trees from Data Streams with Drift Detection. Lecture notes in computer science (LNAI), 2009, vol. 5808, pp. 121 - 135. https://doi.org/10.1007/978-3-642-04747-3_12
Kassim N. M., Santhiran S., Alkahtani A. A., Islam M. A., Tiong S. K., Yusof M. M., Amin N. An adaptive decision tree regression modeling for the output power of Large-Scale Solar (LSS) farm forecasting. Sustainability, 2023, vol. 15 (18). https://doi.org/10.3390/su151813521
Kushwah J. S., Kumar A., Patel S. C., Soni R., Gawande A., Gupta S. Comparative study of regressor and classifier with decision tree using modern tools. Materials Today Proceedings, 2023, vol. 56 (6), pp. 3571 - 3576. https://doi.org/10.1016/j.matpr.2021.11.635
Lima M., Neto M. A., Filho T. S., de a Fagundes R. Learning Under Concept Drift for Regression - A Systematic Literature Review. IEEE Access, 2022, vol. 10, pp. 45410 - 45429. https://doi.org/10.1109/access.2022.3169785
Loh W. Classification and regression trees. Wiley Interdisciplinary Reviews. Data Mining and Knowledge Discovery, 2011, vol. 1 (1), pp. 14 - 23. https://doi.org/10.1002/widm.8
Loh W. Fifty years of classification and regression trees. International Statistical Review, 2014, vol. 82 (3), pp. 329 - 348. https://doi.org/10.1111/insr.12016
Pietruczuk, L., Duda, P., Jaworski M. Adaptation of decision trees for handling concept drift. Lecture notes in computer science (LNAI), 2013, vol. 7894, pp. 459 - 473. https://doi.org/10.1007/978-3-642-38658-9_41
Rzazade U., Deryabin S., Temkin I., Kondratev E., Ivannikov A. On the Issue of the Creation and Functioning of Energy Efficiency Management Systems for Technological Processes of Mining Enterprises. Energies, 2023, vol. 16 (13), pp. 1 - 21. https://doi.org/10.3390/en16134878
Temkin I., Klebanov D., Deryabin S., Konov I. Construction of intelligent geoinformation system for a mine using forecasting analytics techniques. Gornyj Informacionno-analitičeskij û lletenʹ, 2020, vol. 3, pp. 114 - 125. https://doi.org/10.25018/0236-1493-2020-3-0-114-125
Yurdakul B., Naranjo J. D. Statistical properties of the population stability index. The Journal of Risk Model Validation, 2020, vol. 14, no. 4, pp. 89 - 100. https://doi.org/10.21314/jrmv.2020.227
Zhu L., Liu G., Chen D., Chen Z., Li X. An Intelligent Boosting and Decision-Tree-RegressionBased Score Prediction (BDTR-SP) Method in the Reform of Tertiary Education Teaching. Information, 2023, vol. 14 (6), pp. 1 - 13. https://doi.org/10.3390/info14060317
Ключевые слова:
регрессия, решающие деревья, динамическая стабильность, машинное обучение, регуляризация
Для цитирования:
Мышлянов А. В., Темкин И. О. Алгоритм построения стабильных деревьев в задаче регрессии // Вестник Череповецкого государственного университета. 2024. № 5 (122). С. 67–73. https://doi.org/10.23859/1994-0637-2024-5-122-6

Creative Commons LicenseКонтент доступен под лицензией Creative Commons Attribution 4.0 License.

Сайт использует файлы «cookie» с целью персонализации сервисов и повышения удобства пользования веб-сайтом. «Cookie» представляют собой небольшие файлы, содержащие информацию о предыдущих посещениях веб-сайта. Cookie-файлы позволяют, например, сохранить единожды выполненные текстовые вводы в полях формуляров Сайта, благодаря чему их не требуется вводить заново при следующем посещении Сайта или при переходе между отдельными функциями Сайта. Продолжая использовать наш сайт и нажимая на кнопку «Согласен», вы даете согласие на обработку файлов cookie. Если вы не хотите использовать файлы «cookie», измените настройки своего браузера. Также сообщаем о том, что на сайте используются сервисы веб-аналитики Яндекс-Метрика и top.mail.ru. Подробнее
Согласен