Рубрик
Исследователи из лаборатории Yandex Research разработали новую нейросетевую архитектуру для работы с табличными данными — TabM. Она успешно конкурирует с классическими моделями градиентного бустинга — CatBoost, XGBoost и LightGBM, которые долгое время считались лучшим решением для табличных данных. Где её можно использовать: в бизнесе, исследованиях и медицине. Модели для работы с табличными данными помогают оптимизировать поставки, спрогнозировать энергопотребление, классифицировать пациентов по риску заболеваний. Например, на Kaggle — платформе для международных соревнований по ML и анализу данных — TabM применяли, чтобы предсказывать выживаемость пациентов после трансплантации костного мозга. Призёры и победители, которые использовали TabM для этой и других задач, получили призовые в 60 тысяч долларов. Важная особенность: в TabM эффективно реализован «ансамбль моделей». То есть несколько моделей проводят свой анализ, после чего прогноз усредняется. Это позволяет как давать точные прогнозы, так и эффективно использовать вычислительные ресурсы. ↗ Архитектура TabM доступна разработчикам и исследователям — на GitHub: github.com/yandex-research/tabm. Подробнее о ней читайте в научной статье — на arXiv: arxiv.org/abs/2410.24210.
1 фото
Исследователи из лаборатории Yandex Research разработали новую нейросетевую архитектуру для работы с табличными данными — TabM
Рубрики
Информационные технологии и Телеком