Code Monkey home page Code Monkey logo

vkintern_0424's Introduction

VKIntern_0424 Большагин Вячеслав

Результирующие метрики: Average NDCG@5: 0.5881107326687397; Average NDCG@50: 0.7476370126497026; Average MAP@5: 0.24654899015189452; Average MAP@50: 0.22244712491686655;

Все метрики были вычислены внутри отдельных запросов и усреднены В целом, получилась достаточно хорошей, так как большинство документов в целом находятся рядом с целевыми позициями. Однако MAP указывает, что модель редко когда угадывает точное местоположение документа. Хотя и сама метрика MAP@k не является в полной мере репрезентативной (как и подобные метрики, учитывающие только совпадение идеального и предсказанного местоположения документа), так в данном датасете очень малое количество уровней рангов - в основном 0 и 1, что делает сложным вычисление MAP и подобных.

Что было сделано

Анализ данных на:

  • пропуски
  • повторяющиеся записи
  • особенности данных
  • корреляцию признаков (с последующей очисткой)

Признаки были отмасштабированы MaxAbsScaler'ом

В качестве модели был выбран CatBoostRanker, параметры для которого были подобраны с помощью кросс-валидации. Была также проверена гипотеза о необходимости удаления коррелирующих признаков. Получившиеся модели были сохранены с помощью модуля pickle. (из-за большого размера моделей не получилось загрузить их в репозиторий)

P.S. В результате одного из тестовых запусков была получена модель со следующими метриками (она была сохранена): Average NDCG@5: 0.6739929401048327; Average NDCG@50: 0.7936437279188054; Average MAP@5: 0.31785316864185165; Average MAP@50: 0.2746504691059156;

Однако повторить данные метрики (даже с полным копированием всех параметров модели) не удалось ни разу, поэтому называть их рабочими нет возможности

vkintern_0424's People

Contributors

bvyaches avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.