Code Monkey home page Code Monkey logo

oilcode-2024's Introduction

OilCode Hack 2024

Постановка задачи

Разработать модель, предсказывающую исследуемый параметр масла на основе представленных открытых и приватных обезличенных данных. Модель должна работать как при подаче только нескольких SMILES (как компонентов), так и при подаче параметров, похожих на свойства компонентов, как в приватных обезличенных данных (модель должна сама восполнить пропуски в них, если они будут).

Примерный план для решения задачи:

  1. Проанализировать данные
  2. Проанализировать публикации
    1. Увеличить размер выборки
  3. Рассмотреть способы преобразования SMILES в машиночитаемый вид
    1. Подумать над возможностью использования графовых нейронных сетей
    2. Подумать над возможностью использования трансформеров
    3. ? Подумать над возможностью использования квантово-химических дескрипторов
  4. Разработать 1 часть модели, способную предсказывать необходимый параметр по SMILES. ! Количество SMILES для одного масла может быть произвольным;
  5. Разработать 2 часть модели, предсказывающую нужный параметр по приватным обезличенным данным. ! При этом модель должна автоматически восполнять пропуски в данных, если таковые имеются.
  6. Собрать обе части модели в конвейер, оптимизировать гиперпараметры
  7. Оценить жизнеспособность модели на тестовых данных основными метриками
  8. Подготовить инференс
  9. Подготовить презентацию вашего решения

Полученная модель после загрузки в систему будет оцениваться при помощи MAE. В качестве приватной выборки будут использоваться экспериментальные данные, не предоставленные участникам для хакатона. Целевая переменная будет находится в столбце oil_property_param_value с совпаданием UUID в столбце oil_property_param_title - ad7e6027-00b8-4c27-918c-d1561f949ad8.

  • oil_property_param_title – название свойства каждого смазочного масла;
  • oil_property_param_value – значение свойства каждого смазочного масла;

Образ финального решения

Образ финального решения состоит из модели, способной предсказывать исследуемый параметр смазочного масла с произвольным количеством компонентов, как для компонентов представленных с помощью SMILES, так и для известных компонентов представленных экспериментальными параметрами из приватного обезличенного датасета. На рисунке представлен примерный образ финального решения.

Примерный образ финального решения

Загрузка решений

Загрузка решений будет осуществляться через платформу. Решение необходимо упаковать в zip архив. Zip архив должен содержать код модели и её инференс (ipynb или скрипт), а также ответы к предоставленным тестовым данным в формате файла csv, сохраняя последовательность. При загрузке архива csv файл с ответами вашего решения будет сверяться с правильными ответами и высчитываться MAE. Полученная ошибка будет использоваться при ранжировании лидерборда.

oilcode-2024's People

Contributors

xpos587 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.