Привет! Меня зовут Галина Харнахоева, и я начинающий data scientist. Здесь я представила часть моих проектов.
Основной опыт у меня - учебные проекты по специальности data scientist, сейчас прохожу курс Deep Learning School. Благодаря предыдущим местам работы разбираюсь в банковском и страховом бизнесе.
Мне нравится работать с данными, экспериментировать, я отлично умею переводить с бизнесового языка и обратно.
Контакты:
- Почта: [email protected]
- Telegram: @kharnakhoeva
Используемые технологии: Python, NumPy, Sklearn, Seaborn, PyTorch, Matplotlib, Plotly, CatBoost, XGBoost, LightGBM, SQL.
- «Росэлторг» — zakupkiHack 2.0
Проект | Задачи проекта | Стек |
---|---|---|
Объем стабильной части средств на депозитных счетах | На основании данных об объемах стабильной части средств на депозитных счетах клиентов банку нужна модель, которая оценивает объем стабильной части средств на дату | NumPy, Pandas, Python, Matplotlib |
Проект | Задачи проекта | Стек |
---|---|---|
Промышленная обработка стали | Чтобы оптимизировать производственные расходы, металлургический комбинат ООО «Так закаляем сталь» решил уменьшить потребление электроэнергии на этапе обработки стали. Задача: построить модель, которая предскажет температуру стали | Python, Matplotlib, Seaborn, NumPy, Sklearn, CatBoost, LightGBM, XGBoost |
Проект | Задачи проекта | Стек |
---|---|---|
Определение возраста по фото | Задача: построить модель, которая по фотографии человека могла бы предсказывать его возраст | Python, Keras |
Классификация комментариев | Интернет-магазин «Викишоп» запускает новый сервис - пользователи могут редактировать и дополнять описания товаров, как в вики-сообществах. Задача: найти инструмент, который будет искать токсичные комментарии и отправлять их на модерацию | BERT, Pandas, Python, nltk, tf-idf |
Прогнозирование количества заказов такси на следующий час | Компания «Чётенькое такси» собрала исторические данные о заказах такси в аэропортах. Задача: найти модель предсказания количества заказов такси на следующий час | Pandas, Python, Sklearn, statsmodels |
Определение стоимости автомобиля | Сервис по продаже автомобилей с пробегом «Не бит, не крашен» разрабатывает приложение, чтобы привлечь новых клиентов. В нём можно будет узнать рыночную стоимость своего автомобиля. Задача: построить модель, которая умеет определять рыночную стоимость автомобиля | Pandas, Python, LightGBM |
Защита персданных | Необходимо защитить данные клиентов страховой компании «Хоть потоп». Задача: разработать метод преобразования данных, чтобы по ним было сложно восстановить персональные данные | NumPy, Python, Sklearn |
Предсказание коэффициента восстановления золота из золотосодержащей руды | Задача: подготовить прототип модели машинного обучения для «Цифры». Модель должна предсказать коэффициент восстановления золота из золотосодержащей руды. Модель поможет оптимизировать производство, чтобы не запускать предприятие с убыточными характеристиками | Matplotlib, NumPy, Pandas, Python, Sklearn |
Выбор локации для скважины | «ГлавРосГосНефти» нужно решить, где бурить новую скважину. Задача: построить модель для определения региона, где добыча принесёт наибольшую прибыль | Pandas, Sklearn, бутстреп |
Прогнозирование оттока клиентов | Из «Бета-Банка» стали уходить клиенты. Банковские маркетологи посчитали: сохранять текущих клиентов дешевле, чем привлекать новых. Есть исторические данные о поведении клиентов и расторжении договоров с банком. Задача: спрогнозировать, уйдёт клиент из банка в ближайшее время или нет | Matplotlib, Pandas, Sklearn |
Рекомендация тарифов | Оператор мобильной связи «Мегалайн» хочет построить систему, способную проанализировать поведение клиентов и предложить пользователям новый тариф. Задача: построить модель для задачи классификации, которая выберет подходящий тариф | Matplotlib, Pandas, Python, Sklearn |
Предсказание продаж на следующий год | Интернет-магазин детских товаров хочет получить прогноз продаж на следующий год, исходя из данных текущего года | Pandas, Python, Prophet |
Проект | Задачи проекта | Стек |
---|---|---|
Выявление закономерностей, определяющих коммерческую успешность игры | Интернет-магазин «Стримчик» продаёт по всему миру компьютерные игры. Задача: выявить определяющие успешность игры закономерности. Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании | Pandas, Math, NumPy, Matplotlib, SciPy, Seaborn |
Определение перспективного тарифа для телеком-компании | Компания «Мегалайн», федеральный оператор сотовой связи, предлагает клиентам два тарифных плана. Задача: сделать предварительный анализ тарифов на небольшой выборке клиентов, чтобы понять, какой тариф приносит больше денег | Python, Pandas, Matplotlib, NumPy, SciPy |
Исследование объявлений о продаже квартир | Задача: научиться определять рыночную стоимость квартир, в частности установить параметры рыночной стоимости квартир | Python, Pandas, Matplotlib |
Исследование надёжности заёмщиков | Задача: понять, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок | Pandas, Python |
Сравнение поведения пользователей Яндекс.Музыки | Задача: на реальных данных Яндекс.Музыки c помощью библиотеки Pandas и её возможностей проверить данные и сравнить поведение и предпочтения пользователей двух столиц — Москвы и Санкт-Петербурга | Pandas, Python |