Code Monkey home page Code Monkey logo

alinaplakho / how-many-ads-do-we-see Goto Github PK

View Code? Open in Web Editor NEW
0.0 2.0 0.0 506 KB

Visual analysis of the amount of advertising in the urban environment using computer vision (U-Net + PSP-Net) || Визуальный анализ заполненности городской среды элементами рекламы с помощью компьютерного зрения (U-Net + PSP-Net)

advertising computer-vision psp-net u-net u-net-keras urban-environment ai keras

how-many-ads-do-we-see's Introduction

How-many-ads-do-we-see-?

Visual analysis of the amount of advertising in the urban environment using computer vision (U-Net + PSP-Net) || Визуальный анализ заполненности городской среды элементами рекламы с помощью компьютерного зрения (U-Net + PSP-Net)

PDF-файл с визуальными материалами - https://drive.google.com/file/d/1v0ffq4pYv2SAMInnPkagXIEkRLmf0ife/view?usp=share_link

На основе сегментации изображений проведем анализ количества рекламы в городской среде.Работа включает в себя анализ по следующим пунктам:

  • Рекламные экраны,стенды вдоль тротуаров и дорог и т.д.
  • Вывески-названия на фасадах зданий. Из результатов сегментации вычисляется соотношение площади рекламных элементов к площади кадра; Развитие темы взможно в:
  • Анализе заполненности элементами рекламы фасадов зданий, являющихся объектом культурного наследия и т.п.(актуально для КГИОП)
  • Анализе количества рекламы вдоль дорог - воздействие на фокус внимания водителя.

В Исследовании архитектура нейронной сети основана на комбинации U-Net и PSP-Net, что позволило добиться более четких и явных контуров сегмнентирования.


Based on image segmentation, we will analyze the amount of advertising in the urban environment. The work includes an analysis of the following points:

  • Advertising screens, stands along sidewalks and roads, etc.
  • Signboards-names on the facades of buildings. From the results of segmentation, the ratio of the area of advertising elements to the area of the frame is calculated; The development of the theme is possible in:
  • Analysis of the occupancy of the facades of buildings that are objects of cultural heritage, etc. with advertising elements (relevant for Department of Protection of Cultural and Historical Monuments)
  • Analysis of the amount of advertising along the roads - the impact on the focus of the driver's attention.

In the Study, the architecture of the neural network is based on a combination of U-Net and PSP-Net, which made it possible to achieve clearer and more explicit segmentation contours.

[Схема архитектуры сети || Architecture diagram] Схема архитектуры сети || Architecture diagram



Создана база из 480 фотографий и проведена сегментация изображений:

  • Экраны, плакаты, стенды и аналоги сегментированы красным цветом 250,0,0.
  • Текстовые вывески на фасадах сегментированы зеленым цветов 0,250,0.
  • Остальная часть фотографии - черным. Преимущественно угол обзора соответствует 60-80 градусам,при которых человеческое зрение воспринимает символы, также есть расширенный угол, условно соответствующий углузрения 120 градусов (периферийное зрение),что позволяет провести своего рода анализ того,сколько "лишней" информации мы наблюдаем в городской среде.

Формат изображений PNG, размер 4032х3024. Проведена аугментация - база расширена до 1.920 кадров. После первого этапа обучения - до 2.400 кадров.


A database of 480 photographs was created and image segmentation was carried out:

  • Screens, posters, stands and analogues are segmented in red 250.0.0.
  • Text signs on the facades are segmented in green 0.250.0.
  • The rest of the photo is in black. Mostly, the viewing angle corresponds to 60-80 degrees, at which human vision perceives symbols, there is also an extended angle, conditionally corresponding to 120 degree vision (peripheral vision), which allows us to conduct a kind of analysis of how much "extra" information we observe in the urban environment.

PNG image format, size 4032x3024 Augmentation was carried out - the base was expanded to 1.920 frames. After the first stage of training - up to 2.400 frames.

[Обучающая выборка || Training set] Обучающая выборка || Training set

[Реузльтаты обучения || Results] Реузльтаты обучения || Results Сколько рекламы? (1) || How many ads do we see? (1) Сколько рекламы? (2) || How many ads do we see? (2) Сколько рекламы? (3) || How many ads do we see? (3)

how-many-ads-do-we-see's People

Contributors

alinaplakho avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.