El sistema de recomendación híbrido realizado se compone de dos etapas o subsistemas de recomendación secuenciales, uno basado en contexto y el otro basado en filtrado colaborativo. El sistema realiza predicciones de hoteles que probablemente sean de preferencia para un usuario teniendo en cuenta los tipos de viaje que ha tenido el usuario, el gusto o peso de dichos viajes y las calificaciones a los hoteles, tanto del usuario mismo, como de usuarios similares a él. En el procesamiento se pesan los puntajes a predecir teniendo en cuenta detalles como cantidad de votos, contexto preferido, ratings promedio, relevancia, normalización y similaridad de usuarios para mejorar la precisión. En caso de que un usuario sea nuevo, se le asignan recomendaciones globales según las votaciones ya existentes de otros usuarios. Los dos sub sistemas trabajan de forma independiente para luego combinar sus resultados en las recomendaciones finales. El sistema de recomendación está hecho a partir de un dataset de TripAdvisor el cual contiene las experiencias de los usuarios teniendo en cuenta los hoteles donde ha estado, su puntaje, zona horaria y el tipo de viaje que puede ser sólo, familiar, en pareja, negocios o con amigos. El dataset consta de alrededor de 14 mil datos registrados, 2300 hoteles y 2200 usuarios.
Cabe mencionar que el dataset es bastante limpio al contener 0 datos nulos y una distribución organizada y confiable de los datos y sus columnas, por lo que la etapa de preprocesamiento o limpieza de datos fue realmente breve.