The klasifikasi-sms-spam-with-gradio from arisdwi666

arisdwi666 / klasifikasi-sms-spam-with-gradio Goto Github PK

View Code? Open in Web Editor NEW

Klasifikasi SMS Spam Berbahasa Indonesia Menggunakan Metode Multinomial Naive Bayes

Jupyter Notebook 0.52% Python 88.71% PowerShell 0.01% Batchfile 0.01% JavaScript 7.85% Cython 1.61% C 0.49% C++ 0.17% Shell 0.01% Svelte 0.35% TypeScript 0.14% HTML 0.05% CSS 0.04% Roff 0.01% Lua 0.01% Meson 0.01% Fortran 0.05% Forth 0.01% Smarty 0.01% VBScript 0.01%

klasifikasi-sms-spam-with-gradio's Introduction

Klasifikasi SMS Spam Berbahasa Indonesia Menggunakan Metode Multinomial Naive Bayes & Feature Selection Chi-Square dan Deploy menggunakan Gradio - Hosting menggunakan Hugging Face

Dataset diambil dari github https://github.com/ksnugroho/klasifikasi-spam-sms/ dengan jumlah data 1143 data. 569 data untuk SMS Normal, 335 data untuk Peniuan/Fraud, 239 data untuk Promo.

Permasalahan : SMS spam adalah pesan yang tidak diinginkan atau tidak diminta oleh pengguna, yang dapat mengganggu, menipu, atau bahkan merugikan pengguna.

Tujuan : Untuk mengklasifikasikan spam SMS dan mengembangkan sebuah sistem klasifikasi SMS spam berbahasa Indonesia yang efektif dan akurat menggunakan metode Multinomial Naive Bayes.

Model : Menggunakan algoritma klasifikasi Multinomial Naive Bayes (MNB) untuk mengklasifikasikan SMS menjadi spam atau non-spam berdasarkan fitur-fitur yang diekstrak.

Langkah-langkah penyelesaian meliputi:

Data Acquisition
Text Pre-processing
1. Case Folding
2. Filtering
3. Stopword
4. Stemming
Feature Engineering
1. Feature Extraction - BoW & TF IDF
2. Feature Selection - Chi-Square
Modelling (Machine Learning)
Model Evaluation
Deployment

Performa Model : Jumlah prediksi benar : 211

Jumlah prediksi salah : 18

Akurasi pengujian : 92.13973799126637 %

Confusion matrix:

[[106 1 1]

[ 6 64 1]

[ 6 3 41]]

Classification report:

           precision    recall  f1-score   support

       0       0.90      0.98      0.94       108
       1       0.94      0.90      0.92        71
       2       0.95      0.82      0.88        50
accuracy                           0.92       229

macro avg 0.93 0.90 0.91 229

weighted avg 0.92 0.92 0.92 229

Akurasi setiap split: [0.91266376 0.89956332 0.930131 0.89956332 0.91266376 0.91266376

0.94759825 0.89519651 0.89519651 0.89082969]

Rata-rata akurasi pada cross validation: 0.9096069868995634

Proses deployment:

Load Model yang sudah disimpan
Install Gradio
Buat initerface untuk gradio nya
siapkan requirements.txt
unggah file yang dibutuhkan seperti notebooks, file app.py, requirements, datasetnya.

Link Web App nya : Arisdwi/gradio-sms-classifier

Recommend Projects

arisdwi666 / klasifikasi-sms-spam-with-gradio Goto Github PK

klasifikasi-sms-spam-with-gradio's Introduction

klasifikasi-sms-spam-with-gradio's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent