박지훈 | 박인창 | 이헌득 |
---|---|---|
Github | Github | Github |
※ 전체 3위 (정확도 기준 1위 - 약 96%)
- RoBERTa, KoBERT, KoELECTRA benchmark
- Framework
- Preprocessing with KoSpacing, py-hanspell
- Oversampling to Data Augument
- Ensemble
DocVQA
├─ configs
│ └─ baseline.yaml
├─ dataloader
│ └─ custom_dataloader.py
├─ model
│ ├─ custom_model_old.py
│ └─ custom_model.py
├─ trainer
│ └─ BaselineTrainer.py
├─ utils
│ ├─ metric.py
│ ├─ seed.py
│ └─ wandb.py
├─ .gitignore
├─ requirements.txt
├─ train.py
└─ inference.py
- KoELECTRA
- KoBERT
- Klue/RoBERTa
- PyKoSpacing
- py-hanspell