Broken and Undroken pill images Classification
- Load image link from data.csv and save it to File system
- image preprocessing -> image segmentation
- Manually omitting some of the pills
- Classification with CNN Models
- VGG16
- GoogLeNet
- ResNet50
Broken Pill Classification CNN Model
Broken and Undroken pill images Classification
우선 AlexNet을 돌려보았을 때, 성능이 안나오는 것을 확인하였고,
모델은 batch size = 8, epochs = 64, optimizer = adam, loss function = categorical_crossentropy를 사용
batch size가 클 경우 memory error가 발생함... 이 문제도 해결해야함(resourceExhaustedError)
-> 이에 대해 데이터의 개수가 적은 것을 이유로 생각하였습니다.
또한 혈액 대용제, 기타의말초신경용약 등의 특정 알약에 대한 데이터가 10개가 넘지 않는 것을 확인하였습니다.
한번 이에 대한 데이터를 삭제하고 진행한 이후, 성능이 더 향상되지 않는지 확인해보겠습니다.
그리고 예측 변수에 대해 다시 한 번 생각해 보았습니다. 모든 약이 원형이기 때문에 약의 색상만으로 약의 분류명을 예측하는 과제인데, 성능이 안나오는게
에 대한 고찰을 해보았습니다. 근데 http://m.dailypharm.com/newsView.html?ID=198983 이 사이트에 의거하면 약의 색상이 약의 분류명과 관련이 있다고 합니다.
전처리 관련 연구 링크 : https://github.com/emmaremy/pill-images
모델 관련 연구 링크
알약부분만 segmentation한 후
위와 같은 이미지를 얻고 싶은데
의약품 안전나라 : https://nedrug.mfds.go.kr/cntnts/80
위의 사이트에서 제공하는 공공데이터 개방 목록에 "의약품 낱알 식별" 라는 .csv 엑셀 데이터를 활용하였으며, 칼럼 중 '큰 제품 이미지' 칼럼에 첨부되어 있는 링크를 다 가져와서 이미지를 저장하였습니다.
개방 사이트에서는 데이터 사용 권한을 다음과 같이 명시하였습니다.
이 데이터를 논문에서 사용할 수 있는건가요? 위의 내용 중
"공공기관이 이용자에게 정보를 재활용할 수 있도록 제공하고, 제공받은 정보를 상업적, 비영리적으로 이용할 권한을 부여하는 것" 이라고 명시되어 있는데, 출처만 밝히면 되는 거 아닌가요?
문제 배경 : 대형 병원에서 환자의 호전 상태에 따라 처방이 바뀌거나 하는 일이 발생하면, 조제되었으나 투약되지 않은 약은 회수하게 된다. 약사는 이렇게 회수된 수백 종류의 알약을 재분류하는 작업을 하고 있다.
문제 정의 : 이미지의 색상 정보를 가지고 약품명 예측하기, 글자 인식 X -> 인간의 직관과 비슷한 모델을 만들기 위함(보다 직관적인)
< 모델 구조 >
detection + classification
전처리 단계 또는 모델 내 레이어 : 이미지에서 알약 detection 하기
INPUT : 이미지 RGB 3채널의 픽셀값
OUTPUT : 약품명
OUTPUT이 여러 개인 경우 고려 O -> multi-label classification
진행 순서 : ① 비교논문 서치 ② 전처리 방식 제고 ③ adobe 연구원의 antialiased-cnn 모델 적용하기
abode 모델 링크 : https://github.com/adobe/antialiased-cnns
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.