Comments (14)
55개의 column 이 있다고 나오네.
이제부터는 문제 정의를 해보도록 하자.
어떤 column 에 있는 값을 맞출지 골라봐-
from pill_classification.
우선 has_image 칼럼이 TRUE값인 것들만 가져오고, medicine_name칼럼을 맞추는 걸 목표로 할 거 같습니다.
from pill_classification.
오키. 그럼 데이터 전체를 다운받아보고,
데이터 중에서 사용할 row와 column 을 추리는 작업부터 시작해보자.
위 작업이 되고 나면,
데이터로부터 feature 정의할 방법을 생각해봐.
image 만 사용할지, 아니면 다른 attribute 도 feature로 쓸지..
from pill_classification.
그런데 medicine_name칼럼에 총 9670개의 unique value가 있는데 분류를할때 다 다른 레이블로 예측해버리면 어떻게되나요?
from pill_classification.
한 그림에 여러 개의 약이 있는경우는 없어?
Unique label 개수가 줄어들거같은데.
from pill_classification.
한 그림에 하나의 약만 있는 거 같습니다!
데이터를 우선 필터링 한 이후에 중점적으로 확인해봐야 할 부분인 거 같습니다.
from pill_classification.
응, medicine_name 칼럼의 unique value 들을 한번 살펴봐봐.
혹시 2개 이상의 이름이 들어있지는 않은지..
from pill_classification.
확인 결과 medicine_name 칼럼에 'butalbital and acetaminophen'과 같이 'and'로 이어진 약 이름이나 'Dextroamphetamine Saccharate, Amphetamine Aspartate Monohydrate, Dextroamphetamine Sulfate and Amphetamine Sulfate'과 같이 ','로 연결관 약 이름을 발견하였습니다!
from pill_classification.
그리고 새롭게 알아낸 사실로는
- 분류할 class개수는 1979 개이며, 전체 이미지 개수는 8781개
- 'splimage' 칼럼의 벨류와 이미지의 이름이 매칭되는 것을 확인
- 'splimprint' 칼럼의 벨류는 약에 프린팅된 텍스트임
from pill_classification.
저는 splimprint와 이미지에서 도출된 정보로만 학습하는 모델을 만들려합니다
from pill_classification.
제완이형이 정리하신 연구관련 자료 : https://www.notion.so/5e21edcaef404e35aacc6538d7d3bb7d
from pill_classification.
그렇구나.
이제부터는 '비교대상', 즉 최근에 수행된 연구들 중에서 실험을 통해 비교할 'rival method'를 정하도록 하자.
찾을 때,
github 등에 코드를 공개해놓은 것이면 가장 좋고,
코드와 데이터까지 공개했다면 금상첨화야.
2개정도 찾아보면 적당할 것 같네.
from pill_classification.
그러면 연구자료 찾고 새로운 이슈로 찾아뵙겠습니다! ^^
주말 잘 보내세요 교수님
from pill_classification.
- 참고
from pill_classification.
Related Issues (6)
- 관련 연구 HOT 12
- 문제 정의 HOT 13
- Pill segmentation!! Help HOT 17
- 논문 공공데이터 사용 가능 여부 HOT 2
- 모델 결과 문제 HOT 13
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from pill_classification.