Code Monkey home page Code Monkey logo

misochallenge-infants's People

Contributors

datathoninfo avatar jun-pyo-park-phd avatar

Watchers

 avatar

misochallenge-infants's Issues

[가이드] NSML 실행관련 FAQ

대회 운영 규칙

Q. 리더보드 제출 마감시간은 어떻게 되나요?

https://ai.nsml.navercorp.com/ranking 에서 남은 시간 및 leaderboard확인 가능합니다.

Q. 데이터셋은 제공 받을 수 있나요? / 데이터셋이 다운받아지지 않습니다

데이터셋은 다운되지 않으며 NSML 상에서만 이용가능합니다.

Q. NSML 상에서 학습중인 모델을 Submit하게되면 학습이 진행중인 세션은 정지가되나요?

각 세션은 독립된 구조여서 상호 영향을 주지 않습니다. submit세션과 학습 세션은 영향이 없으며, 학습 도중, 중간 model submit을 진행하여도 학습 세션에는 전혀 영향이 없습니다.

실행환경

Q. nsml에서 외부 python package를 설치할 수 있나요?

A) setup.py를 통하여 추가 설치를 할 수 있습니다. 예) install_requires=[ 'visdom', 'numpy' ]

Q. setup.py에는 항상 #nsml로 시작해야하나요?

setup.py에 첫 줄에 있는 #nsml: ... 은 nsml에서 docker Hub에 있는 외부 Docker image를 사용할 때만 적으면 됩니다. 실제로, 샘플로 제공된 kin과 movie review 예제 중에서 한쪽만 #nsml: ... 형식을 취하고 있습니다. 이곳에 아무것도 적지 않으면, nsml은 nsml사용을 위해서 생성해둔 기본 docker image를 사용하게 됩니다.

Q. nsml에서 pythone이외의 lib를 사용할 방법이 있나요?

네에, 몇가지 조건을 만족하면 외부 lib를 사용할 수 있습니다. 일단, docker image를 생성하여 setup.py의 맨 위줄 #nsml: ... 형식으로 docker image의 이름을 명시하여야 합니다. 관련 내용은 아래 링크에서 참고하실 수 있습니다. https://github.com/naver/ai-hackathon-2018/blob/master/missions/tutorial.md#%EB%AA%A8%EB%8D%B8-%EA%B5%AC%ED%98%84%ED%95%98%EA%B8%B0

Q. NSML 실행환경이 궁금합니다.

기본 "nsml/default_ml:latest" 환경을 쓰신다면 https://ai.nsml.navercorp.com/support 여기서 확인할 수 있으며
세션 로그를 보시면 상단에 pytorch version이 출력되어서 확인 가능하십니다.
​support 페이지에 제공된거 이외 환경을 사용하고 싶으시면 아래 페이지에서 나온 방법을 통해 다른 환경을 사용 할 수 있습니다.

Q. 세션 실행중 kill 되거나 메모리 부족 현상이 있습니다.

할당된 메모리보다 더많은 메모리를 요구할때 위와같은 에러가 발생하면서 oom으로 죽게됩니다. https://n-clair.github.io/ai-docs/_build/html/en_US/contents/web_interface/usage_of_resources.html 보시면,
GPU, CPU, CPU-RAM 사용량을 확인하실 수 있습니다. 문제가 되는 부분은 CPU-RAM 부분으로 예상됩니다. 자원을 계속 할당만 하고, 반환하지 않는 구조여서 발생할 것으로 예상됩니다.

Q. nsml에서 pip install은 어떻게 하나요?

setup.py의 install_requires에 모듈을 적으면 됩니다.

image


nsml run

Q. nsml run에서 구동할 수 있는 코드는 제약이 있나요?

nsml run시 별도 설정이 없을 경우 main.py를 기본적으로 전송하게 됩니다. 현재는 python코드만 전송 및 수행이 가능하도록 제한을 두고 있습니다. 또한 파일명 또한 .으로 시작하면 upload할 수 없도록 막혀있습니다.

Q. nsml run에서 'No machine available'가 나와요.

nsml에서 준비한 모든 GPU 자원을 사용중에 발생하는 메시지로, 주로 참가자가 몰리는 시간에 발생하는 경향이 있습니다. 다른 참가자의 session이 종료되면 다시 사용가능하게 되므로 보통은 10-20분 정도 후에 재실행하면 됩니다.

Q. session에서 최대로 사용할 수 있는 GPU 수는 얼마입니까?

이번 해커톤에서는 session당 최대 2개로 제한하고 있습니다. nsml run -g 2 ... 옵션으로 두 개의 GPU를 사용할 수 있습니다.

Q. submit을 했는데, leaderboard에 반영이 안됩니다.

leaderboard에 제출된 값중에서 가장 좋은 결과 1건만 보여주고 있기 때문에 leaderboard에는 표시가 안됩니다. 다만 제출한 내용은 leaderboard의 public 탭을 private으로 변경하시면 됩니다.

Q. nsml 이용해서 만든 모델을 제가 로컬에 다운로드 가능한가요?

현재 공식적으로 모델을 다운받는건 지원하고 있지 않습니다.

Q. run_nsml.sh 실행시 총 파일 수가 100개를 넘을 수 없다는 에러 메시지가 나옵니다.

nsml run 할때 main.py가 있는 파일과 폴더 전체를 올리게 되는데요, 그 파일 전체의 개수가 100개이상일때 발생하는 에러입니다. (폴더가 있다면 폴더하위까지 탐색하면서 전체올리게 됩니다) main.py와 같은 위치에 .nsmlignore파일을 만들어서 제외하고 싶은 파일, 폴더 이름을 적으면 run할때 해당 파일과 폴더는 제외시키고 업로드하게 됩니다.(.gitignore와 비슷하게 동작합니다)

Q. NSML 상에서 이미 학습된 세션의 모델을 다시 불러와서 학습할 수 있는 방법이 있나요?

nsml.load 기능을 사용하시면 손쉽게 가능합니다. 형식은 nsml.load(checkpoint='best',session="세션이름") 입니다

Q. 세션을 돌리던 중, 데이터셋 읽는 과정에서 connection reset by peer에러가 발생했습니다.

pytorch의 multiporcess 처리 관련 코드에서 발생한 에러로 보입니다.

Q. 좀비 세션을 삭제하고 싶습니다.

좀비세션에 대해서는 terminal에서 nsml rm -f team(번호)/sr-hack-2019-dataset/(세션) 으로 하시면 삭제 가능하십니다.

nsml submit

Q. NSML submit 을 할 경우에는 cpu를 변경이 가능한가요?

submit 을 할 경우에는 cpu를 변경할수가 없습니다.

Q. nsml submit을 하면 main.py 에 있는 bind_model, nsml.paused 코드에서 test set에 대해 evaluate을 한 후 세션이 끝나는 건가요?

bind_model, nsml.bind에 arguments로 넘겨진 load, infer함수를 실행 후에 종료됩니다.

Q. NSML Submit 할때 internal server error 가 발생합니다.

nsml submit -t 로 하시면 에러 로그를 확인하실 수 있습니다.

[FAQ] 자주 문의하는 내용

Q. 특별한 개발 지식이나 언어 사용 경험이 없어도 참여 가능한가요?
기본 베이스라인 코드를 제공하지만, 팀당 최소 1명 이상 python/tensor flow/nsml을 이용한 AI개발 경험자가 있는 팀이 유리합니다.

Q. 참가 신청 후 데이터톤 참가 가능 여부는 어떻게 확인 할 수 있나요?
참가 대상자들을 선별하여 대회전 개별 메일 안내드립니다.

Q. AI 챌린지 실시간 랭킹, 진출팀 현황을 확인하고 싶어요!
NSML 리더보드를 확인해주세요. 별도의 로그인없이도 확인이 가능하고, SNS를 통해 친구들에게 공유해보세요!

Q. 데이터톤은 모든 팀원이 참석해야 하나요?
모든 팀원이 참석하는 게 원칙입니다. 피치 못할 사정이 발생 한다면 먼저 문의를 해 주세요.

Q. NSML은 언제 사용해 볼 수 있나요?
데이터톤을 위한 NSML은 본선 당일부터 사용할 수 있습니다.

Q. NSML 사용법은 어디서 확인 할 수 있나요?
아래 튜토리얼과 document를 참고 하십시오.

튜토리얼 동영상: https://www.youtube.com/watch?v=21ylProAbxA (동영상 길이 13분 31초)
NSML document: https://n-clair.github.io/ai-docs/_build/html/ko_KR/index.html

Q. NSML에서 사용하는 언어는 뭔가요?
NSML은 네이버에서 개발한 머신러닝 클라우드 플랫폼입니다.CLI와 웹 등의 인터페이스를 통해 클라우드 자원을 사용할 수 있습니다. tensorflow, Keras, Pytorch 등을 비롯해 파이썬 기반의 머신 러닝 라이브러리는 대부분 사용할 수 있습니다.

Q. NSML에서 사용하는 GPU 사양은 어떻게 되나요?
GPU는 P40 2장달린 서버 1대를 제공합니다

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.