Comments (2)
안녕하세요.
말씀하신 CNN, RNN과 BERT, GPT2에서 sigmoid가 있고 없는 점에 대한 차이를 말씀해주셨는데요.
CNN, RNN에서 마지막 레이어에 activation function이 sigmoid가 되어있는 역할을 BERT와 GPT2에서는 SparseCategoricalCrossentropy
함수에 from_logits
에서 설정을 합니다. 해당 값이 True
로 되어있는 경우 probablistic distribution으로 표현을 해줍니다. 함수 명칭이 Categorical이라는 이름이 명시되어있는 것을 보아 softmax 함수를 사용할 것으로 보입니다.
CNN, RNN 모델에서도 마찬가지로 BinaryCrossentropy
함수에서도 마찬가지로 from_logits
설정을 True
로 해주시면 마지막 레이어에 sigmoid를 지정할 필요가 없습니다.
더 궁금한점이 있으시면 커멘트를 남겨주세요.
from tensorflow-ml-nlp-tf2.
더 이상 진행하는 내용이 없어 close 합니다.
from tensorflow-ml-nlp-tf2.
Related Issues (20)
- 2장 27페이지 합성곱 신경망 ValueError HOT 2
- Docker gpu image 빌드 중 오류 HOT 4
- 05_텍스트 유사도 전처리 부분 HOT 4
- Git에 변경된 사항 책 정오표에도 갱신 해주시면 감사하겠습니다. HOT 1
- konlpy Okt() HOT 2
- quora-question-pairs-( xg-boost 기법에 TF-IDF 적용방식에 대해서) HOT 2
- [7장 사전 학습 모델] Naver NLP Challenge 데이터를 구해야하는데 어디서 구하는지 모르겠습니다. HOT 2
- requirements.txt 설치하려고 하니 certifi에서 계속 걸려있네요 HOT 12
- NameError: name 'DATA_IN_PATH' is not defined HOT 1
- it takes too long time installing requirements. HOT 6
- 7.2.1.bert_finetune_NSMC.ipynb에서 오류가 발생하는 부분이 있네요 HOT 5
- 02_자연어 처리 개발 준비 - 더미 데이터를 활용한 감정 분석 모델링 HOT 5
- [6장 챗봇만들기] seqence to sequence model weights load HOT 1
- BahdanauAttention 에 대해 질문이 있습니다. HOT 1
- Input layer 뉴런 개수에 관한 문의드립니다. HOT 1
- 형태소 분석시 빈칸을 없애는 이유를 알고 싶습니다..
- seq2seq 챗봇관련 질문이 있습니다.
- 4.1.7 CNN_Classification 실행시 kernel이 죽는 문제가 생깁니다
- wordcloud version issue
- tensorflow2.6.0 호환성
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from tensorflow-ml-nlp-tf2.