Comments (5)
Bài blog em gửi có thông tin cũng ko thống nhất nên a tóm tắt lại một số vđề trc khi trả lời câu hỏi của e nhé:
- Bài blog vẽ mô hình 1 kiểu và thực hành 1 kiểu. Thực hành dùng thư việc gensim (ko hề dùng RNN) và mô hình lại vẽ dùng RNN. Gợi ý: nên thay RNN bằng Learning Word Representation và giải thích là có thể dùng gensim để thực hiện.
- Câu hỏi tiếp theo là gensim dùng mô hình nào để học? Để nói kỹ thì sẽ không khác gì em lôi paper word2vec của Mikolov ra đọc, a tóm tắt sơ qua như sau. Em tạo một NN với 3 layers là
input layer
,hidden layer
, vàoutput layer
. Sau đó đẩy dữ liệu học dưới dạng bài toán biết một từ và đoán từ bên cạnh nó - neighbor words (chính là mô hình Skip-Gram, còn mô hình CBOW là ngược lại - cho từ bên cạnh và đoán từ ở giữa (center word)). Sau khi train xong rồi e vứtoutput layer
đi chỉ giữ lạihidden layer
thì cáihidden layer
này chính là word representation củađống text
ban đầu. Chú ýinput layer
vàoutput layer
có kích thước bằng nhau và chính là vocab_size. - Mô hình tương tự trên đều được gensim làm sẵn rồi, e chỉ feed dữ liệu vào là ok. Nếu ko dùng gensim thì sao? Đương nhiên ko dùng gensim, e cũng có thể tự tạo 1 neural network (dùng keras hoặc TF).
Về câu hỏi của em:
- Làm thế nào để RNN học language model thì em đọc bài
Recurrent neural network based language model
của Mikolov. E chú ý cái hình 1 trong bài báo có đoạn context (t) -> context (t-1). Đây chính là đoạn RNN trong mô hình này. Về cơ bản RNNLM là version cũ được Mikolov giới thiệu năm 2010. Mô hình mất nhiều thời gian train trong khi hiệu quả kém. - Tại sao lại gọi Word2vector là kết quả của một mô hình học nông của mạng nơ ron RNN ạ???
Câu này nằm trong đoạn giải thích ở trên của anh. Chỉ cần 1 hidden layer e đã có good representation củađống text
ban đầu.
from word2vecvn.
Em xem ở folder word2vec-simple-visualization
có gì ko hiểu ko? E làm theo hướng dẫn là ok thôi. Word2vec khi train đc thiết kế là two-layer neural network em nhé (ko phải là deep). Em xem 2 mô hình phổ biến được mô tả trong bài báo word2vec là SKIP-GRAM và CBOW để hiểu hơn.
from word2vecvn.
Dạ Vâng! Em cảm ơn anh, mong anh có thật nhiều sức khoẻ, niềm vui, thuận lợi để có thể tạo ra nhiều sản phẩm dành cho người việt.
from word2vecvn.
à, anh ơi! em có một thắc mắc khi đọc bài báo này "Cách tạo Word2vec Tiếng việt" từ link sau:
https://streetcodevn.com/blog/w2vvn
khi em đọc bài này có đoạn sau em thắc mắc, chưa hiểu. Em tra mạng rồi mà không có thông tin để tìm hiểu. Đoạn em thắc mắc, chưa hiểu là "văn bản Tiếng Việt đã tách từ là đầu vào của mạng nơ ron Recurrent Neural Network (RNN) để cho ra mô hình Work2Vector. Work2Vector là kết quả của một mô hình học nông của mạng nơ ron Recurrent Neural Network. ". Anh cho em hỏi là:
*) làm thế nào để mạng RNN tạo ra mô hình Word2vec khi truyền đầu vào là văn bản tiếng việt đã tách từ???
*) Tại sao lại gọi Word2vector là kết quả của một mô hình học nông của mạng nơ ron RNN ạ???
Nếu nằm trong tầm hiểu biết về RNN, phạm vi nghiên cứu của anh, em mong nhận được sự giải thích từ anh. Em cảm ơn anh rất nhiều
from word2vecvn.
Em cảm ơn anh. Anh giải thích thật cặn kẽ. Cảm ơn anh nhiều nhé!!!
from word2vecvn.
Related Issues (9)
- DeprecationWarning HOT 1
- The dictionary has some problem HOT 1
- em chào anh , em không tải được file data , phiền anh cho em xin data được không ạ HOT 1
- deal with unknow word HOT 3
- Word tokenizer HOT 2
- Tạo dữ liệu HOT 1
- other-models-n-examples HOT 1
- Giúp em với ạ HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from word2vecvn.