Code Monkey home page Code Monkey logo

Comments (5)

sonvx avatar sonvx commented on June 24, 2024 2

Bài blog em gửi có thông tin cũng ko thống nhất nên a tóm tắt lại một số vđề trc khi trả lời câu hỏi của e nhé:

  1. Bài blog vẽ mô hình 1 kiểu và thực hành 1 kiểu. Thực hành dùng thư việc gensim (ko hề dùng RNN) và mô hình lại vẽ dùng RNN. Gợi ý: nên thay RNN bằng Learning Word Representation và giải thích là có thể dùng gensim để thực hiện.
  2. Câu hỏi tiếp theo là gensim dùng mô hình nào để học? Để nói kỹ thì sẽ không khác gì em lôi paper word2vec của Mikolov ra đọc, a tóm tắt sơ qua như sau. Em tạo một NN với 3 layers là input layer, hidden layer, và output layer. Sau đó đẩy dữ liệu học dưới dạng bài toán biết một từ và đoán từ bên cạnh nó - neighbor words (chính là mô hình Skip-Gram, còn mô hình CBOW là ngược lại - cho từ bên cạnh và đoán từ ở giữa (center word)). Sau khi train xong rồi e vứt output layer đi chỉ giữ lại hidden layer thì cái hidden layer này chính là word representation của đống text ban đầu. Chú ý input layeroutput layer có kích thước bằng nhau và chính là vocab_size.
  3. Mô hình tương tự trên đều được gensim làm sẵn rồi, e chỉ feed dữ liệu vào là ok. Nếu ko dùng gensim thì sao? Đương nhiên ko dùng gensim, e cũng có thể tự tạo 1 neural network (dùng keras hoặc TF).

Về câu hỏi của em:

  1. Làm thế nào để RNN học language model thì em đọc bài Recurrent neural network based language model của Mikolov. E chú ý cái hình 1 trong bài báo có đoạn context (t) -> context (t-1). Đây chính là đoạn RNN trong mô hình này. Về cơ bản RNNLM là version cũ được Mikolov giới thiệu năm 2010. Mô hình mất nhiều thời gian train trong khi hiệu quả kém.
  2. Tại sao lại gọi Word2vector là kết quả của một mô hình học nông của mạng nơ ron RNN ạ???
    Câu này nằm trong đoạn giải thích ở trên của anh. Chỉ cần 1 hidden layer e đã có good representation của đống text ban đầu.

from word2vecvn.

sonvx avatar sonvx commented on June 24, 2024 1

Em xem ở folder word2vec-simple-visualization có gì ko hiểu ko? E làm theo hướng dẫn là ok thôi. Word2vec khi train đc thiết kế là two-layer neural network em nhé (ko phải là deep). Em xem 2 mô hình phổ biến được mô tả trong bài báo word2vec là SKIP-GRAM và CBOW để hiểu hơn.

from word2vecvn.

cuong369 avatar cuong369 commented on June 24, 2024

Dạ Vâng! Em cảm ơn anh, mong anh có thật nhiều sức khoẻ, niềm vui, thuận lợi để có thể tạo ra nhiều sản phẩm dành cho người việt.

from word2vecvn.

cuong369 avatar cuong369 commented on June 24, 2024

à, anh ơi! em có một thắc mắc khi đọc bài báo này "Cách tạo Word2vec Tiếng việt" từ link sau:
https://streetcodevn.com/blog/w2vvn
khi em đọc bài này có đoạn sau em thắc mắc, chưa hiểu. Em tra mạng rồi mà không có thông tin để tìm hiểu. Đoạn em thắc mắc, chưa hiểu là "văn bản Tiếng Việt đã tách từ là đầu vào của mạng nơ ron Recurrent Neural Network (RNN) để cho ra mô hình Work2Vector. Work2Vector là kết quả của một mô hình học nông của mạng nơ ron Recurrent Neural Network. ". Anh cho em hỏi là:
*) làm thế nào để mạng RNN tạo ra mô hình Word2vec khi truyền đầu vào là văn bản tiếng việt đã tách từ???
*) Tại sao lại gọi Word2vector là kết quả của một mô hình học nông của mạng nơ ron RNN ạ???
Nếu nằm trong tầm hiểu biết về RNN, phạm vi nghiên cứu của anh, em mong nhận được sự giải thích từ anh. Em cảm ơn anh rất nhiều

from word2vecvn.

cuong369 avatar cuong369 commented on June 24, 2024

Em cảm ơn anh. Anh giải thích thật cặn kẽ. Cảm ơn anh nhiều nhé!!!

from word2vecvn.

Related Issues (9)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.