Code Monkey home page Code Monkey logo

tudien's Introduction

Từ điển tiếng Việt dành cho máy đọc sách Kindle, Kobo, Pocketbook v.v.

Mã nguồn cho từ điển dành cho máy đọc sách Kindle. Để sử dụng từ điển, download tại đây http://catusf.github.io/.

Ghi chú

SSH Private Key

  • Khi tạo khởi động CodeSpace để dev, thực hiện lệnh sau để đồng bộ SSH Private Key từ CodeSpace secret vào SSH Agent
eval $(ssh-agent -s) 
ssh-add <(echo "$SSH_PRIVATE_TUDIEN_CODESPACE") 

Submodules

  • Sau đó sync submodule về bằng lệnh
git submodule update --init --recursive

Tại sao?

Do tôi thấy cần:

  • Có các từ điển có chất lượng để giúp việc học hỏi của bản thân và mọi người
  • Lập trình viên bất kỳ có thể dùng dữ liệu đầu vào ở đây để tạo output khác
  • Có thể dễ dàng bổ sung từ điển - chỉ cần tạo 1 file văn bản phân cách bằng dấu \t (.tab) và 1 file mô tả .dfo

Các từ điển cần:

  • Chính xác và dễ tra cứu
  • Dùng được trên nhiều thiết bị (Kindle, Kobo, Onyx, mobile và PC apps)

Các bước cách tạo ra file từ điển

  1. Cài Python 3.x
  2. Tạo mới hay sửa file định nghĩa từ điển (như ../dict/TudienAnhVietBeta.tab)
  3. Chạy dòng lệnh createhtml.bat để tạo ra các file .html (có format OPFcho ebook ebook) dùng chương trình Python tab2opf.py
  4. Sửa file .opf nếu cần (tham khảo các file *-org.opf)
  5. Chạy createmobi.bat để tạo từ điển Kindle sử dụng công cụ mobigen.exe của Amazon. Các từ điển nằm trong thư mục ../dict

Việc còn lại là copy file .mobi vừa được tạo ra bằng dây cáp USB vào thư mục documents trên Kindle để bắt đầu sử dụng.

graph LR;
    GenMetadat(File mô tả <.dfo>) --> GenTab(File định nghĩa <.tsv>);
    GenTab -- tool tab2opf --> HTML_File(File <.opf/html>) -- mobigen --> KindleDict(Từ điển Kindle <.mobi>);
    GenTab -- chạy PyGlossary --> EpubDict(Từ diển <.epub>);
    GenTab --  chạy PyGlossary --> KoboDict(Từ diển Kobo <.kobo.zip>);
    GenTab --  chạy PyGlossary --> StarDict(Từ diển StarDict <.ifo>);
    GenTab --  chạy PyGlossary --> dictd(Từ diển dictd <.index>);
    GenTab --  chạy DSL Tools --> DSLDict(Từ diển Lingvo <.dsl.dz>);
Loading

Danh sách các từ điển và số từ hiện có

  1. Từ điển Hán Việt Thiền Chửu (9'897)
  2. Từ điển Anh Việt Beta (106'059 với 28'400 dạng từ thay thế - inflection)
  3. Từ điển phật học tổng hợp (49'569)
  4. Từ điển Phật Quang (16'973)
  5. Từ điển Phật học Việt Anh - Thiện Phúc (24'767)
  6. Từ điển Phật học Anh-Hán-Việt (3'914)
  7. Ngữ vựng Danh từ Thiền học (302)
  8. Từ điển Đạo Uyển (3'262)
  9. Từ điển Phật học Việt Anh - Đồng Loại (7'847)
  10. Từ điển Phật học Việt Anh - Minh Thông (9'113)
  11. Phật Quang Đại từ điển (Hán ngữ) (22'900)
  12. Rộng mở tâm hồn (1'347)
  13. Từ điển Phật học Tinh tuyển (2'918)

Chat với tác giả

Join the chat at https://gitter.im/catusf/tudienanhviet

Release all dictionaries

tudien's People

Contributors

catusf avatar catusphan avatar ilius avatar gitter-badger avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.