Code Monkey home page Code Monkey logo

chatux-server-rwkv-jp's Introduction

chatRWKV に WebチャットUI(chatux) をつける

What is this?

chatRWKV を chatux を使って Web チャットボットにする

ライセンス

Apache 2.0。 本プロジェクト内に内包されているコードは https://github.com/BlinkDL/ChatRWKV をベースにしています。

動作確認環境

  • Python: 3.9
  • GPU CUDA Version: 12
  • GPU memory: 24GB
  • OS: Ubuntu Desktop 22.04 / Windows 11

How to run

STEP1:clone

本プロジェクトをクローンする

https://github.com/riversun/chatux-server-rwkv

STEP2: 関連パッケージのインストール

関連パッケージをインストールします。(※)

pip install rwkv fastapi uvicorn

(既に CUDA版 pytorch が動作する環境がある前提です。もし実行時エラーが出たら、必要に応じて足りないパッケージをインストールします)

STEP3: 学習済モデルデータ(重み)の入手

モデルデータには 3b,7b,14b と種類があり、数値が大きいほど、多くのパラメータをもっているので、表現力が高いということになります。 パラメータ数が多いほどGPUのメモリを消費しますので、実行環境にあわせてデータをダウンロードします。

以下は、モデルデータの種類と消費GPUメモリです。

fp16i8 (fp16学習済データを int8 に量子化する という意味と思われる) をつかえば、 Accuracy はやや落ちるようですが、使用GPUメモリ容量を減らすことができます。

コード内で指定するときは cuda fp16cuda fp16i8 のように指定します

strategy rwkv-4-pile-14b rwkv-4-pile-7b rwkv-4-pile-3b
fp16 28GB 16GB 6GB
fp16i8 14GB 8.6GB 3GB

以下から、重みデータ(*.pth)のファイルをダウンロードします。

BlinkDL/rwkv-4-pile-14b の入手

BlinkDL/rwkv-4-pile-14b

  • ダウンロード

  • 消費GPUメモリ

    • 約28GB(fp16) ... メモリ 24GB クラスの GPU でも Out of memory になる
    • 約14GB(fp16i8) ...多少 Accuracy が落ちるらしいが T4でも動作する
  • パラメータ

args.n_layer = 40
args.n_embd = 5120
args.ctx_len = 8192
BlinkDL/rwkv-4-pile-7b の入手

BlinkDL/rwkv-4-pile-7b

args.n_layer = 32
args.n_embd = 4096
args.ctx_len = 4096
BlinkDL/rwkv-4-pile-3b の入手

BlinkDL/rwkv-4-pile-3b

args.n_layer = 32
args.n_embd = 2560
args.ctx_len = 4096

ダウンロードしたファイルは [project]/data フォルダに置きます

STEP4: 学習済モデルデータ(重み)をコード内にセットする

chatux-server-rwkv.py を開いて

  • #specify RWKV strategy,model(weight data) のあたりに、以下のように STRATEGY=MODEL_NAME があるので、それぞれ入力します。 MODEL_NAME はファイル名だけでOK。
  • # specify params for weight data のあたりに、学習済モデルデータ用のパラメータを記載します。↑に示したもののコピペでもOK
# specify RWKV strategy,model(weight data)
STRATEGY = 'cuda fp16i8'
MODEL_NAME = 'RWKV-4-Pile-7B-20230109-ctx4096.pth'

# specify params for weight data
args.n_layer = 32
args.n_embd = 4096
args.ctx_len = 4096

STEP5: チャットサーバーの起動

python chatux-server-rwkv.py

STEP6: 実行

サーバーが起動したらブラウザで http://localhost:8001 を開く

デモ動画

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.