目前 Batch Inference 的后台已经基本可用，现在将新版本前端的需求汇总如下。注：因为前端模型载入未完成，暂时请使用 <div class="

Config.toml 已移动至 assets</code

<a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

界面截图功能无法使用。 Prompt最好改成： <div class="snippet-clipboard-conten

v0.3 前后端需求汇总 about ai00_server HOT 5 CLOSED

ai00-x commented on June 15, 2024

v0.3 前后端需求汇总

from ai00_server.

Comments (5)

cgisky1980 commented on June 15, 2024 1

好我回来了

from ai00_server.

cryscan commented on June 15, 2024 1

Config.toml已移动至assets目录下。注意，启动项--model已经改为--config。

from ai00_server.

cgisky1980 commented on June 15, 2024

@cryscan 前端目前需要的接口汇总

已经完成：

✔ Fix /models 接口，返回更多信息，目前这个接口不正常返回信息。

模型的运行状态：是否加载成功

/load 提交的参数

模型型号等信息

❤❤❤💥💥💥 已完成！

✔ Fix 所有API 添加 /api/ 前缀

用以区分网页访问和 API 的区别，避免http路径的冲突

网页访问统一 '/' 和 ‘/plugin/xxxx’ 路径下

API访问，统一在 '/api/xxxxx' 路径下

修改所有老的api 路径

❤❤❤💥💥💥 已完成！

✔ Add 多个 zip 文件，http访问需求

默认 "/" 请求，读取 assets/www目录下的 index.zip 文件

www.zip 移入 assets/www目录，改名index.zip ，

"/plugin/[name]" 请求自动读取 assets/www目录下的 [name].zip 文件

拒绝 api.zip 命名的文件，避免和api 冲突

❤❤❤💥💥💥 已完成！

这里比如http://127.0.0.1:65530/apps/chat/base-channel 中 apps这样的一级目录，只有三种情况，

/api 指到各个api的请求

/plugin /plugin/docs/* 读取 assets/www/docs.zip 里面文件没有的话输出 docs.zip 的 index.html
3 其他全都读取 assets/www/index.zip 里面文件没有的话输出 index.html

✔ Add /api/listfiles 新增接口需求

Post 一个 assets 下的目录名，返回目录下的文件列表（可指定扩展名，默认返回所有文件）

返回文件名、文件大小、文件的MD5或者SHA值

Config.toml 移入 assets/configs 目录

❤❤❤💥💥💥 已完成！

✔ Add /api/unzip 新增接口需求

Post 一个zip 或者 rar 文件地址、需要解压到的目录地址（绝对目录or相对目录）、需要保存的目录名

如有相同文件夹名，先删除文件夹，再解压

❤❤❤💥💥💥 已完成！

✔ Add /api/GPUs 接口需求或者 /adapters

返回支持VULKAN的GPU型号和对应的序号

/load 接口应该加入 adapter 参数

❤❤❤💥💥💥 已完成！

☢ Add /api/unload 接口需求

卸载已加载的模型

❤❤❤💥💥💥 已完成！

☢ Add /api/saveconfig 新增接口需求

Post savename参数可指定保存的文件名（只有文件名,扩展名可固定为toml）

toml参数指定文件内容，根据KV，保存为toml文件

文件只保存在 assets/configs 目录

❤❤❤💥💥💥 已完成！

☢ Add /api/loadconfig 新增接口需求

Post 参数指定要读取的文件名（只有文件名，扩展名可固定为toml）

文件只读取在 assets/configs 目录以及子目录中

返回jason格式

❤❤❤💥💥💥 已完成！

尚未完全完成

❗ `废弃` /api/state `新增接口需求` 改由前端实现

CPU、GPU、内存占用、显存占用、最大内存、最大显存 ……等等信息
模型相关信息是否运行、模型型号信息）
SSE方式每0.5秒推送一次

☢ Add `/api/ban` 接口需求

进行 N次 100tokens 生成测试取平均值
可并行测试

☢ /api/models/load 接口修改

原来的参数结构

pub struct ReloadRequest {
    /// Path to the model.
    pub model_path: PathBuf,
    /// List of LoRA blended on the model.
    pub lora: Vec<config::Lora>,
    /// Specify layers that needs to be quantized.
    pub quant: usize,
    /// Whether to use alternative GEMM kernel to speed-up long prompts.
    pub turbo: bool,
    /// Maximum tokens to be processed in parallel at once.
    pub token_chunk_size: usize,
    /// The chunk size for each split of the head matrix.
    pub head_chunk_size: usize,
    /// Maximum number of batches that are active at once.
    pub max_runtime_batch: usize,
    /// Number of states that are cached on GPU.
    pub max_batch: usize,
    /// the (reversed) number of layer at which the output is as embedding.
    pub embed_layer: usize,
    /// Path to the tokenizer.
    pub tokenizer_path: PathBuf,
    /// Adapter selection.
    pub adapter: AdapterOption,
}

增加一个 quant_type : FP32 FP16 INT8 NF4 去除 turbo（据说 turbo = FP16 ？）

from ai00_server.

cgisky1980 commented on June 15, 2024

@cryscan 更新了一下需求描述和进度，新增了一两个API接口需求

from ai00_server.

cryscan commented on June 15, 2024

界面截图功能无法使用。
Prompt最好改成：

User: Hi.

Assistant: Hello! I'm your AI assistant. I'm here to help you with various tasks, such as answering questions, brainstorming ideas, drafting emails, writing code, providing advice, and much more.

User: What's the date today?

Assistant: It's ...

请不要取随机生成的名字。十分违和而且没有用。
设置里面的max_runtime_batch和max_batch失效。

from ai00_server.

v0.3 前后端需求汇总 about ai00_server HOT 5 CLOSED

Comments (5)

已经完成：

✔ Fix `/models` 接口，返回更多信息，目前这个接口不正常返回信息。

✔ Fix 所有API 添加 /api/ 前缀

✔ Add 多个 zip 文件，http访问需求

✔ Add `/api/listfiles` 新增接口需求

✔ Add `/api/unzip` 新增接口需求

✔ Add `/api/GPUs` 接口需求或者 /adapters

☢ Add `/api/unload` 接口需求

☢ Add `/api/saveconfig` 新增接口需求

☢ Add `/api/loadconfig` 新增接口需求

尚未完全完成

❗ `废弃` /api/state `新增接口需求` 改由前端实现

☢ Add `/api/ban` 接口需求

☢ /api/models/load 接口修改

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

Comments (5)

已经完成：

✔ Fix /models 接口，返回更多信息，目前这个接口不正常返回信息。

✔ Fix 所有API 添加 /api/ 前缀

✔ Add 多个 zip 文件，http访问需求

✔ Add /api/listfiles 新增接口需求

✔ Add /api/unzip 新增接口需求

✔ Add /api/GPUs 接口需求 或者 /adapters

☢ Add /api/unload 接口需求

☢ Add /api/saveconfig 新增接口需求

☢ Add /api/loadconfig 新增接口需求

尚未完全完成

❗ 废弃 /api/state 新增接口需求 改由前端实现

☢ Add /api/ban 接口需求

☢ /api/models/load 接口修改

Related Issues (20)

Recommend Projects

Recommend Topics

Recommend Org

✔ Fix `/models` 接口，返回更多信息，目前这个接口不正常返回信息。

✔ Add `/api/listfiles` 新增接口需求

✔ Add `/api/unzip` 新增接口需求

✔ Add `/api/GPUs` 接口需求或者 /adapters

☢ Add `/api/unload` 接口需求

☢ Add `/api/saveconfig` 新增接口需求

☢ Add `/api/loadconfig` 新增接口需求

❗ `废弃` /api/state `新增接口需求` 改由前端实现

☢ Add `/api/ban` 接口需求