<div class="snippet-clipboard-content notranslate position-relative overflow-auto" data-snippet-clip

谢谢你的回答哈，我理解您的意思是 <|user|> 讲个故事 <|assistant|></c

从 chat 接口内部调用 generate 接口的处理逻辑看，使用上述拼接方式生成的 input_ids 不符合你们对于特殊符（如<|user|>、<|assistant|>）的 id 定义，这部分是否只是为了兼容通用的 generate 接口？且存在对模型性能的损失？ about chatglm3 HOT 3 CLOSED

Tesla-jiang commented on September 26, 2024

从 chat 接口内部调用 generate 接口的处理逻辑看，使用上述拼接方式生成的 input_ids 不符合你们对于特殊符（如<|user|>、<|assistant|>）的 id 定义，这部分是否只是为了兼容通用的 generate 接口？且存在对模型性能的损失？

from chatglm3.

Comments (3)

zRzRzRzRzRzRzR commented on September 26, 2024

这个是我们训练的时候用的special token，模板是这样，所以对话需要使用这种模板
chat方案出来的编码是能对上的呀

在glm-4仓库中我们做了一个对齐apply_chat_template的版本

from chatglm3.

Tesla-jiang commented on September 26, 2024

另我看到了你们新上线的 THUDM/glm-4-9b-chat，这个是 chatGLM3 的迭代版本么？或者是功能相同，但底层路线有很大差异的模型才在命名上做出区别？
我也看到了 glm-4-9b-chat 里的 apply_chat_template 方法，我会先仔细研究下，谢谢您的回答和指导哈，祝心情愉悦，笑口常开，手动笔芯

from chatglm3.

zRzRzRzRzRzRzR commented on September 26, 2024

是GLM3 的迭代，技术路线是相同的，
关于你提到的模板。
预训练模型不存在模板一说，模板是chat模型才有的哦。
也就是在微调的时候，如果微调chat模型，才要求严格根据模板的。

from chatglm3.

Comments (3)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent