有没有可能，实现可以通过和AI对话(不管是webui还是命令行)，得到一系列聊天记录。对ai某些回答不满意，可以强制修改聊天记录，最终使得对话符合预期。

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model) <p dir=

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model) <ol s

讨论一下实时微调的技术实现可能性?,about yuanzhoulvpi2017/zero_nlp

Comments (11)

zhaodice commented on May 14, 2024 1

而且，在现有的微调基础上，用(新训练集+旧训练集)继续训练，与重新开始微调相比，loss下降的会很快，相当于loss就是从数据变化的那部分开始下降了~如果你重头微调，loss会从头下降，慢。

求教继续训练的示例代码有吗？我按这个代码 mymusise/ChatGLM-Tuning#14 (comment) 貌似没有在上次的checkpoint继续，貌似loss还是重头开始的，没有下降的很快

去找 hcgf 这个项目

from zero_nlp.

zhaodice commented on May 14, 2024

而且随着训练…参数似乎在增加?能在不改变参数量的情况下微调模型吗#(通过逐步覆盖一些用不到的参数，通过牺牲模型的其他功能，实现总参数不变的微调)

from zero_nlp.

zhaodice commented on May 14, 2024

我自己验证好了，可以实现，写了个webui可以实时修改对话，并把对话写入训练集，现在还差最后一个技术难题

from zero_nlp.

safehumeng commented on May 14, 2024

而且随着训练…参数似乎在增加?能在不改变参数量的情况下微调模型吗#(通过逐步覆盖一些用不到的参数，通过牺牲模型的其他功能，实现总参数不变的微调)

为什么参数会增加呢，每次训练都用一个新的lora层么

from zero_nlp.

zhaodice commented on May 14, 2024

而且随着训练…参数似乎在增加?能在不改变参数量的情况下微调模型吗#(通过逐步覆盖一些用不到的参数，通过牺牲模型的其他功能，实现总参数不变的微调)

为什么参数会增加呢，每次训练都用一个新的lora层么

难道不是，训练集越大，参数越多吗…

from zero_nlp.

yuanzhoulvpi2017 commented on May 14, 2024

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)
然后你又训练了一次，这一次是peft(peft(base_model))
然后你又训练了一次，这一次是peft(peft(peft(base_model)))
这样下去，肯定参数越来越大。
因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。
直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

from zero_nlp.

zhaodice commented on May 14, 2024

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)

然后你又训练了一次，这一次是peft(peft(base_model))

然后你又训练了一次，这一次是peft(peft(peft(base_model)))

这样下去，肯定参数越来越大。

因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。

直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

事实上我已经跑通了，hcgf这项目，多次继续微调，微调文件.pt永远是16MB，似乎没有出现嵌套情况（不过每次微调都要加上以前的老数据，否则会出现灾难性遗忘）

from zero_nlp.

huangxd- commented on May 14, 2024

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)

然后你又训练了一次，这一次是peft(peft(base_model))

然后你又训练了一次，这一次是peft(peft(peft(base_model)))

这样下去，肯定参数越来越大。

因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。

直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

事实上我已经跑通了，hcgf这项目，多次继续微调，微调文件.pt永远是16MB，似乎没有出现嵌套情况（不过每次微调都要加上以前的老数据，否则会出现灾难性遗忘）

如果不加老数据会遗忘，必须加上的话，跟从预训练模型重新训练有什么区别？

from zero_nlp.

zhaodice commented on May 14, 2024

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)

然后你又训练了一次，这一次是peft(peft(base_model))

然后你又训练了一次，这一次是peft(peft(peft(base_model)))

这样下去，肯定参数越来越大。

因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。

直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

事实上我已经跑通了，hcgf这项目，多次继续微调，微调文件.pt永远是16MB，似乎没有出现嵌套情况（不过每次微调都要加上以前的老数据，否则会出现灾难性遗忘）

如果不加老数据会遗忘，必须加上的话，跟从预训练模型重新训练有什么区别？

有区别啊，因为我一开始【并没有】这么多数据集，我先喂一点数据，得到微调1.0，和微调1.0交互得到新数据，人工修改后加入数据集。

重新微调得到微调2.0，继续交互得到新数据再并入以前的旧数据集。
就这样，数据良品率越来越高，随着并入数据越来越多，自然训练效果越来越好。

如果你一次性就有这么多数据，一次训练成本是最低的，但没这么多数据怎么办呀，就需要一步一步一边训练一边引导AI自己产生训练集了。

from zero_nlp.

zhaodice commented on May 14, 2024

而且，在现有的微调基础上，用(新训练集+旧训练集)继续训练，与重新开始微调相比，loss下降的会很快，相当于loss就是从数据变化的那部分开始下降了~如果你重头微调，loss会从头下降，慢。

from zero_nlp.

huangxd- commented on May 14, 2024

而且，在现有的微调基础上，用(新训练集+旧训练集)继续训练，与重新开始微调相比，loss下降的会很快，相当于loss就是从数据变化的那部分开始下降了~如果你重头微调，loss会从头下降，慢。

求教继续训练的示例代码有吗？我按这个代码 mymusise/ChatGLM-Tuning#14 (comment) 貌似没有在上次的checkpoint继续，貌似loss还是重头开始的，没有下降的很快

from zero_nlp.

讨论一下实时微调的技术实现可能性? about zero_nlp HOT 11 CLOSED

Comments (11)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent