关于继续训练（continue finetuning）

Question

你好，感谢分享。
是否可以理解为，在垂类应用上，构造好预料，替换sh中的data_path，然后运行sh文件就能在你们分享的模型权重下继续进行训练，以得到一个应用于

Facico · Answer

<p dir="auto"><a class="user-mention notranslate" data-hovercard-type="user" data-hovercard-url="/us

Facico · Answer

<p dir="auto">你可以参考我们在医学问答的案例<a href="https://github.com/Facico/Chinese-Vicuna/blob/master/docs/perf

creamiracle · Answer

你可以参考我们在医学问答的案例

Facico · Answer

1、这个是用于生成的参数，在generate那些推理脚本那种有
2、因为你要用新的数据，不能跳过他们
3、这里的逻辑是拼接，就是把20w的数据重复拼接3.5

creamiracle · Answer

1、这个是用于生成的参数，在generate那些推理脚本那种有 2、因为你要用新的数据，不能跳过他们 3、这里的逻辑是拼接，就是把20w的数据重复

Facico · Answer

1、不是先复制成20w（因为我们医疗问答的规模就是20w），是直接复制成70w
2、因为我们提供的优化器参数是一轮70w的，所以是直接在这个规模上提供的contin

creamiracle · Answer

您好，我理解了，那如果我按照您的方式继续训练，也需要变成70w的数据，是这个意思吧？
2中这个参数是在哪里定义

Facico · Answer

是的，如果不到70w会自动重复拼接到70w（并没有显式的拼接，而是重复了70w训练的step）
优化器参数和训练策略参数就是那几个optimizer.pt、sche

creamiracle · Answer

是的，如果不到70w会自动重复拼接到70w（并没有显式的拼接，而是重复了70w训练的step）优化器参数和训练策略参数就是那几个optimize

Facico · Answer

就是重复训练这段数据，相当于在时间上拼接

creamiracle · Answer

就是重复训练这段数据，相当于在时间上拼接

那就是说如果直接用这20w数据继续训练，

Facico · Answer

关于继续训练（continue finetuning） about chinese-vicuna HOT 12 CLOSED