Reminder <input type=

adapter_name_or_path 继续训练sft的adapter about llama-factory HOT 2 CLOSED

victorzhz111 commented on June 18, 2024

adapter_name_or_path 继续训练sft的adapter

from llama-factory.

Comments (2)

HAOChuzhan commented on June 18, 2024 1

可以去仔细看下代码，我的理解是如果create_new_adapter为True，则会在代码中将adapter_name_or_path与基模先merge起来，然后再添加新的adapter进行训练，反之create_new_adapter为False，则是在adapter_name_or_path基础上进一步训练，最后保存优化后的adapter，两种方法的本质效果是一致的，但第一种会产生两个adapter参数，第二种就只有一个adapter参数，不知道我的理解是否正确 : )

from llama-factory.

hecongqing commented on June 18, 2024

如果采用第一种方式进行训练的话，最后导出模型的话，是直接和原始的模型进行合并，还是和sft的模型进行合并

#!/bin/bash

DO NOT use quantized model or quantization_bit when merging lora weights

CUDA_VISIBLE_DEVICES=0 python ../../src/export_model.py
--model_name_or_path /mnt/data/legalexp/LLM_exp/MiniCPM/MiniCPM-2B-sft-bf16
--adapter_name_or_path ../../saves/LLaMA2-7B/lora/dpo
--template default
--finetuning_type lora
--export_dir ../../saves/minicpm_dpo
--export_size 2
--export_legacy_format False

from llama-factory.

adapter_name_or_path 继续训练sft的adapter about llama-factory HOT 2 CLOSED

Comments (2)

DO NOT use quantized model or quantization_bit when merging lora weights

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent