Comments (6)
微调完成后进行推理,
问数据集第一个问题:编号18655236.32616的内容是什么?
还是回答的不沾边,想知道为什么,哪里出了问题
from swift.
我看数据集第一个问题是下面这样, 好像数据集不太对嘛, 你看看
编号18655236.32616的内容是什么,,"目前支持的meta文件格式为csv或者jsonl。如果是csv格式的,需要用逗号分隔来组织元数据,如果是jsonl格式的,则每行是一个合法有效的json串。元数据用于描述数据文件的一些其他属性,标签等。meta文件统一上传到“元数据文件”tab下。 以csv格式为例,首行为header, 采用 逗号分隔, 每个字段 采用 {字段名}:{类型} 作为标识, 类型可选为Value/FILE,可缺省, 默认文本(Value), 字段名不允许有重复。 第二行开始为具体的数据,依然采用逗号分隔,字段数和header保持一致,如果类型为FILE,则填写文件在zip包中的相对路径,如果不是zip包(而是一个文件夹或者散装文件),也可以填写相对数据文件根目录的相对路径。"
from swift.
这是我特意写成这样的,我想训练后,我如果问“编号18655236.32616的内容是什么” , 希望他能够回复我教给他的内容,如:“目前支持的meta文件格式为csv或者jsonl。如果是csv格式的,需要用逗号分隔来组织元数据,如果是jsonl格式的,则每行是一个合法有效的json串。元数据用于描述数据文件的一些其他属性,标签等。meta文件统一上传到“元数据文件”tab下。 以csv格式为例,首行为header, 采用 逗号分隔, 每个字段 采用 {字段名}:{类型} 作为标识, 类型可选为Value/FILE,可缺省, 默认文本(Value), 字段名不允许有重复。 第二行开始为具体的数据,依然采用逗号分隔,字段数和header保持一致,如果类型为FILE,则填写文件在zip包中的相对路径,如果不是zip包(而是一个文件夹或者散装文件),也可以填写相对数据文件根目录的相对路径。"”
from swift.
我也遇到了類似的問題, QLora SFT過程一切順利, Infer時也成功加載ckpt, 但答案就和完全沒學習過一樣。。。 不知道是什麼原因
from swift.
可以贴一下infer的图片嘛
from swift.
我想看一下效果情况,我这里测试都是正常的
from swift.
Related Issues (20)
- 2.0.4之后的版本的显存使用问题 HOT 2
- DPO训练的时候grad_norm出现nan值 HOT 1
- 有关Internvl-1.5的微调实验(AttributeError: 'NoneType' object has no attribute 'shape') HOT 5
- qwen1half-moe-2.7B-chat采用gptq量化后infer报错
- 多机多卡推理
- 多任务微调 HOT 2
- We suggest you to set torch_dtype=torch.float16 for better efficiency with AWQ. HOT 1
- 自我认知 KeyError: 'self-cognition#500' HOT 2
- 用qwen-7b-int4和int8进行lora微调后,微调和推理没问题,但部署后,请求报错 HOT 1
- deepseek-vl-7b模型使用deepspeed的ZeRo3报错
- 多模态微调支持多轮对话吗
- 量化后的模型推理报错怎么解决 HOT 1
- 希望能应用TensorRT加速训练和推理
- 训练qwen14b,前面lr一直为0
- 多节点训练报错
- 可以支持一下RoPE外推不
- internvl-chat-v1.5-int8 推理时报错,应该如何处理 HOT 3
- 我想将模型保存到本地,怎么才能保存。同时怎么调用本地的模型?
- 微调internvl-v1.5报错KeyError: 'input_ids' HOT 1
- 微调后量化,执行推理命令时报错:load_in_4bit
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from swift.