sunnygjing / t5-pegasus-chinese Goto Github PK

View Code? Open in Web Editor NEW

211.0 211.0 33.0 2.18 MB

基于GOOGLE T5中文生成式模型的摘要生成/指代消解，支持batch批量生成，多进程

License: MIT License

Python 100.00%

chinese coreference-resolution pytorch summarization-generation text-generation

t5-pegasus-chinese's People

Contributors

Stargazers

Watchers

t5-pegasus-chinese's Issues

关于计算rouge值的问题

da
大佬您好，想问一下您在计算rouge值时为什么用空格连接每个字，这样不是将rouge值提高了吗？

文本摘要前置動作

作者好，想確認是不是用pretrain model, 再帶入summarization_csl_train.tsv進行finetune，得到的模型進行推理就可以了呢

在predict和train py文件做如下修改即可：
#from torch._six import container_abcs, string_classes, int_classes
TORCH_MAJOR=0
if TORCH_MAJOR == 0:
import collections.abc as container_abcs
int_classes = int
string_classes = str
else:
from torch._six import container_abcs

请问如何对摘要生成的字数限制？

显存不足的优化方法

在个人PC上跑了一下train，显卡6G的3060，把batchsize设为4，然后每一次迭代都del loss,cur,mask,labels,prob和 torch.cuda.empty_cache()。即便如此一个epoch只能跑到38%就没显存了，请问还有什么优化方法吗

预训练模型

您好，我看huggingface上有个模型imxly/t5-pegasus，请问和这里提供的chinese_t5_pegasus_base.zip是同一个模型吗，还是说前者是原生模型，后者是预训练过的？感谢解答。

生成摘要时出现[unused].

我在训练摘要任务的时候，发现结果中有[unused] token，请问这是什么问题？后面使用bad_word_list可以缓解，但是感觉还是训练中出现了问题？

混合精度训练问题

您好，请问在自己数据集上进行微调时是否支持fp16混合精度训练？
我尝试用fairseq框架搭建t5_pegasus模型，并且用apex库进行混合精度微调。然而相较于fp32，loss下降很慢，而且在训练初期会有loss大幅抖动的情况，fp16和fp32使用一样的参数，包括batch size和学习率。

训练精度下降

我换了一个中文新闻摘要数据集，跟在作者提供的summarization_csl数据集上相比，训练时验证集的rouge从0.6掉到了0.2，有人知道可能的原因吗。。。

執行完「predict_with_generate.py」後產生的predict_result.tsv有問題

如題，我用板主的程式跑完後

發現predict_result.tsv的內容還比原本的predict.tsv的內容還多

有人有這問題嗎？

summary應該要縮減內容才對啊，怎麼反而產出更多的內容了！

這程式是不是有問題？

sunnygjing / t5-pegasus-chinese Goto Github PK

t5-pegasus-chinese's People

Contributors

Stargazers

Watchers

Forkers

t5-pegasus-chinese's Issues

Recommend Projects

Recommend Topics

Recommend Org