View Code? Open in Web Editor
NEW
huggingface ChineseBert Tokenizer
License: MIT License
chinesebert_pytorch's Introduction
- 🔭 I’m currently working on pytorch2paddle.
- 🌱 I’m currently learning NLP.
- 💬 Ask me about pytorch2paddle.
- 📫 How to reach me:
chinesebert_pytorch's People
Contributors
Watchers
chinesebert_pytorch's Issues
请问遇到输入是一个列表的情况下如何处理呢?比如在做MRC时需要插入特殊的token
文章中可以在fusion embedding之前去掉字音或者字形,请问如何修改?
请问加载的pytorch_model.bin是否和官方的是一样的?
模型参数是否是一致的
感谢!
你好,非常感谢代码的分享,请问
import datasets
from datasets import load_dataset, load_metric
21行,22行的这个datasets的代码是什么呢?
您好!首先非常感谢您的代码的分享
请问BertTokenizer和BertTokenizerFast有很大的区别吗?如果我想用BertTokenizer的话,应该如何构建呢?
我知道tokenizer的初始话需要.from_pretrain(),那请问如何构建一个使用BertTokenizer的tokenizer呢?
字形信息原始论文是将一个字通过三种字体呈现出来,也就是三个24x24的图片。这里的图片咋弄?
您好,我想调用ChineseBERT来生成字向量用作我自己的NER任务,但是实际上并没有如bert模型那般通用,能解答一下吗?
如何调用large模型呢?是不是改一下config.json就行了呢?
需要将将config.json中的哪些部分进行修改呢