Comments (13)
给下你的valid_texts.jsonl中的2-3条数据看看,我之前遇到这样的问题是,在json里面,一个文本只对应了少部分数据,但实际一个文本应该对应所有数据。例如,在验证集中,如果你的一个文本,对应了 5 个图片,那么这5个图片都要放在image_ids里面,你可以看实现逻辑:即 ground_truth_ids里面的数据少了,所以导致recall分数低
from chinese-clip.
@ChesonHuang 我get到你的意思,但是我用的数据集中一张图片只对应一个image_ids,train、valid和test都是如此,而在fitfune过程中ACC是显示80多的,我用R@1计算出来更低只有0.几分,下面是我的训练记录和对应的json情况。
这是微调记录:
下面是valid的json:
下面是train的json:
我不知道什么原因导致如此ACC和R@间的分数相差如此之大
from chinese-clip.
验证集和训练集的ACC都达到了80+,但是在测试集和验证集中R@5分只有18分和9分,请问是什么问题呢?应该如何解决呢?
请问你的参数设在是怎样的
from chinese-clip.
@ChesonHuang @keminze
这是我运行脚本得出来的召回分数
是用微调后的权重的
from chinese-clip.
from chinese-clip.
@ChesonHuang @keminze 这是我运行脚本得出来的召回分数 是用微调后的权重的
你好,我遇到了同样的问题,请问您发现错误 解决了吗? 感谢!
from chinese-clip.
@ChesonHuang @keminze 这是我运行脚本得出来的召回分数 是用微调后的权重的
你好,我遇到了同样的问题,请问您发现错误 解决了吗? 感谢!
建议你在 cn_clip/eval/evaluation.py 或 cn_clip/eval/evaluation_tr.py, 打印下 ground_truth_ids 和 top10_pred_ids 看看,或许它可以告诉真相
from chinese-clip.
Related Issues (20)
- 在GPU 推理报错 Segmentation fault
- 图文特征提取源码bug HOT 1
- image_b64为空 HOT 7
- AttributeError: 'Namespace' object has no attribute 'use_flash_attention'
- main.py: error: unrecognized arguments: --accum_freq=1 HOT 1
- 关于对导入LMDB数据集在微调的时候出现并行的问题 HOT 1
- 好像包里少项了,按路径找过去确实没找到这东西 HOT 1
- 图文特征融合
- 运行Recall计算评测脚本时出现{text_id:: command not found
- 这个问题太折磨了,找不到解决方法,有没有大神看一下 HOT 14
- 图到文检索Recall计算出现The evaluation failed: image_ids
- 使用RN50预训练模型和flick30k后得到的权重文件特别大 HOT 2
- text描述
- 为什么使用同样的词和图片得到的结果不一致?
- Downlodaded issue
- LOSS:nan 微调时LOSS异常 HOT 12
- 无进行任何微调,直接用模型对总的数据集进行测试R@5值为50多,把总数据集切割为train、test和valid后直接测试R@5为10多
- 在finetune时报错KeyError: 'optimizer' HOT 1
- finetune时报错,且Traceback疑似被截断,无法定位出错线程 HOT 3
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from chinese-clip.