Comments (4)
@weyoung0 感谢对我们工作的支持~ 关于半监督性能这里,我有一些个人的看法哈
1) 数据集的人为标注如果存在一些噪声,或者不准地情况,那全监督实际地结果可能会更高一些。
2) 对于iteration次数来说,可能采用semi的时候 整体的训练iter次数要比全监督多一些?这可能也会使得半监督地性能会提高一些。
3) 另外我们加入了Lscale,无形中对于scale地invariance进行了约束,因为检测上对于scale地感知还是比较重要的,而全监督是没有这个Lscale地 所以这是否也可能是一个影响效果地原因呢
4) 此外,半监督在打伪标签的时候,随着训练的进行,伪标签的框肯定会变化,相当于对于同一个物体,网络会得到基于莫格大致位置的相对变化的标签,而这个是否也是种正则项,防止过拟合训练数据呢。(我在实际项目中,用到bbox的随机扰动,发现是有性能涨点的,所以猜测一定程度的伪标签的变化,可能也有益处)
5)当然从理论上来说如果一切标注都完美,外界条件也差不多,那理论上100%地标注是会好于50%的。
from dsl.
@chenbinghui1 感谢您的回复,这里还有一些疑问:
1)如果iter次数多导致半监督性能提高一些,是不是说全监督增加iter也能再提高?
2)您提出的Lscale,我在实验中没有启用,所以它的影响是可以排除的
3)我在实验中也没有动态变化伪标签的框,生成伪标签后就没有再做调整了;伪标签的框是比人工标注要多的,比如一个目标,可能伪标签标注了它的完整轮廓和一半轮廓,这样相当于多了一个标签框,增加了正样本,那是不是正样本增加导致的性能提升呢?
4)我在实验中尝试使用了更大的模型来生成伪标签,发现伪标签的指标越高,半监督训练所得模型的指标也越高,因此根据我当前实验结果可以推测,如果使用特别大的模型生成伪标签,那么50%标注甚至会超过100%的标注。
from dsl.
- 应该是的
- 可能有影响,毕竟focalloss的参数是采用默认的,如果增多正样本个数,我猜测是有帮助的。
- 有可能的 但是对于性能的上限,我觉得可能是有upperbound的,而这个上限可能就是原始GT标注采用框的增强得到的结果?
from dsl.
@chenbinghui1 第3点,100%标注训练就是用了所有能用的数据增强得到的指标,半监督的指标已经追平它了,感觉还是没有理解到位,很难解释这个现象。
from dsl.
Related Issues (20)
- Question about dsl HOT 2
- EMAModel and student model get the same performance HOT 9
- How the scale invariant implement? HOT 4
- Where is "Adaptive Filtering Strategy" source code? HOT 1
- local variable 'save_path' referenced before assignment HOT 1
- some questions HOT 3
- 关于半监督训练的一些问题 HOT 2
- 关于lscale的一些问题 HOT 1
- 整数除以0报错 HOT 2
- unlabel_pred error and cannot find the images HOT 4
- 关于Aggregated Teacher
- RuntimeError: Address already in use HOT 7
- 我想请问一下为什么跑这个程序会直接卡死 HOT 14
- 监督学习 HOT 3
- 关于unlabel_train.sh HOT 2
- 伪标签好像没有及时更新? HOT 4
- 复现没达到预期 HOT 11
- 你好,想问一下聚合教师的代码在哪一块呀 HOT 15
- 你好,想问一下关于patch shuffle的代码在哪里,找了好久没找到
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from dsl.