Code Monkey home page Code Monkey logo

basic_net's Introduction

论文计划

说明

每三天看一篇论文,写成不低于50字的总结 每天上传任务以及任务完成情况 添加idea模块,上传可用的idea

2018.7.23

liu

论文

任务

完成ctpn的回归部分

idea

qian

论文

任务

完成ctpn的回归部分

idea

2018.7.24

liu

论文

任务

在多尺度上能不能做出突破

idea

qian

完成ctpn的最终版本

论文

任务

完成ctpn的回归部分

idea

2018.7.25

论文

任务

完成倾斜长方形的回归loss,但是incident数据集是不规则长方形.如何将不规则长方形回归到倾斜长方形。或者更进一步完成倾斜平行四边形 完成incident数据集的导入解析 需要为这个自动设计文本线构造

idea

  1. 之前尝试在score map上根据字的连续性假设,加入连续性loss.在特征图上表现的更聚集,但是效果一般
  2. 能不能再加入box regress上的连续性假设?,保持相邻的regress有相同的回归值
  3. 二次回归,即执行两次回归。
  4. 梯度的学习导流.即sum的导数流向v1,v2,v3,自动学习权重学习在v1,v2,v3之间的梯度分配
  5. deformable conv and deformable pool

2018.7.26

论文

End to end

任务

完成倾斜 倾斜的nms和文本线构造需要重写,traintodata还没写完,发现label转换的代码运行时间过长. 先放弃倾斜的文本,专门打coco比赛

idea

端对端检测识别,需要nms可训练,如何把nms放在卷积层里面

2018.7.27

论文

任务

完成了conloss,regloss,前二层mask.但是代码好像有问题,没有feed mask,明天去看一下

idea

用gather选取score>0.7的,用lstm完成nms算法。lstm先编码所有的anchor,然后解码成目标box

2018.7.31

论文

BN

任务

看了tensorflow 自定义op怎么写,初步完成了多batch

idea

基于深度学习的目标检测算法综述(二)(分享自知乎网)https://zhuanlan.zhihu.com/p/40020809?utm_source=qq&utm_medium=social&utm_oi=50987419041792

我的手机 2018/7/23 星期一 下午 11:54:13

关于感受野的总结(分享自知乎网)https://zhuanlan.zhihu.com/p/40267131?utm_source=qq&utm_medium=social&utm_oi=50987419041792

我的手机 2018/7/27 星期五 下午 6:13:23

量子位 - 汤晓鸥为CNN搓了一颗大力丸(分享自知乎网)https://zhuanlan.zhihu.com/p/40681613?utm_source=qq&utm_medium=social&utm_oi=50987419041792

我的手机 2018/7/31 星期二 下午 10:22:18

二次回归,直接用scoremap和redress map再次回归出正确的掩码

我的手机 2018/7/31 星期二 下午 10:22:19

用nms算法构造lstm的输出label

我的手机 2018/7/31 星期二 下午 10:22:19

集成,深度,重复思考

我的手机 2018/7/31 星期二 下午 10:22:19

多个anchor不就是集成方法吗?

我的手机 2018/7/31 星期二 下午 10:22:19

加强感受野位置的编码

我的手机 2018/7/31 星期二 下午 10:22:19

对hard区域进行掩码再训练

我的手机 2018/7/31 星期二 下午 10:22:19

怎么在神经网络中加入联想机制

我的手机 2018/7/31 星期二 下午 10:22:19

联想和记忆

我的手机 2018/7/31 星期二 下午 10:22:19

densenet

我的手机 2018/7/31 星期二 下午 10:22:20

趋同性的loss其实很难说学到了位置的相关性。因为相邻卷积模板是相同的。在预测时,并未获得两个点是否是相邻的信息,所以也无法趋同。但是这个loss确实有效果,我猜更多的是模板内秉的性质即放松了特征的差距,而非推理的性质

我的手机 2018/7/31 星期二 下午 10:22:20

怎样在卷积网络中实现仿射变换

我的手机 2018/7/31 星期二 下午 10:22:20

如果把二维坐标做为两层输进去,会怎么样

我的手机 2018/7/31 星期二 下午 10:22:20

本质上,检测就是输出一个掩码。从理论上来讲score map就是掩码。但是score map学习的不好。所以需要另外的loss box来进一步确定。从这个角度来讲都是基于投票,与集成方法相同

我的手机 2018/7/31 星期二 下午 10:22:20

只不过box回归加入了更强的长方形假设

我的手机 2018/7/31 星期二 下午 10:22:20

dialated convolutions

我的手机 2018/7/31 星期二 下午 10:22:20

它们的区别是什么?

我的手机 2018/7/31 星期二 下午 10:22:20

lstm在二维上无法体现二维的空间距离信息

我的手机 2018/7/31 星期二 下午 10:22:21

能不能借用bn的**,对图像做某种校正,然后再还原

我的手机 2018/7/31 星期二 下午 10:22:21

多层掩码。即输出多个掩码层,对一个图像进行多次掩码,形成多个图像再次输入到第一层中

我的手机 2018/7/31 星期二 下午 10:22:21

本质上在用卷积学习nms

我的手机 2018/7/31 星期二 下午 10:22:21

特征提取,推理

我的手机 2018/7/31 星期二 下午 10:22:21

语义分割中,稀疏卷积核的使用

我的手机 2018/7/31 星期二 下午 10:22:21

两种方法加强泛性。一种将图像变换到统一的范式,第二种将图像进行联想变形,作为额外的数据集训练。从某种角度来看这两种方法差不多。第三种方法是二次思考

我的手机 2018/7/31 星期二 下午 10:22:21

机器之心 - 循环神经网络不需要训练?复现「世界模型」的新发现(分享自知乎网)https://zhuanlan.zhihu.com/p/38744193?utm_source=qq&utm_medium=social&utm_oi=50987419041792

问题

在对图像进行多层掩码时,如何将一张图像掩码成多张图像?学习到的掩码怎么变换

2018.8.01

论文

任务

进一步学习tensorflow自定义op.想把DatatoTrain变成自定义op,发现实现很困难,主要难在选取固定的正负样本个数上。这份代码可以用cpython和cuda编写。速度应该可以快很多

idea

1.学习应该池化到什么程度。对每一层池化都输出回归。然后最后学习一个池化权重。在训练时,用权重分配每一层池化结果。在预测时,用权重去分配每一层池化结果,在所有的池化结果上用nms 2.还是二次思考的问题。二次思考表现为两种形式.第一种,用固定的卷积学习新的卷积,再对图像进行卷积.第二种,用固定的卷积学习图像的变形,以适配下一个卷积.一个是学习新的卷积,一个是学习新的图像

2018.8.09

###论文 ###任务 完成了掩码的收敛,通过加入edge的loss和mask map 0 1相对比的loss,控制了掩码收敛 ###idea 我的手机 2018/8/9 星期四 20:59:36 确定nms算法最后保留的框对应的特征图的结点 我的手机 2018/8/9 星期四 20:59:37 对卷积模板进行翻转,旋转形成更多的卷积模板进行学习 我的手机 20:59:38 来告诉底层模板应该对什么感兴趣,描绘一个目标 我的手机 20:59:38 好都越好,坏者越坏。卷积模板之间的竞争 我的手机 20:59:38 AI前沿研究 - UCL等提出完全可微自适应神经树:神经网络与决策树完美结合(分享自知乎网)https://zhuanlan.zhihu.com/p/40976044?utm_source=qq&utm_medium=social&utm_oi=50987419041792 我的手机 20:59:38 将识字的信念梯度回流到score map 上 我的手机 20:59:39 Hinton反思新作:我说反向传播不好,但还是没谁能颠覆它。(分享自知乎网)https://zhuanlan.zhihu.com/p/40012254?utm_source=qq&utm_medium=social&utm_oi=50987419041792 我的手机 20:59:39 控制底层模板学习的积极性 我的手机 20:59:39 图像边缘锐化,将边缘检测图加入原图像 我的手机 20:59:39 关于掩码,换种思路。不学习文字,学习背景。背景的激活。不是背景的不激活。然后反转作为掩码。这跟证明题中证明补集很相似 我的手机 20:59:39 一个是通过loss控制卷积模板学习边缘 我的手机 20:59:39 控制模板学习的针对性 我的手机 20:59:39 监督网络就是loss网络。loss就是监督教师。设计loss时要充分考虑loss的学习目的,loss的影响目标 我的手机 20:59:40 关于二阶段目标检测,二阶段的梯度流回一阶段梯度的问题。 我的手机 20:59:40 调动卷积模板学习的积极性,消除无用模板 我的手机 20:59:40 更简单的,自动学习每个模板的重要性权重,然后加权。实际上多个卷积模板,随机初始化,是典型的广撒网,多点初始化。来消除局部最小。所以相当一部分模板学不到什么有用东西。 我的手机 20:59:40 图像简化,形成多简单特征,学习众多特征推理组合特征。对组合特征进行反解,判断是否有目标特征 我的手机 20:59:40 加入了gradient stop机制 我的手机 20:59:40 根据今天训练边缘图的经验,relu的输出可以无限大,在最终的label输出端用relu激活很不容易收敛,所以需要softmax。在边框回归时,真实label应当取倒数,网络输出端压缩到1以下 我的手机 20:59:41 然后用信心对多个loss集成 我的手机 20:59:41 尤其是多loss。网络很容易被某些非主要目的loss引入歧途。充分警惕那些非主要学习目标的loss 我的手机 20:59:41 增强图像的边缘信息 我的手机 20:59:41 最前沿:Meta Learning前沿进展扫描(分享自知乎网)https://zhuanlan.zhihu.com/p/40600485?utm_source=qq&utm_medium=social&utm_oi=50987419041792 我的手机 20:59:41 将score map与底层进行对比的loss 我的手机 20:59:41 今天验证了regconloss的梯度不能传到训练层 我的手机 20:59:41 信心等于gt减去实际预测的值 我的手机 20:59:41 竟争机制 我的手机 20:59:41 训练的不稳定性。y是x的函数。如果x和y都有loss学习,那么x的波动会导致y不能学习,y的波动导致x的学习效率低下 我的手机 20:59:42 通过将place holder赋值给variable来获取图像梯度,反推出重要像素 我的手机 20:59:42 学习边框回归准确率的信心 我的手机 20:59:42 一个是对图像进行边缘精确化 我的手机 20:59:43 【目标检测和目标跟踪有什么现成的标注工具?】XZH.小章鱼:… https://www.zhihu.com/question/56725870/answer/270425563?utm_source=qq&utm_medium=social&utm_oi=50987419041792 (分享自知乎网) 我的手机 20:59:43 其实就是学习loss的loss 我的手机 20:59:43 多深度的loss的学习,必须保证低深度的不振荡,高深度的才能学习

basic_net's People

Contributors

lyfadvance avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.