trickygo / dive-into-dl-tensorflow2.0 Goto Github PK

View Code? Open in Web Editor NEW

3.8K 3.8K 818.0 59.81 MB

本项目将《动手学深度学习》(Dive into Deep Learning)原书中的MXNet实现改为TensorFlow 2.0实现，项目已得到李沐老师的认可

Home Page: https://trickygo.github.io/Dive-into-DL-TensorFlow2.0/#/

License: Apache License 2.0

Jupyter Notebook 99.59% Python 0.41%

book chinese-simplified cv deep-learning dive-into-deep-learning jupyter-notebook nlp python3 tensorflow2 tutorials

dive-into-dl-tensorflow2.0's Introduction

dive-into-dl-tensorflow2.0's People

Contributors

Stargazers

Watchers

Forkers

bellagao1023 liangzai951 xuweitj noahgalaxy swordfaith liangxd yangshoujian felixzhang7 shusentang wendonggan demmon-tju fw1121 bbw7561135 lionlu911 pieere 871864580 mzpmzk jaccckmaa chaoongithub leedaga frankfan007 xclu cdj0311 cdlwhm1217096231 499244188 chengmuni66 aixinneucore liangqingyuan adam1iu zhuikonger hiker-xu fenxouxiaoquan awfssv 3dimaging iloveiverson nestorlong vguanwenv koala-good zhangkehua blake2002 microw xincnnix cronaldo7531 ssgssgoku-17 tb1over zhangjiekui healieliao jxzsxsp timothyblack luckygong zeyuanzhao50 hadoop2014 huyz1117 allensmile m3dade paopaoactioner soon-tw tchigher antonizhubar csanycall chapzq77 gavinljj yutianji888 zhengtq monoloxo hhy5277 glen9527 qhapper wangdongya linyr1125 millaras dshwei yyq1609 chenpufeng tor4z liulizi zhanqiliu pnx007 zhiguo-chen tcglarry hsuanshao zhangshuai830 yfu1116 yihongyishui wjymath eanfs a-pai wildchen masterwall dyf-ai blueplus jackliaoall-ai-books-resources fancycheung fusichao tudajie liwi163 asukaj xingchen77 linessiex royzon

dive-into-dl-tensorflow2.0's Issues

代码输出

将原有的 features[0], labels[0] 代码应该贴在下面代码区。

未修改内容

仍旧是 pytorch 内容。

应该为 matmul 函数

无法访问4.3 模型参数的延后初始化

https://trickygo.github.io/Dive-into-DL-TensorFlow2.0/#/chapter04_DL-computation/4.3_deferred-init

2021年2月16日 11点，提示404 - Not found

9.1图像增广-使用图像增广训练模型

show_images(x[0:32][0], 4, 8, scale=0.8)这行代码感觉应该修改为show_images(x[0:32], 4, 8, scale=0.8)，这样才会显示完整的照片

torch库在前面没有导入（3.11.4.1）

3.11.4.1 生成数据集
该小节，torch库在前面没有导入，我是在本地安装了Pytorch，然后import torch，就可以成功了。

n_train, n_test, true_w, true_b = 100, 100, [1.2, -3.4, 5.6], 5
features = torch.randn((n_train + n_test, 1))
poly_features = torch.cat((features, torch.pow(features, 2), torch.pow(features, 3)), 1)
labels = (true_w[0] * poly_features[:, 0] + true_w[1] * poly_features[:, 1]
+ true_w[2] * poly_features[:, 2] + true_b)
labels += torch.tensor(np.random.normal(0, 0.01, size=labels.size()), dtype=torch.float)

5.1.2的Conv2D中call的返回值有一点小问题

原文中为return corr2d(inputs, self.w + self.b)，而实际上应该是return corr2d(inputs, self.w) + self.b

学习路径的jpg显示不出来

3.12.4描述与小结与代码内容不符

3.12.4描述与小结与代码内容不符，描述与小结为pytorch版的，望进行修改，谢谢！ @archersama

第五章训练数据加载有问题 DataLoader

建议写成迭代器形式，现在的随机抽选，不是选择所有样本

错别字“食用方法” 应为使用方法

https://trickygo.github.io/Dive-into-DL-TensorFlow2.0/#/?id=%e9%a3%9f%e7%94%a8%e6%96%b9%e6%b3%95

建议

感觉有些地方都没改正过来新手看的一头雾水建议再好好完善一下

3.16.3 转换为nparray的时候使用的是pytorch的api

n_train = train_data.shape[0]
train_features = torch.tensor(all_features[:n_train].values, dtype=torch.float)
test_features = torch.tensor(all_features[n_train:].values, dtype=torch.float)
train_labels = torch.tensor(train_data.SalePrice.values, dtype=torch.float).view(-1, 1)

data数据难下载

能否发一个data的网盘链接，github下载太慢了。谢谢！

2.3.2 训练模式和预测模式有关键性错误

with tf.GradientTape(persistent=True) as g:
    g.watch(x)
    y = x * x
    z = y * y
    dz_dx = g.gradient(z, x)  # 108.0 (4*x^3 at x = 3)
    dy_dx = g.gradient(y, x)  # 6.0
dz_dx,dy_dx

需要改为：

with tf.GradientTape(persistent=True) as g:
    g.watch(x)
    y = x * x
    z = y * y
dz_dx = g.gradient(z, x)  # 108.0 (4*x^3 at x = 3)
dy_dx = g.gradient(y, x)  # 6.0
dz_dx,dy_dx

感谢作者

9.4 锚框 colab地址，希望对你们有帮助

我跟着pytorch那个版本改写成了tensorflow版本，当然，可能有错误或者使用不当的函数，希望相互指教，或者能对你们有帮助。

colab地址：https://colab.research.google.com/drive/1u5EUfErT-3G76vy7CMbXs7-tbJF4els5

3.2小节最后部分代码有点小问题(网页版文档)，多输入了一个t

4.3文章消失

【在线书部分章节缺失】第3章-3.12权重衰减；第4章-4.3模型参数的延后初始化

3.12 权重衰减
4.3 模型参数的延后初始化

6.4网页版和github上面的结果不一致

6.4网页版和github上面的结果不一致，代码一致，疑惑，另外6.3vocab_size实际2582，网页版和github上面是1027，如果上述有描述错误，望指教。

“机器翻译”章节缺失

缺失章节“机器翻译”

The funtion of colormap2label may not be effective , the converted label does not correspond.

test-rgb2label.pdf
The result for [0,0,128] should be labeled as 4, but got the 0. Hope to get your reply, thank you!
The input image from VOC2012\SegmentationClass\2007_000061.png

第五章的小标题规范&图片缺失

第五章图片缺失，注意用多少添加多少不要又一下全部加进来了
另外小标题规范一下，按照原书小标题来

网页版项目地址无法访问

如题

6.4 和 6.5 小结中，损失函数缺少一个参数，导致训练结果不正确

l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs))
该损失函数缺少参数 from_logits = True。在计算输出是没有使用激活函数softmax，因此需要在损失函数上指定，即令from_logits = True。故损失函数应该为：
l = tf.reduce_mean(tf.losses.sparse_categorical_crossentropy(y,outputs,from_logits=True))

错误结果：

epoch 50, perplexity 100.705286, time 1.76 sec
分开

分开
不分开
不分开
epoch 100, perplexity 27.005527, time 1.85 sec
分开
分开
不分开
不分开我
epoch 150, perplexity 1019.865201, time 1.80 sec
分开
分开象元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
不分开
不分开元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
epoch 200, perplexity 1020.654544, time 1.73 sec
分开
分开象元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
不分开
不分开元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
epoch 250, perplexity 1020.654544, time 1.75 sec
分开
分开象元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘
不分开
不分开元元乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘乘

是否更新

请问后面的内容是否会更新了呢？或者大概什么时间会更新？感谢

第四五章相对路径链接插入方式有误

如下图链接是不对的

建议直接像下面那样不插链接而是直接放文本，指定节号即可

3.5 读取小批量像素标准化

3.5 读取小批量
并除以255使得所有像素的数值均在0到1之间
应该加一个 map函数作映射
def data_trans(x, y):
x = tf.cast(x, tf.float32)
x = x / 255
return x, y

train_iter = tf.data.Dataset.from_tensor_slices((x_train, y_train)).map(data_trans).batch(256)

3.13节，train_ch3，params更新

        if trainer is None:

            sample_grads = grads
            params[0].assign_sub(grads[0] * lr)
            params[1].assign_sub(grads[1] * lr)

为什么params只更新0,1，不应该是
for (i,param) in enumerate(params):
params[i].assign_sub(grads[i]*lr)

章节缺失：10.7和10.8两个章节缺失

文本情感分类：使用循环神经网络和文本情感分类：使用卷积神经网络textcnn，两个章节缺失了。。。

d2lzh_tensorflow2缺失，项目文件亦没有code目录

导入库缺失，项目代码也没有code，请问哪里可以获取，只发现utils.py含有相关代码

5.4.2中最后一个例子，结果问题

最后一个例子使用了padding='same', strides=2。理论上在kernel_shape=(3,3) 的情况下same padding就是在图像外面围一圈0。
然后再做strides=2的max_pooling。这个时候结果不应该是5 7 13 15么？为什么最后的结果是10 11 14 15？

module 'tensorflow' has no attribute 'gradient'

线性回归的从零开始实现一节

param.assign_sub(lr * tf.gradient(l, param) / batch_size)

代码报module 'tensorflow' has no attribute 'gradient'错误，改tf.gradient为t.gradient正常

3.9.4代码缩进问题

IndentationError: expected an indented block

房价预测按照在线版本的写下来，为什么loss这么大呢

ch6.8代码不符,lstm中最后一个简单版本实现的最后一个函数train_and_predict_rnn_keras并没有device的参数

去掉device后报错：

4.5.1 load and save NDarray没有save的代码，只有load的代码

动手学深度学习 tensorflow版

Hi 各位，

感谢将D2L翻译到TensorFlow。目前我们在着手在d2l.ai的英文版里面加入tensorflow和pytorch的实现。现在的pytorch版的一个demo在http://pytorch.d2l.ai.s3-website-us-west-2.amazonaws.com/chapter_preface/index.html 和 http://pytorch.d2l.ai.s3-website-us-west-2.amazonaws.com/chapter_linear-networks/linear-regression-scratch.html，代码在 https://github.com/d2l-ai/d2l-en/tree/pytorch 不知道你有没有兴趣来贡献tensorflow的实现。

（我之前发过信到各位的pku邮箱，各位可能没注意）

5.12 稠密连接网络 DenseNet 模型

在一开始5.12.1中代码所定义的稠密块有两层卷积，而在5.12.3的代码中

def densenet():
    return DenseNet(num_init_features=64, growth_rate=32, block_layers=[4,4,4,4], compression_rate=0.5, drop_rate=0.5)
mynet=densenet()

定义了block_layers[4,4,4,4], 所以实际上代码最后定义的模型是不是4x4x2个卷积层，而不是像上文所提到的

同ResNet一样，我们可以设置每个稠密块使用多少个卷积层。这里我们设成4，从而与上一节的ResNet-18保持一致

或者还是我理解错了啊

2.2.5 运算的内存开销 tf.add中没有out参数

“如果想避免这个临时内存开销，我们可以使用运算符全名函数中的out参数。”
tf.add没有out参数，请确定：）

【3.5 图像分类数据集】内容表述错误

这里是二维的 array 数组存储。

图像也不是灰度图像。

【3.3 线性回归的简洁实现】内容排版问题

多余代码

第一行代码多余，可以删去；
for 循环中的 x 原书为大写 X；
原书代码结尾有 break，这样只会输出一个，可以减少该代码输出后所在内容篇幅。

# dataset=tf.data.Dataset.from_tensor_slices((features,labels))
train_db = tf.data.Dataset.from_tensor_slices((features, labels)).batch(10)
for(x,y) in train_db:
    print(x,y)

为划分标题

该章节目前没有划分小标题。

章节优化器和损失函数在同一章节划分

可以和原书一致，将损失函数和优化器分别定义使用。

学习率数值

下面代码原书的学习率采取为 0.03 。

model.compile(optimizer=tf.keras.optimizers.SGD(0.01),
              loss='mse')

大部分段落没有句号

最后多余一个代码块

文章结尾多余一个代码块

需要将一些专有名词规范话，例如：

tensorflow or Tensorflow
tensor or Tensor

单词与汉字之间，数字与汉字之间是否要保留空格，例如：

Tensorflow是一个 or Tensorflow 是一个

行内代码是否要专门括起来，原书是括起来的，例如：

tensor or tensor