Pythonで学ぶ画像認識 (機械学習実践シリーズ)

本リポジトリではインプレス社より出版されている田村雅人・中村克行著の機械学習実践シリーズ「Pythonで学ぶ画像認識」で扱うソースコードやデータ、学習済みパラメータを管理しています。ソースコードはJupyterノートブックにまとめられており、Google Colabで実行されることを想定しています。ソースコードの解説は書籍内に記載されており、本リポジトリのソースコードは補助教材となっています。

書籍の内容

書籍は以下のような構成になります。また、CVMLエキスパートガイドという学習支援サイトにて紹介記事を書いていただいており、記事にて本書の内容や長所を簡単に把握できます。本書ではカバーしきれなかった補完情報を載せた記事にすぐたどり着くことができるようになっておりますので、合わせてご活用ください。

Jupyterノートブックの補助教材がある節にはのバッジをつけています。バッジをクリックすると該当するノートブックをColabで開けます。ただし、この方法でノートブックを開いて画像やラベルデータの読み込みを行う処理を実行した場合、該当するデータがColab上にないためエラーが発生します。ノートブックの処理を実行したい場合には書籍の第1.4節で解説されている環境構築を行って実行してください。

第1章画像認識とは？
- 第1節画像認識の概要
- 第2節コンピュータによる画像認識の仕組みを理解しよう
- 第3節実社会で使われている画像認識アプリケーション
- 第4節画像認識のための開発環境構築
第2章画像処理の基礎知識
- 第1節画像データを読み込んで表示してみよう
- 第2節画像に平滑化フィルタをかけてみよう
- 第3節畳み込み演算を使った特徴抽出
- 第4節アテンションを使った特徴抽出
第3章深層学習を使う準備
- 第1節学習と評価の基礎
- 第2節深層ニューラルネットワーク
第4章画像分類
- 第1節順伝播型ニューラルネットワークによる手法
- 第2節畳み込みニューラルネットワークによる手法ーResNet18を実装してみよう
- 第3節 Transformerによる手法ーVision Transformerを実装してみよう
- 第4節精度向上のテクニック
第5章物体検出
- 第1節物体検出の基礎
- 第2節データセットの準備
- 第3節 CNNによる手法ーRetinaNetを実装してみよう
- 第4節 Transformerによる手法ーDETRを実装してみよう
第6章画像キャプショニング
- 第1節画像キャプショニングの基礎
- 第2節データセットの準備
- 第3節 CNN-LSTMによる手法ーShow and tellを実装してみよう
- 第4節アテンション機構による手法ーShow, attend and tellを実装してみよう
- 第5節 Transformerによる画像キャプショニングを実装してみよう

付録

書籍でカバーしきれなかった内容について付録を用意しました。付録はJupyterノートブックで作成されています。

付録A PyTorchの基礎: PyTorchを使う上で最低限必要となる知識について解説しています。PyTorchを始めて使う方は第4章に入る前に本ノートブックを読むことをおすすめします。

疑問点・修正点

疑問点や修正点はIssueにて管理しています。不明点などございましたら以下を確認し、解決方法が見つからない場合には新しくIssueを作成してください。

https://github.com/py-img-recog/python_image_recognition/issues

aoyama-t-ml / python_image_recognition Goto Github PK

python_image_recognition's Introduction

Pythonで学ぶ画像認識 (機械学習実践シリーズ)

書籍の内容

付録

関連リンク

CVMLエキスパートガイド

疑問点・修正点

python_image_recognition's People

Contributors

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent