Code Monkey home page Code Monkey logo

python_image_recognition's Introduction

Pythonで学ぶ画像認識 (機械学習実践シリーズ)

License Python PyTorch Open In Colab

本リポジトリではインプレス社より出版されている田村 雅人中村 克行 著の機械学習実践シリーズ「Pythonで学ぶ画像認識」で扱うソースコードやデータ、学習済みパラメータを管理しています。ソースコードはJupyterノートブックにまとめられており、Google Colabで実行されることを想定しています。ソースコードの解説は書籍内に記載されており、本リポジトリのソースコードは補助教材となっています。

書籍の内容

書籍は以下のような構成になります。また、CVMLエキスパートガイドという学習支援サイトにて紹介記事を書いていただいており、記事にて本書の内容や長所を簡単に把握できます。本書ではカバーしきれなかった補完情報を載せた記事にすぐたどり着くことができるようになっておりますので、合わせてご活用ください。

Jupyterノートブックの補助教材がある節には Open In Colab のバッジをつけています。バッジをクリックすると該当するノートブックをColabで開けます。ただし、この方法でノートブックを開いて画像やラベルデータの読み込みを行う処理を実行した場合、該当するデータがColab上にないためエラーが発生します。ノートブックの処理を実行したい場合には書籍の第1.4節で解説されている環境構築を行って実行してください。

  • 第1章 画像認識とは?

    • 第1節 画像認識の概要

    • 第2節 コンピュータによる画像認識の仕組みを理解しよう

    • 第3節 実社会で使われている画像認識アプリケーション

    • 第4節 画像認識のための開発環境構築 Open In Colab

  • 第2章 画像処理の基礎知識

    • 第1節 画像データを読み込んで表示してみよう Open In Colab

    • 第2節 画像に平滑化フィルタをかけてみよう Open In Colab

    • 第3節 畳み込み演算を使った特徴抽出Open In Colab

    • 第4節 アテンションを使った特徴抽出Open In Colab

  • 第3章 深層学習を使う準備

    • 第1節 学習と評価の基礎 Open In Colab

    • 第2節 深層ニューラルネットワーク

  • 第4章 画像分類

    • 第1節 順伝播型ニューラルネットワークによる手法 Open In Colab

    • 第2節 畳み込みニューラルネットワークによる手法ーResNet18を実装してみよう Open In Colab

    • 第3節 Transformerによる手法ーVision Transformerを実装してみよう Open In Colab

    • 第4節 精度向上のテクニック Open In Colab

  • 第5章 物体検出

    • 第1節 物体検出の基礎 Open In Colab

    • 第2節 データセットの準備 Open In Colab

    • 第3節 CNNによる手法ーRetinaNetを実装してみよう Open In Colab

    • 第4節 Transformerによる手法ーDETRを実装してみよう Open In Colab

  • 第6章 画像キャプショニング

    • 第1節 画像キャプショニングの基礎

    • 第2節 データセットの準備 Open In Colab

    • 第3節 CNN-LSTMによる手法ーShow and tellを実装してみよう Open In Colab

    • 第4節 アテンション機構による手法ーShow, attend and tellを実装してみよう Open In Colab

    • 第5節 Transformerによる画像キャプショニングを実装してみよう Open In Colab

付録

書籍でカバーしきれなかった内容について付録を用意しました。付録はJupyterノートブックで作成されています。

付録A PyTorchの基礎 Open In Colab
PyTorchを使う上で最低限必要となる知識について解説しています。PyTorchを始めて使う方は第4章に入る前に本ノートブックを読むことをおすすめします。

関連リンク

コンピュータビジョンやディープラーニングを専門とする研究開発者を対象とした学習支援サイトです。サイトの指定参考書に本書を入れていただいています。本書では分量の関係上、詳細を割愛したものやカバーしきれなかったものが詳しく解説されており、本書と合わせてサイトをご活用いただくと、より理解が深まるのでおススメのサイトです。

疑問点・修正点

疑問点や修正点はIssueにて管理しています。不明点などございましたら以下を確認し、解決方法が見つからない場合には新しくIssueを作成してください。

https://github.com/py-img-recog/python_image_recognition/issues

python_image_recognition's People

Contributors

py-img-recog avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.