Code Monkey home page Code Monkey logo

kb_1805's Introduction

Image Down

Image Down

製品概要

メモ × Tech

背景(製品開発のきっかけ、課題等)

コンピュータ上で簡単なメモを取るときに、Markdownフォーマットは便利で広く使われています。しかし、多数の図を含むような場合は、ホワイトボードや紙を使うほうが簡単だと私たちは感じています。

また、私たちはよく研究のミーティングなどでホワイトボード活用しています。ホワイトボードの内容から議事録を作成する際に、ただの画像ではなく、 Markdown フォーマットにしておけば検索や編集が楽に行えて便利です。そのためには、ホワイトボードに書かれている文章を文字に起こし、図は画像として保存する必要があります。この作業に時間がかかるのでなんとか効率化できないかと考え、画像から自動でMarkdownファイルを作成するツールを作ることにしました。

製品説明(具体的な製品の説明)

ノートやホワイトボードなどの画像を、テキストと図を含む Markdown ファイルに変換します。

特長

1. 特長1 画像からMarkdownを生成することができる

2. 特長2 図と文章を識別し、適切なフォーマットでMarkdown化できる

3. 特長3 Web サービスとしてインターフェースが提供されているためすぐに使うことができる

解決出来ること

ノートやホワイトボードに書き込んだ内容を撮影し、その画像を本製品でMarkdown化することができます。これによって、ノートやホワイトボードの内容をPCで管理したいときに、自分でまとめ直す手間を軽減することができます。さらに、Markdownで管理できるため、後から編集や検索が簡単に行えます。

今後の展望

現段階では文章と図しかMarkdownにすることがでず、変換されたファイルでは表も図として扱われています。また、1つの図が複数の図として分割されてしまったり、識別の精度の向上も必要です。

そこで、今後は

  • 識別精度の向上
  • テキストや図の配置アルゴリズムの改善
  • 箇条書きを識別子適切なフォーマットで埋め込む
  • 表を表として識別し適切なフォーマットで埋め込む
  • 数式を識別し Latex 形式で埋め込む

などを行い、高機能で便利なアプリにしていきたいです。

開発内容・開発技術

活用した技術

API・データ

なし

フレームワーク・ライブラリ・モジュール

  • Web サーバ
    • Ruby
    • Sinatra
    • Milligram CSS フレームワーク
  • 変換スクリプト
    • Python3.6
    • OpenCV3
    • PyOCR
    • Tesseract OCR

デバイス

なし

独自開発技術(Hack Dayで開発したもの)

2日間に開発した独自の機能・技術

  • 画像から抽出された文章と画像を適切な位置に配置し、Markdownファイルを作成するシステム (ファイル):
    1. OCRを用いて入力画像から文字領域とその内容を取得する
    2. 文字領域を背景色で塗りつぶすことで入力画像から文字を削除する
    3. 文字が削除された画像をOpenCVで輪郭抽出を行い、図領域を推測する
    4. 推測した図領域を切り取り、図画像として保存する
    5. 上記過程で取得した情報を基に、文章と図を適切な位置に埋め込み、Markdownファイルを作成する

kb_1805's People

Contributors

oudon avatar maximum80 avatar burokoron avatar

Stargazers

Tyanio avatar

Watchers

James Cloos avatar liam avatar taigaKatsumata avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.