C++プログラマのブログ

プログラミングについて、勉強したことをまとめます。

趣味で画像処理のモジュールを開発したい

仕事場で見ている画像処理のアルゴリズムがひどいので、代替するものを作れないかやってみます。 とりあえず、仕事でやってる口の開き具合を計算するモジュールを作ってみます。 機能要件はとかは秘密。なんか漏れるとまずいし。

アプローチは大雑把にruleベースと学習ベースがあります。 ルールベースは完全にノープランです。 学習ベースはDeepLearningとRamdamizeTreeあたりでしょうか。こいつらは過去にC++で自作したので勝手もわかる感じだし。

当面は面白そうなのでルールベースでやるつもり。 マイルストーンはざっと以下のとおり。

  • 学習データ集め
    • USBカメラで自分や家族を撮影
    • 学習データラベル付け
  • 精度を評価する仕組み整備
    • 画像を読み込んで、口の開き具合を出力するアプリを作成(Python or C++)
    • 上記アプリと正解データを比較してグラフ化する仕組みを考える(Python)
  • ルールベースのアルゴリズム検討

大津のアルゴリズムで口腔を検出できるかだけやってみた。

  • オリジナル画像 http://cdn-ak.f.st-hatena.com/images/fotolife/r/red_grape/20170730/20170730224804_120.jpg?1501422507
  • 2値化 http://cdn-ak.f.st-hatena.com/images/fotolife/r/red_grape/20170730/20170730224801_120.jpg?1501422507
  • 3値化  http://cdn-ak.f.st-hatena.com/images/fotolife/r/red_grape/20170730/20170730224758_120.jpg?1501422507

取れそうですね。髭とか歯とかに影響を受けそうですが、そこはまた考えます。