アプリ「サリバンプラス」の文字認識。


06153 2022/02/27 14:58:21


こんにちは。キクミヤタカアです。私は当該アプリを使ってませんので、はっきりしたことは言えませんが、似たようなアプリを使っているのでちょっとだけ。

使用あぷりはEnvisionAIです。これにも文字認識がありますが、アプリが自動的に読み込む印刷物の全体を認識しようと働くので、少しづつスマホの水平位置や高さを変えて全体を認識するまで動かすとシャッターが切れて文字の解析が入ります。

ワープロ、パソコンの印刷などで印字されたものはもちろんですが、手書きも一応認識します。

ただ、手書きの文字認識はある程度しっかりと書いていないと誤認識しまくるか全く別の言葉に読み上げます。

先に書いていただいた手順の中で高さを変えたりスマホの向きを変えたりとしておられるうですが、スマホのカメラレンスの位置などで印刷物に対する向け方は変わってくるのではないでしょうか?

EnvisonAIはその辺はずれていたりすると「端がみえなせん」といって警告するのでその音が聞こえなくなるまで水平位置をずらしたりして合わせることが可能です。

用紙全体をファインダー内に収めようとすると高さを変える必要がありますが、これもカメラの性能に依存するのではないでしょうか
私の場合、はがきなら30cm程度話さないと全体を認識しませんし、A4サイズなら50cm以上は話さないと認識しませんでした。
それにiPadだとカメラの位置が端末の隅っこにあるので、カメラの連巣をなんとなくですが対象物の中央にくるようにしないと全体が認識しませんでした。それに高さも変わりますしね。端末の性能に依存んする感じです。

また、読み込もうとした郵便物が手書きなのか印刷なのかわかりません。手書きの場合は先にも言いましたが、それなりに綺麗でないと正常に認識しないか、誤認識しまくるでしょう。また、何も認識しないという場合はアプリの不調やカメラ、スマホの故障とかもあるかもです。

OCR系のアプリは得意・不得意がありますし、その時々のスマホの状態にも左右されるので

端末を再起動してみたり、晴眼者の瞳一度カメラがちゃんと動作しているかを見てもらうべきかと思います。

ではでは




06154 2022/02/27 19:28:13


キクミヤタカア 様

せせらぎです。

お返事くださいまして、ありがとうございます。

EnvisionAIでの読み上げ状況、工夫なさっていることをうかがい、参考になりました。

スマホ本体やカメラによるのですね。

先ほど、サリバンプラスを更新しました。
機能改善のためにGoogleのサービスの1部を使うように改良されたようです。
30cmの距離で水平に持って竹下所、正常に読み上げました。

カメラを、文字の書かれている場所にあわせるようにして、使っていこうと思います。

サリバンプラスあ、全体を認識するのにシャッター音がしない使用のようで周囲に気兼ねなく使えるので、私は気に入っています。

ありがとうございました。




06152 2022/02/26 22:55:41


みなさま


せせらぎです。
お世話になっております。
サリバンプラスをHUAWEIのノバライト2で使用しております。
先日封筒の差出人の文字認識を試したところ、うまくいきませんでした。

普段このアプリをお使いの方にうかがいます。
カメラをかまえる位置など、コツのようなものはありますでしょうか。
ご意見うかがえますとさいわいです。

下記は捜査状況です。
1. 明るい光の下、安定した場所に、スマホと並行(縦長)に封筒を置きます。
封筒をスマホから30cmほど離し、空中で、なるべく水平を保つように手で持ちます。

2. カメラを起動し、リアカメラに切り替えます。(左右2つのデュアルカメラのため)

3. サリバンプラスを起動し、AIモードで文字認識を試みます。

4. 認識されません。

5. 封筒を40cm、10cmと替えたり、横向きにしたりしましたが、認識しませんでした。
また、フロントカメラに切り替えても、同様でした。

以上です。




06153 2022/02/27 14:58:21


こんにちは。キクミヤタカアです。私は当該アプリを使ってませんので、はっきりしたことは言えませんが、似たようなアプリを使っているのでちょっとだけ。

使用あぷりはEnvisionAIです。これにも文字認識がありますが、アプリが自動的に読み込む印刷物の全体を認識しようと働くので、少しづつスマホの水平位置や高さを変えて全体を認識するまで動かすとシャッターが切れて文字の解析が入ります。

ワープロ、パソコンの印刷などで印字されたものはもちろんですが、手書きも一応認識します。

ただ、手書きの文字認識はある程度しっかりと書いていないと誤認識しまくるか全く別の言葉に読み上げます。

先に書いていただいた手順の中で高さを変えたりスマホの向きを変えたりとしておられるうですが、スマホのカメラレンスの位置などで印刷物に対する向け方は変わってくるのではないでしょうか?

EnvisonAIはその辺はずれていたりすると「端がみえなせん」といって警告するのでその音が聞こえなくなるまで水平位置をずらしたりして合わせることが可能です。

用紙全体をファインダー内に収めようとすると高さを変える必要がありますが、これもカメラの性能に依存するのではないでしょうか
私の場合、はがきなら30cm程度話さないと全体を認識しませんし、A4サイズなら50cm以上は話さないと認識しませんでした。
それにiPadだとカメラの位置が端末の隅っこにあるので、カメラの連巣をなんとなくですが対象物の中央にくるようにしないと全体が認識しませんでした。それに高さも変わりますしね。端末の性能に依存んする感じです。

また、読み込もうとした郵便物が手書きなのか印刷なのかわかりません。手書きの場合は先にも言いましたが、それなりに綺麗でないと正常に認識しないか、誤認識しまくるでしょう。また、何も認識しないという場合はアプリの不調やカメラ、スマホの故障とかもあるかもです。

OCR系のアプリは得意・不得意がありますし、その時々のスマホの状態にも左右されるので

端末を再起動してみたり、晴眼者の瞳一度カメラがちゃんと動作しているかを見てもらうべきかと思います。

ではでは




06154 2022/02/27 19:28:13


キクミヤタカア 様

せせらぎです。

お返事くださいまして、ありがとうございます。

EnvisionAIでの読み上げ状況、工夫なさっていることをうかがい、参考になりました。

スマホ本体やカメラによるのですね。

先ほど、サリバンプラスを更新しました。
機能改善のためにGoogleのサービスの1部を使うように改良されたようです。
30cmの距離で水平に持って竹下所、正常に読み上げました。

カメラを、文字の書かれている場所にあわせるようにして、使っていこうと思います。

サリバンプラスあ、全体を認識するのにシャッター音がしない使用のようで周囲に気兼ねなく使えるので、私は気に入っています。

ありがとうございました。




    Android-ML 過去ログ に戻る