Re: Envision AI_人工知能を使ったOCR


05238 2019/06/27 08:14:10


大きい幼稚園児さん、ありがとうございます。
yutomatoです。

とりあえず月額プランに登録してみましたが、やっぱりできません。
できないのか、やり方がわからないのか不明です。
この「スキャンして見つける」は探すものが正面にくると「ピコピコ」と音が鳴って知らせてくれるんですけど、人や物体が登録できたらかなり使えるんではないかと思っているんですが。
それと、スキャンして見つける の中に「ファインドパーソン」というのがあって、これを使うと電車で空席を見つけることができました。
まだ検証途中ですが、もうちょっと実験をしてみます。

このアプリ、ゆ優良となったらすっかりレスがなくなってしまいましたね。
iosのMLにも投げてみようかな。





05240 2019/06/27 09:14:22


小出です。
ドキュメントトーカカメラトークの中に物体検出というものがあります。
これもGoogleのAIを使用したものです。
無料ですのでお試しください。
文字認識も結構なものです。
なお、NTTDocomoのエンジンは現在では使用できません。







05243 2019/06/27 09:31:34


山賀です。
話題に乗り遅れてしまいました。
というよりは、ばたばたしていて投稿し損ねていたのですが。

私も最近はEnvision AIをOCRのときに使っています。
これまではGoogle翻訳でしたが、結果を段落で読めずでしたが、こっちではそれができて便利です。


yutomatoさんが質問されている機能ですが、私の端末ではそもそも表示されません。
iOS側で実装されていてもAndroidにはまだ搭載されていない機能があるのかなと思っています。
投稿を拝見していると、便利そうなので使ってみたいなと思っています。

みなさんのところではいかがでしょうか?





05244 2019/06/27 12:52:19


MLの皆様、こんにちは、キクミヤタカアです。今日はお休みなのでML過去ログ読 みふけってました。

>EmvisionAIとカメラトーク

これらのソフトがあることすら知りませんでした。いかに弱った眼でまだ無謀に も認識しようとしていたかを痛感しました。

Emの方は無料期間終了後に機能が全く使えなくなるのかが知りたいところです。

性能的にはとっても素晴らしいので使ってみたい気もwww

カメラトークは無料で使える強みがありますが、対象とスマホの距離感がいまい ちつかみづらいです。

対象物全体を認識させようとしたら「解析不能」とでました。やはり、A4くらい の大きさなら上下に分けて読取したほうがいいのかなぁ…。

使う上でのコツとかあれば教えてもらえないでしょうか?

あと、どちらのソフトもそれなりに使っているとスマホがめっちゃ熱くなります
ね。やはり輝度をさげるべきなんでしょうね。いっそ音声Onlyに転向すべきなのか?


>Googleレンズ

今現在家ではGoogleHomeによるスマートホーム化を進めているので、端末に
Googleアシスタントがインストールしてあるのですが、その中にGoogleレンズと いう機能があります。

ずっと前に使ってみたときは、認識率の悪さというか誤解析が多すぎて使い物に ならず放置してました。

どなたか使ってみたことありますか?いるならば使用感とか評価をお願いします。




05245 2019/06/27 16:02:42


品川です。

Android版のEnvision AIはどのような状況なのかわかりませんが、iOS版では、人の顔の登録はできますが、物の登録はできません。

すでに登録済みの物をライブラリから指定して物を探すということはできるようになっています。
たとえばTVを指定している場合は、カメラがTVを見つけると、ブルルと振動と効果音で合図してくれます。

昨年のバージョンでは物の登録をするボタンが用意されていました。
私が試みたところ、写真を10枚撮影して名前をタイプしてサーバにアップロードすると、アプリはバグってしまい、アプリを終了しないといけない状況になっていました。
開発者に問い合わせたところ、将来的に改善したいというお答えをいただきました。

おそらくまだ改良されていないために、ユーザ自身が物の写真を撮影して登録することはできないのだろうと思います。


ちなみに、Envision AIがリリースされたころ、登録した物の写真を認識してくれるということで、iOSだけでリリースされていたLookTel Recognizerの代わりになってくれるのではないかと多くの人が期待していました。
LookTel Recognizerの物体認識機能では、ユーザが登録した物をカメラで見分けることができたので、目の前の物が登録したCDなのか本なのかを分類するのに役立っていました。

Envision AIの物の認識の機能はそれとは異なっていて、指定した物だけを教えてくれる機能です。
これはこれで都合がよいわけです。
たとえばテレビのリモコンを探したい時に、部屋をグルリとスマホカメラで探索すれば、どこにあるのか見つけやすくなるからです。

個人的にはライブラリにあるすべての物を読み分けてくれるオプションがあればよいなと思っています。



ところで話は変わりますが、Envision AIと類似の機能を持つアプリとしてマイクロソフトがリリースしているSeeing AIというのがあります。
OCR、風景描写、色認識、明るさのお知らせなど。
まだ日本語ローカライズはされていませんが、今年の秋のバージョンアップで検索結果の読み上げも日本語に対応してくるという話です。
これはマイクロソフトの人がいくつかの講演会でアナウンスしていたそうです。

今はiOS向けにしかリリースされていないのですが、Android版もリリースしてほしいというリクエストはよく届いているそうです。
もし興味があればマイクロソフトに日本語Androidユーザからもリクエストしてみればどうでしょうか?




05246 2019/06/27 16:35:45


僕、大きい幼稚園児。

基本的に体験期間が終了しても、体験で使えた機能は使えますが、
有料班を使う時の料金の紹介は日本語は無く成って英語に成りましたが問題はないと思います。

風景認識でも、特定の物体を調べる場合は、無料のtaptapseeが便利だと思います。

例えばテーブルの上のぬいぐるみを、撮影すると

envisionでは、「リモコンの上に座った猫」と言いました。

これは、テーブルは、昔のゲーム機だったので操作部分が小さく映ったためですが、
taptapseeでは、「ライオンのおもちゃ」と言いました

また壁に掛けた絵は、envisionでは、
「看板の掛けられた壁」と言いましたが、
taptapseeでは、「木製のがくに入った絵」と言いました。

このように視点が違いますので、目的によってアプリを使い分けてください。

参考に、ぬいぐるみはチーターで、絵は、キジムナーという樹木の精霊です。





05252 2019/06/28 08:18:35


早田です。
しばらくメールングリストをチェックできませんでした。

Envisionの件、私も試しに1ヶ月の料金を支払いましたが、Envisionに学習させるからパーソンを選択し顔の写真を撮り名前を入力したもののライブラリに保存できませんでした。
ヘルプに製作者へのお問い合わせがあったので、昨夜、顔の学習と物の学習について問い合わせたところ、数時間後に返信が来ました。
顔の学習については異なる角度から5枚の写真を撮影し名前をつけて保存ができるとのこと。物の学習はまだ対応していないとのことでした。

先程、顔の学習を再度試したところ名前の入力を半角アルファベットにしたら保存に成功しライブラリに名前が登録されました。ひらがなの名前は保存できないようです。この登録した顔をどうやって認識させるのかまだわかりません。




05256 2019/06/28 19:59:01


こんばんは、キクミヤタカアです。


>大きい幼稚園児さん

情報ありがとうございます。しばらくは無料で使ってみて更なる検証をしていこうと思います。

今日アプリを使っていて起こった現象ですが、回線の遅いネットワーク上で直接テキスト読み上げをすると、結果はともかくその後アプリの使用履歴を削除しない限り音楽が鳴り続ける現象がwww

戻るやホームボタンでホーム画面に戻っても検証中の音楽が鳴り続けてました。

あと、やはりめっちゃ熱持ちます。

iOS版もあるかと思い探したのですが、iPADでは見つけられません。

iPhone専用ですかね?「Emvision」という名前は1件見つかりましたが、「AI]が語尾に付いていないので違うのかなぁとか思ってたり。

Taptapseeは今度試してみます。本当にお役立ちで助かります。

最後に、過去ログでスマートウォッチの話題も出していたようなので、今度質問させてもらってもいいですか?すごく興味があります。

>早田さん

アプリの検証お疲れ様です。私は英語がほとんどだめなのでそういった問い合わせは二の足踏んでしまいます。貴重な情報ありがとうございます

>渡井さん

自分もXperiaXZpremium(Android9)でNovaLancherを使用してますが、そういった現象は見られません。

考えられる可能性ですが、私はホーム画面上のグリッド数を減らしてアイコンサイズを大きくし、アイコンラベルのチェックをONにし、用途が似たものはフォルダに纏めているのですが、それで喋らないという不具合には遭遇しておりません。あと、ドックのアイコンにもラベルを付ける設定にしてます。

ただし、私はアプリを有料版にしているので設定可能なのです。さらに弱視なので多少は目で見てフォルダに纏めたりしているのでそういうことが可能なのかもしれません。あくまで参考までに。





    Re: Envision AI_人工知能を使ったOCR - Android-ML 過去ログ に戻る