seeing AIアプリ関連の話 - 文字認識したドキュメントについてお尋ねできる機能「Ask Seeing AI」


06457 2023/12/11 13:08:20


品川です。

MicrosoftはOpenAIのChatGPTを採用した機能を次々に発表していますが、Seeing AIアプリにも実装されています。
ドキュメントのチャンネルで文字認識した内容をchatGPTで解析させることができます。
シーン、写真の内容についても詳しい説明をしてくれます。写真の内容については質問する機能はありません。


ただし、現時点では日本語環境では利用できません。

操作の手順としては、Documentチャンネルで文字認識させると「Ask Seeing AI」というボタンが表示されます。
それを実行するとエディットボックスが現れるので、質問を文字入力してSendボタンをタップします。
日本語で質問できますが、答えは英語でした。
Pixel 7, Android 13、端末の言語は英語に切り替えて試しました。
もし端末の言語を日本語のまま、Seeing AIアプリの言語を英語に指定することができるのであれば、答えは日本語で返ってくると思われます。
実はiOSではそれができるので、答えは日本語で表示されます。

この機能は、文字認識した文書の中から電話番号だけを知りたいとき、そんなばめんで活用できます。
すでにエンビジョングラスでは可能になっている機能でした。
しかし、Ask Seeing AIが興味深いのは複数ページに渡って文字認識した内容に対しても質問できることです。
エンビジョングラスの場合は1ページごとでないと解析してくれません。最新バージョンでは違っているかもしれませんが、今もたぶんそのはず。

早く日本語環境でも使えるようになってほしいものです。
センスプレーヤーでも利用できるようになると、ユーザは一気に増えるでしょうね。


先日アメリカで開催されたSight Tech GlobalのイベントでもSeeing AIのセッションがあり、MicrosoftからSaqib Shaikhさんがスピーカーとして出演されておられました。
その様子は動画でも視聴できますが、transcript 書き起こしテキストも公開されています。

The 2023 Agenda - Sight Tech Global
https://sighttechglobal.com/2023-agenda/


とくに目新しい情報はなさそうでした。
が、先日発表されたウェアラブルのデバイス、Humaneのai Pinの話題に対して、Seeing AIの機能を実装したい。
そのようにSaqibさんはx発言されておられました。

今後のSeeing AIの動きには注目、いや、注耳でしょうかね。




06458 2023/12/12 14:11:04


九曜です。

Seeing AI をセンスプレーヤーにインストールしてみました。
下記がダウンロード先です。
URLが長いので2行以上にまたがってしまうかもしれません。

https://www.apkmirror.com/apk/microsoft-corporation/seeing-ai/seeing-ai-1-0-0-release/seeing-ai-1-0-0-android-apk-download/download/?key=d29f1b9cac6fa1be489288c96c846daae33ed6a1&forcebaseapk=true

こちらでは、短いテキストや光を検出などカメラを向けるだけで動作する機能については問題なく動作していますが、ドキュメントやシーンなどシャッターを切るタイプの機能はん申し訳ございません。問題が発生しました」といって動いてくれません。




06462 2023/12/20 10:36:32


九曜 様

 こんにちは。福岡市の藤川です。

 アプリのご紹介ありがとうございました。

 私もセンスプレーヤーに Seeing AIを入れてみましたが、九曜さんと同様の状況です。

 それでも、紙幣や明るさ、短いテキストの認識がセンスプレーヤーだけでできるのは大変有難いです。

 Sullivan+は、AI認識だけが動作しているみたいです。

 Envision AIは、全く使えない訳ではないけれど、使いたいとは思わない程度だと感じました。

 Lookoutは、Google開発者サービスが入っていないというメッセージに「OK」で答えれば、あとは何とか動作するように思います。

 他にも、センスプレーヤーにインストールできるアプリがあるのでしょうか?

 どこかで APKファイルを見つければ、何とかなるものでしょうか?

 そのあたりのことが、エクストラのホームページを確認しても、よくわかりませんでした。

 何か情報をお持ちでしたら、お教えいただけると有難いです。

 それでは、どうぞ宜しくお願いいたします。




    seeing AIアプリ関連の話 - 文字認識したドキュメントについてお尋ねできる機能「Ask Seeing AI」 - Android-ML 過去ログ に戻る