ドキュメント スキャナ

紙のドキュメントをデジタル化してデジタル形式に変換することは、モバイルアプリで一般的なユーザー ジャーニーになっています。ML Kit の Document Scanner API は、Android アプリとデバイス間で高品質で一貫した UI フローを備えた包括的なソリューションを提供します。アプリからドキュメント スキャナのフローがトリガーされると、ユーザーはスキャン プロセスを完全に制御できます。必要に応じて、スキャンしたドキュメントの切り抜き、フィルタの適用、影や汚れの除去を行うことができます。また、デジタル化されたファイルをアプリに簡単に返送することもできます。

UI フロー、ML モデル、その他の大規模リソースは、Google Play 開発者サービスを使用して配信されます。つまり、次のことを行います。

  • バイナリサイズへの影響が小さい(すべての ML モデルと大規模なリソースが Google Play 開発者サービスで一元的にダウンロードされます)。
  • カメラの権限は必要ありません。ドキュメント スキャナは Google Play 開発者サービスのカメラの権限を利用し、ユーザーはどのファイルをアプリと共有するかを選択できます。

ドキュメント スキャナ フロー全体はデバイス上で動作します。

Android

主な機能

  • 物理ドキュメントをデジタル化するための高品質で一貫性のあるユーザー インターフェース。
  • ドキュメント検出による自動キャプチャ。
  • 正確なエッジ検出で最適な切り抜きを実現。
  • ドキュメントを縦向きで表示するための自動回転検出機能。
  • 切り抜き、フィルタの適用、シャドウの除去、汚れの除去、デジタル化されたファイルのシームレスなアプリへの送信を行う編集機能。
  • デバイス上の処理により、ユーザーのプライバシーを保護します。
  • アプリからカメラへのアクセス許可を得る必要はありません。
  • APK のバイナリサイズへの影響が小さい。

カスタマイズ

Document Scanner API は、Android アプリ間で一貫性のある、高品質で本格的な UI フローを提供します。ただし、ユーザー エクスペリエンスの一部をカスタマイズすることもできます。

  • 最大ページ数:
    スキャンするページ数の上限を設定します。

  • ギャラリーのインポート:
    フォト ギャラリーからインポートする機能を有効または無効にします。

  • 編集機能:
    次の 3 つのモードから選択して、ユーザーが利用できる編集機能をカスタマイズします。

    • SCANNER_MODE_BASE: 基本的な編集機能(ページの切り抜き、回転、並べ替えなど)。
    • SCANNER_MODE_BASE_WITH_FILTER: SCANNER_MODE_BASE モードに画像フィルタ(グレースケール、自動画像補正など)を追加します。
    • SCANNER_MODE_FULL(デフォルト): ML 対応の画像クリーニング機能(汚れや指の消去など)を SCANNER_MODE_BASE_WITH_FILTER モードに追加します。このモードでは、今後の主要機能も Google Play 開発者サービスのアップデートに自動的に追加されます。他の 2 つのモードでは、現在の機能セットが維持され、微調整のみが行われます。
ベースモード ベースモード(フィルタあり) フルモード

検索結果の例

元の画像 視点が修正され、しわが除去され、グレースケール フィルタが適用されたスキャンされたドキュメント
元の画像 汚れを取り除き、カラーフィルタを適用して、スキャンしたドキュメントを自動的に回転させます
元の画像 スキャンしたドキュメントに染みを取り除き、自動フィルタを適用した画像
元の画像 スキャンしたドキュメントの自動回転(シャドウを削除して自動フィルタを適用)
元の画像 スキャンしたドキュメントは、指を離して自動フィルタを適用して自動回転しました