Сканер документов

Оцифровка физических документов, которая позволяет пользователям преобразовывать физические документы в цифровые форматы, стала очень распространенным занятием пользователей в мобильных приложениях. API сканера документов ML Kit представляет собой комплексное решение с высококачественным и согласованным пользовательским интерфейсом для приложений и устройств Android. После запуска процесса сканирования документов из вашего приложения пользователи сохраняют полный контроль над процессом сканирования. При необходимости они могут обрезать отсканированные документы, применять фильтры, удалять тени и пятна и легко отправлять оцифрованные файлы обратно в ваше приложение.

Поток пользовательского интерфейса, модели машинного обучения и другие крупные ресурсы предоставляются с помощью сервисов Google Play, что означает:

  • Низкое влияние размера двоичного файла (все модели машинного обучения и крупные ресурсы загружаются централизованно в сервисы Google Play).
  • Разрешение камеры не требуется — сканер документов использует разрешение камеры сервисов Google Play, и пользователи сами решают, какими файлами делиться с вашим приложением.

Весь процесс сканирования документов выполняется на устройстве.

Андроид

Ключевые возможности

  • Высококачественный и согласованный пользовательский интерфейс для оцифровки физических документов.
  • Автоматический захват с обнаружением документов.
  • Точное обнаружение краев для достижения оптимальных результатов обрезки.
  • Автоматическое определение поворота для отображения документов в вертикальном положении.
  • Функции редактирования: обрезка, применение фильтров, удаление теней, удаление пятен и беспрепятственная отправка оцифрованных файлов обратно в приложение.
  • Обработка на устройстве, сохраняющая конфиденциальность пользователя.
  • Для вашего приложения не требуется разрешение камеры.
  • Влияние низкого размера двоичного файла APK.

Кастомизация

API сканера документов обеспечивает высококачественный полноценный пользовательский интерфейс, единый для всех приложений Android. Однако есть возможность настроить некоторые аспекты взаимодействия с пользователем:

  • Максимальное количество страниц:
    Установите ограничение на количество сканируемых страниц.

  • Импорт галереи:
    Включите или отключите возможность импорта из фотогалереи.

  • Функции редактирования:
    Настройте функции редактирования, доступные пользователю, выбрав один из трех режимов:

    • SCANNER_MODE_BASE : базовые возможности редактирования (обрезка, поворот, изменение порядка страниц и т. д.).
    • SCANNER_MODE_BASE_WITH_FILTER : добавляет фильтры изображений (оттенки серого, автоматическое улучшение изображения и т. д.) в режим SCANNER_MODE_BASE .
    • SCANNER_MODE_FULL (по умолчанию): добавляет возможности очистки изображений с поддержкой ML (удаление пятен, пальцев и т. д.) в режим SCANNER_MODE_BASE_WITH_FILTER . Этот режим также позволит автоматически добавлять будущие основные функции вместе с обновлениями сервисов Google Play, в то время как два других режима сохранят свои текущие наборы функций и получат лишь незначительные улучшения.
Базовый режим Базовый режим с фильтром Полный режим

Примеры результатов

Исходное изображение Отсканированный документ с исправленной перспективой, удаленными морщинами и примененным фильтром оттенков серого.
Исходное изображение Отсканированный документ автоматически поворачивается, пятна удалены и применен цветной фильтр.
Исходное изображение Отсканированный документ с удаленными пятнами и примененным автоматическим фильтром.
Исходное изображение Отсканированный документ автоматически поворачивается, удаляется тень и применяется автоматический фильтр.
Исходное изображение Отсканированный документ автоматически поворачивается при удалении пальца и применении автоматического фильтра.