Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Segmentación de selfies con ML Kit en Android

ML Kit proporciona un SDK optimizado para la segmentación de selfies.

Los recursos de Selfie Segmenter se vinculan de forma estática a tu app en el tiempo de compilación. Esto aumentará el tamaño de descarga de tu app en aproximadamente 4.5 MB, y la latencia de la API puede variar de 25 ms a 65 ms, según el tamaño de la imagen de entrada, medido en un Pixel 4.

Probar

Juega con la app de ejemplo para ver un ejemplo de uso de esta API.

Antes de comenzar

Esta API requiere el nivel de API de Android 23 o superior. Asegúrate de que el archivo de compilación de tu app use un valor minSdkVersion de 23 o superior.

En tu archivo build.gradle de nivel de proyecto, asegúrate de incluir el repositorio de Maven de Google en las secciones buildscript y allprojects.
Agrega las dependencias para las bibliotecas de Android de ML Kit al archivo Gradle a nivel de la app de tu módulo, que suele ser app/build.gradle:

dependencies {
  implementation 'com.google.mlkit:segmentation-selfie:16.0.0-beta6'
}

1. Crea una instancia de Segmenter

Opciones de Segmenter

Para realizar la segmentación en una imagen, primero crea una instancia de Segmenter especificando las siguientes opciones.

Modo de detector

El Segmenter opera en dos modos. Asegúrate de elegir el que coincida con tu caso de uso.

STREAM_MODE (default)

Este modo está diseñado para transmitir fotogramas desde video o cámara. En este modo, el segmentador aprovechará los resultados de los fotogramas anteriores para mostrar resultados de segmentación más fluidos.

SINGLE_IMAGE_MODE

Este modo está diseñado para imágenes individuales que no están relacionadas. En este modo, el segmentador procesará cada imagen de forma independiente, sin suavizar los fotogramas.

Habilita la máscara de tamaño sin procesar

Le solicita al segmentador que muestre la máscara de tamaño sin procesar que coincida con el tamaño de salida del modelo.

El tamaño de la máscara sin procesar (p.ej., 256 x 256) suele ser más pequeño que el tamaño de la imagen de entrada. Llama a SegmentationMask#getWidth() y SegmentationMask#getHeight() para obtener el tamaño de la máscara cuando habilites esta opción.

Si no se especifica esta opción, el segmentador cambiará la escala de la máscara sin procesar para que coincida con el tamaño de la imagen de entrada. Considera usar esta opción si deseas aplicar una lógica de cambio de escala personalizada o si no es necesario cambiar la escala para tu caso de uso.

Especifica las opciones del segmentador:

Kotlin

val options =
        SelfieSegmenterOptions.Builder()
            .setDetectorMode(SelfieSegmenterOptions.STREAM_MODE)
            .enableRawSizeMask()
            .build()

Java

SelfieSegmenterOptions options =
        new SelfieSegmenterOptions.Builder()
            .setDetectorMode(SelfieSegmenterOptions.STREAM_MODE)
            .enableRawSizeMask()
            .build();

Crea una instancia de Segmenter. Pasa las opciones que especificaste:

Kotlin

val segmenter = Segmentation.getClient(options)

Java

Segmenter segmenter = Segmentation.getClient(options);

2. Prepara la imagen de entrada

Para realizar la segmentación en una imagen, crea un objeto InputImage a partir de un Bitmap, una media.Image, un ByteBuffer, un array de bytes o un archivo ubicado en el dispositivo.

Puedes crear un InputImage objeto a partir de diferentes fuentes, cada una de las cuales se explica a continuación.

Usa un `media.Image`

Para crear un InputImage objeto a partir de un objeto media.Image, como cuando se captura una imagen con la cámara de un dispositivo, pasa el objeto media.Image y la rotación de la imagen a InputImage.fromMediaImage().

Si usas la biblioteca CameraX, las clases OnImageCapturedListener y ImageAnalysis.Analyzer calculan el valor de rotación por ti.

Kotlin

private class YourImageAnalyzer : ImageAnalysis.Analyzer {

    override fun analyze(imageProxy: ImageProxy) {
        val mediaImage = imageProxy.image
        if (mediaImage != null) {
            val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees)
            // Pass image to an ML Kit Vision API
            // ...
        }
    }
}

Java

private class YourAnalyzer implements ImageAnalysis.Analyzer {

    @Override
    public void analyze(ImageProxy imageProxy) {
        Image mediaImage = imageProxy.getImage();
        if (mediaImage != null) {
          InputImage image =
                InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees());
          // Pass image to an ML Kit Vision API
          // ...
        }
    }
}

Si no usas una biblioteca de cámaras que te proporcione el grado de rotación de la imagen, puedes calcularla a partir de la rotación del dispositivo y la orientación del sensor de la cámara en el dispositivo:

Kotlin

private val ORIENTATIONS = SparseIntArray()

init {
    ORIENTATIONS.append(Surface.ROTATION_0, 0)
    ORIENTATIONS.append(Surface.ROTATION_90, 90)
    ORIENTATIONS.append(Surface.ROTATION_180, 180)
    ORIENTATIONS.append(Surface.ROTATION_270, 270)
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
@Throws(CameraAccessException::class)
private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    val deviceRotation = activity.windowManager.defaultDisplay.rotation
    var rotationCompensation = ORIENTATIONS.get(deviceRotation)

    // Get the device's sensor orientation.
    val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager
    val sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION)!!

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360
    }
    return rotationCompensation
}MLKitVisionImage.kt

Java

private static final SparseIntArray ORIENTATIONS = new SparseIntArray();
static {
    ORIENTATIONS.append(Surface.ROTATION_0, 0);
    ORIENTATIONS.append(Surface.ROTATION_90, 90);
    ORIENTATIONS.append(Surface.ROTATION_180, 180);
    ORIENTATIONS.append(Surface.ROTATION_270, 270);
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing)
        throws CameraAccessException {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation();
    int rotationCompensation = ORIENTATIONS.get(deviceRotation);

    // Get the device's sensor orientation.
    CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE);
    int sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION);

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360;
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360;
    }
    return rotationCompensation;
}

Luego, pasa el objeto media.Image y el valor de grado de rotación a InputImage.fromMediaImage():

Kotlin

val image = InputImage.fromMediaImage(mediaImage, rotation)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromMediaImage(mediaImage, rotation);

Usa un URI de archivo

Para crear un InputImage objeto a partir de un URI de archivo, pasa el contexto de la app y el URI del archivo a InputImage.fromFilePath(). Esto es útil cuando usas un intent ACTION_GET_CONTENT para solicitarle al usuario que seleccione una imagen de su app de galería.

Kotlin

val image: InputImage
try {
    image = InputImage.fromFilePath(context, uri)
} catch (e: IOException) {
    e.printStackTrace()
}MLKitVisionImage.kt

Java

InputImage image;
try {
    image = InputImage.fromFilePath(context, uri);
} catch (IOException e) {
    e.printStackTrace();
}

Usa un `ByteBuffer` o `ByteArray`

Para crear un InputImage objeto a partir de un ByteBuffer o un ByteArray, primero calcula el grado de rotación de la imagen como se describió anteriormente en la entrada media.Image. Luego, crea el objeto InputImage con el búfer o el array, junto con la altura, el ancho, el formato de codificación de color y el grado de rotación de la imagen:

Kotlin

val image = InputImage.fromByteBuffer(
        byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)MLKitVisionImage.kt
// Or:
val image = InputImage.fromByteArray(
        byteArray,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)
MLKitVisionImage.kt

Java

InputImage image = InputImage.fromByteBuffer(byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java
// Or:
InputImage image = InputImage.fromByteArray(
        byteArray,
        /* image width */480,
        /* image height */360,
        rotation,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java

Usa un `Bitmap`

Para crear un objeto InputImage a partir de un objeto Bitmap, haz la siguiente declaración:

Kotlin

val image = InputImage.fromBitmap(bitmap, 0)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);MLKitVisionImage.java

La imagen está representada por un objeto Bitmap junto con los grados de rotación.

3. Procesa la imagen

Pasa el objeto InputImage preparado al método process del Segmenter.

Kotlin

Task<SegmentationMask> result = segmenter.process(image)
       .addOnSuccessListener { results ->
           // Task completed successfully
           // ...
       }
       .addOnFailureListener { e ->
           // Task failed with an exception
           // ...
       }

Java

Task<SegmentationMask> result =
        segmenter.process(image)
                .addOnSuccessListener(
                        new OnSuccessListener<SegmentationMask>() {
                            @Override
                            public void onSuccess(SegmentationMask mask) {
                                // Task completed successfully
                                // ...
                            }
                        })
                .addOnFailureListener(
                        new OnFailureListener() {
                            @Override
                            public void onFailure(@NonNull Exception e) {
                                // Task failed with an exception
                                // ...
                            }
                        });

Nota: Si usas la API de CameraX, asegúrate de cerrar el ImageProxy cuando termines de usarlo, por ejemplo, agregando un OnCompleteListener al Task que se muestra desde el process método. Consulta la clase VisionProcessorBase de la app de ejemplo de inicio rápido para ver un ejemplo.

4. Obtén el resultado de la segmentación

Puedes obtener el resultado de la segmentación de la siguiente manera:

Kotlin

val mask = segmentationMask.getBuffer()
val maskWidth = segmentationMask.getWidth()
val maskHeight = segmentationMask.getHeight()

for (val y = 0; y < maskHeight; y++) {
  for (val x = 0; x < maskWidth; x++) {
    // Gets the confidence of the (x,y) pixel in the mask being in the foreground.
    val foregroundConfidence = mask.getFloat()
  }
}

Java

ByteBuffer mask = segmentationMask.getBuffer();
int maskWidth = segmentationMask.getWidth();
int maskHeight = segmentationMask.getHeight();

for (int y = 0; y < maskHeight; y++) {
  for (int x = 0; x < maskWidth; x++) {
    // Gets the confidence of the (x,y) pixel in the mask being in the foreground.
    float foregroundConfidence = mask.getFloat();
  }
}

Para ver un ejemplo completo de cómo usar los resultados de la segmentación, consulta la muestra de inicio rápido del ML Kit.

Sugerencias para mejorar el rendimiento

La calidad de los resultados depende de la calidad de la imagen de entrada:

Para que ML Kit obtenga un resultado de segmentación preciso, la imagen debe tener al menos 256 x 256 píxeles.
El enfoque deficiente de la imagen también puede afectar la precisión. Si no obtienes resultados aceptables, pídele al usuario que vuelva a capturar la imagen.

Si quieres usar la segmentación en una aplicación en tiempo real, sigue estos lineamientos para lograr la mejor velocidad de fotogramas:

Utiliza STREAM_MODE.
Considera capturar imágenes con una resolución más baja. Sin embargo, también ten en cuenta los requisitos de dimensión de imagen de esta API.
Considera habilitar la opción de máscara de tamaño sin procesar y combinar toda la lógica de cambio de escala. Por ejemplo, en lugar de permitir que la API cambie la escala de la máscara para que coincida con el tamaño de la imagen de entrada primero y, luego, volver a cambiarla para que coincida con el tamaño de la vista para la visualización, solo solicita la máscara de tamaño sin procesar y combina estos dos pasos en uno.
Si usas la Camera o camera2 API, limita las llamadas al detector. Si hay un fotograma de video nuevo disponible mientras se ejecuta el detector, ignora ese fotograma. Consulta la clase VisionProcessorBase de la app de ejemplo de inicio rápido para ver un ejemplo.
Si usas la CameraX API, asegúrate de que la estrategia de contrapresión esté configurada en su valor predeterminado ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST. Esto garantiza que solo se entregará una imagen para el análisis a la vez. Si se producen más imágenes cuando el analizador está ocupado, se descartarán automáticamente y no se pondrán en cola para la entrega. Una vez que se cierre la imagen que se está analizando llamando a ImageProxy.close(), se entregará la siguiente imagen más reciente.
Si estás usando la salida del detector para superponer gráficos en la imagen de entrada, primero obtén el resultado de la detección de ML Kit y, luego, procesa la imagen y la superposición en un solo paso. De esta manera, procesas en la superficie de visualización solo una vez por cada fotograma de entrada. Consulta las clases CameraSourcePreview y GraphicOverlay en la app de ejemplo de inicio rápido para ver un ejemplo.
Si usas la API de Camera2, captura imágenes en ImageFormat.YUV_420_888 formato. Si usas la API de Camera más antigua, captura imágenes en ImageFormat.NV21 formato.

Segmentación de selfies con ML Kit en Android Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Probar

Antes de comenzar

1. Crea una instancia de Segmenter

Opciones de Segmenter

Modo de detector

Habilita la máscara de tamaño sin procesar

Kotlin

Java

Kotlin

Java

2. Prepara la imagen de entrada

Usa un media.Image

Kotlin

Java

Kotlin

Java

Kotlin

Java

Usa un URI de archivo

Kotlin

Java

Usa un ByteBuffer o ByteArray

Kotlin

Java

Usa un Bitmap

Kotlin

Java

3. Procesa la imagen

Kotlin

Java

4. Obtén el resultado de la segmentación

Kotlin

Java

Sugerencias para mejorar el rendimiento

Segmentación de selfies con ML Kit en Android

Usa un `media.Image`

Usa un `ByteBuffer` o `ByteArray`

Usa un `Bitmap`