คุณใช้ ML Kit เพื่อตรวจจับใบหน้าในรูปภาพและวิดีโอที่เหมือนกับเซลฟีได้
API การตรวจจับเมชใบหน้า | |
---|---|
ชื่อ SDK | face-mesh-detection |
การใช้งาน | โค้ดและเนื้อหาจะลิงก์กับแอปของคุณแบบคงที่ ณ เวลาบิลด์ |
ผลกระทบต่อขนาดแอป | ~6.4MB |
ประสิทธิภาพ | เรียลไทม์บนอุปกรณ์ส่วนใหญ่ |
ลองเลย
- ลองใช้แอปตัวอย่างเพื่อ ดูตัวอย่างการใช้ API นี้
ก่อนเริ่มต้น
ในไฟล์
build.gradle
ระดับโปรเจ็กต์ ตรวจสอบว่าได้รวม ที่เก็บ Maven ทั้งในส่วนบิลด์และโปรเจ็กต์ทั้งหมดเพิ่มทรัพยากร Dependency สำหรับคลังการตรวจจับ Mesh ของ ML Kit ไว้ใน ไฟล์ Gradle ระดับแอปของโมดูล ซึ่งปกติคือ
app/build.gradle
:dependencies { // ... implementation 'com.google.mlkit:face-mesh-detection:16.0.0-beta1' }
หลักเกณฑ์เกี่ยวกับรูปภาพที่ป้อน
ควรถ่ายภาพจากกล้องของอุปกรณ์ในระยะประมาณ 2 เมตร (~7 ฟุต) ว่าด้านมีขนาดใหญ่พอสำหรับการรู้จำใบหน้าที่ดีที่สุด ใน โดยทั่วไปแล้ว ยิ่งใบหน้ามีขนาดใหญ่เท่าใด การจดจำใบหน้าแบบตาข่ายก็ยิ่งดีขึ้นเท่านั้น
ใบหน้าควรหันเข้าหากล้องโดยให้เห็นใบหน้าอย่างน้อยครึ่งหนึ่ง วัตถุขนาดใหญ่ใดๆ ที่อยู่ระหว่างใบหน้าและกล้องอาจทำให้ ความแม่นยำ
หากคุณต้องการตรวจจับใบหน้าในแอปพลิเคชันแบบเรียลไทม์ คุณควร พิจารณาขนาดโดยรวมของรูปภาพอินพุต รูปภาพขนาดเล็กกว่าได้ ประมวลผลเร็วขึ้น ดังนั้นการจับภาพด้วยความละเอียดที่ต่ำลงจะช่วยลดเวลาในการตอบสนองได้ อย่างไรก็ตาม โปรดคำนึงถึงข้อกำหนดเกี่ยวกับความถูกต้องข้างต้นและตรวจสอบว่า ใบหน้าของวัตถุใช้พื้นที่ในรูปภาพมากที่สุด
กำหนดค่าตัวตรวจจับ Mesh
หากต้องการเปลี่ยนการตั้งค่าเริ่มต้นของตัวตรวจจับตาข่ายใบหน้า ให้ระบุ การตั้งค่าเหล่านั้นด้วย FaceMeshDetectorOptions ออบเจ็กต์ คุณสามารถเปลี่ยนการตั้งค่าต่อไปนี้ได้
setUseCase
BOUNDING_BOX_ONLY
: มอบเฉพาะกรอบล้อมรอบสำหรับตาข่ายตรวจจับใบหน้าที่ตรวจพบเท่านั้น นี่เป็นการตรวจจับใบหน้าที่เร็วที่สุด แต่มีข้อจำกัดด้านช่วง(ค้นหาใบหน้า ต้องอยู่ห่างจากกล้องไม่เกิน 2 เมตรหรือประมาณ 7 ฟุต)FACE_MESH
(ตัวเลือกเริ่มต้น): มีกรอบล้อมรอบและด้านเพิ่มเติม ข้อมูล Mesh (468 จุด 3 มิติและข้อมูลสามเหลี่ยม) เมื่อเทียบกับ กรณีการใช้งานBOUNDING_BOX_ONLY
เวลาในการตอบสนองเพิ่มขึ้นประมาณ 15% ตามที่วัดเมื่อ Pixel 3
เช่น
Kotlin
val defaultDetector = FaceMeshDetection.getClient( FaceMeshDetectorOptions.DEFAULT_OPTIONS) val boundingBoxDetector = FaceMeshDetection.getClient( FaceMeshDetectorOptions.Builder() .setUseCase(UseCase.BOUNDING_BOX_ONLY) .build() )
Java
FaceMeshDetector defaultDetector = FaceMeshDetection.getClient( FaceMeshDetectorOptions.DEFAULT_OPTIONS); FaceMeshDetector boundingBoxDetector = FaceMeshDetection.getClient( new FaceMeshDetectorOptions.Builder() .setUseCase(UseCase.BOUNDING_BOX_ONLY) .build() );
เตรียมรูปภาพอินพุต
หากต้องการตรวจจับใบหน้าในรูปภาพ ให้สร้างออบเจ็กต์ InputImage
จาก
Bitmap
, media.Image
, ByteBuffer
, ไบต์อาร์เรย์ หรือไฟล์ในอุปกรณ์
จากนั้นส่งออบเจ็กต์ InputImage
ไปยังเมธอด process
ของ FaceDetector
สำหรับการตรวจจับตาข่ายของใบหน้า คุณควรใช้รูปภาพที่มีขนาดอย่างน้อย 480x360 พิกเซล หากตรวจจับใบหน้าแบบเรียลไทม์ ให้จับภาพเฟรม ความละเอียดขั้นต่ำนี้จะช่วยลดเวลาในการตอบสนองได้
คุณสามารถสร้างInputImage
จากแหล่งที่มาต่างๆ ซึ่งอธิบายไว้ด้านล่าง
กำลังใช้media.Image
วิธีสร้าง InputImage
จากออบเจ็กต์ media.Image
เช่น เมื่อคุณจับภาพจาก
กล้องของอุปกรณ์ ส่งวัตถุ media.Image
และ
การหมุนเวียนเป็น InputImage.fromMediaImage()
หากคุณใช้แท็ก
ไลบรารี CameraX, OnImageCapturedListener
และ
ImageAnalysis.Analyzer
คลาสจะคำนวณค่าการหมุนเวียน
สำหรับคุณ
Kotlin
private class YourImageAnalyzer : ImageAnalysis.Analyzer { override fun analyze(imageProxy: ImageProxy) { val mediaImage = imageProxy.image if (mediaImage != null) { val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees) // Pass image to an ML Kit Vision API // ... } } }
Java
private class YourAnalyzer implements ImageAnalysis.Analyzer { @Override public void analyze(ImageProxy imageProxy) { Image mediaImage = imageProxy.getImage(); if (mediaImage != null) { InputImage image = InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees()); // Pass image to an ML Kit Vision API // ... } } }
ถ้าคุณไม่ได้ใช้ไลบรารีกล้องถ่ายรูปที่ให้องศาการหมุนของภาพ คุณ สามารถคำนวณได้จากระดับการหมุนของอุปกรณ์และการวางแนวของกล้อง เซ็นเซอร์ในอุปกรณ์:
Kotlin
private val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 0) ORIENTATIONS.append(Surface.ROTATION_90, 90) ORIENTATIONS.append(Surface.ROTATION_180, 180) ORIENTATIONS.append(Surface.ROTATION_270, 270) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // Get the device's sensor orientation. val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360 } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360 } return rotationCompensation }
Java
private static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 0); ORIENTATIONS.append(Surface.ROTATION_90, 90); ORIENTATIONS.append(Surface.ROTATION_180, 180); ORIENTATIONS.append(Surface.ROTATION_270, 270); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // Get the device's sensor orientation. CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); if (isFrontFacing) { rotationCompensation = (sensorOrientation + rotationCompensation) % 360; } else { // back-facing rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360; } return rotationCompensation; }
จากนั้นส่งออบเจ็กต์ media.Image
และ
ค่าองศาการหมุนเป็น InputImage.fromMediaImage()
:
Kotlin
val image = InputImage.fromMediaImage(mediaImage, rotation)
Java
InputImage image = InputImage.fromMediaImage(mediaImage, rotation);
การใช้ URI ของไฟล์
วิธีสร้าง InputImage
จาก URI ของไฟล์ แล้วส่งบริบทของแอปและ URI ของไฟล์ไปยัง
InputImage.fromFilePath()
วิธีนี้มีประโยชน์เมื่อคุณ
ใช้ Intent ACTION_GET_CONTENT
เพื่อแจ้งให้ผู้ใช้เลือก
รูปภาพจากแอปแกลเลอรี
Kotlin
val image: InputImage try { image = InputImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() }
Java
InputImage image; try { image = InputImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); }
กำลังใช้ByteBuffer
หรือByteArray
วิธีสร้าง InputImage
จาก ByteBuffer
หรือ ByteArray
ให้คำนวณรูปภาพก่อน
องศาการหมุนตามที่อธิบายไว้ก่อนหน้านี้สำหรับอินพุต media.Image
จากนั้นสร้างออบเจ็กต์ InputImage
พร้อมบัฟเฟอร์หรืออาร์เรย์ ร่วมกับรูปภาพ
ความสูง ความกว้าง รูปแบบการเข้ารหัสสี และระดับการหมุน:
Kotlin
val image = InputImage.fromByteBuffer( byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ) // Or: val image = InputImage.fromByteArray( byteArray, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 )
Java
InputImage image = InputImage.fromByteBuffer(byteBuffer, /* image width */ 480, /* image height */ 360, rotationDegrees, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 ); // Or: InputImage image = InputImage.fromByteArray( byteArray, /* image width */480, /* image height */360, rotation, InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12 );
กำลังใช้Bitmap
วิธีสร้าง InputImage
จากออบเจ็กต์ Bitmap
ให้ทำการประกาศต่อไปนี้
Kotlin
val image = InputImage.fromBitmap(bitmap, 0)
Java
InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);
รูปภาพจะแสดงเป็นวัตถุ Bitmap
ร่วมกับองศาการหมุน
ประมวลผลรูปภาพ
ส่งรูปภาพไปยังเมธอด process
:
Kotlin
val result = detector.process(image) .addOnSuccessListener { result -> // Task completed successfully // … } .addOnFailureListener { e -> // Task failed with an exception // … }
Java
Task<List<FaceMesh>> result = detector.process(image) .addOnSuccessListener( new OnSuccessListener<List<FaceMesh>>() { @Override public void onSuccess(List<FaceMesh> result) { // Task completed successfully // … } }) .addOnFailureListener( new OnFailureListener() { @Override Public void onFailure(Exception e) { // Task failed with an exception // … } });
รับข้อมูลเกี่ยวกับตาข่ายตรวจจับใบหน้าที่ตรวจพบ
หากตรวจพบใบหน้าในภาพ ระบบจะส่งรายการวัตถุ FaceMesh
รายการไปยัง
ผู้ฟังที่ประสบความสำเร็จ FaceMesh
แต่ละรายการแสดงใบหน้าที่ตรวจพบใน
รูปภาพ สําหรับตาข่ายของแต่ละด้าน คุณสามารถดูพิกัดขอบเขตของสิ่งนั้นในอินพุต
และข้อมูลอื่นๆ ที่คุณกำหนดค่า Face Mesh ไว้
ตัวตรวจจับเพื่อค้นหา
Kotlin
for (faceMesh in faceMeshs) { val bounds: Rect = faceMesh.boundingBox() // Gets all points val faceMeshpoints = faceMesh.allPoints for (faceMeshpoint in faceMeshpoints) { val index: Int = faceMeshpoints.index() val position = faceMeshpoint.position } // Gets triangle info val triangles: List<Triangle<FaceMeshPoint>> = faceMesh.allTriangles for (triangle in triangles) { // 3 Points connecting to each other and representing a triangle area. val connectedPoints = triangle.allPoints() } }
Java
for (FaceMesh faceMesh : faceMeshs) { Rect bounds = faceMesh.getBoundingBox(); // Gets all points List<FaceMeshPoint> faceMeshpoints = faceMesh.getAllPoints(); for (FaceMeshPoint faceMeshpoint : faceMeshpoints) { int index = faceMeshpoints.getIndex(); PointF3D position = faceMeshpoint.getPosition(); } // Gets triangle info List<Triangle<FaceMeshPoint>> triangles = faceMesh.getAllTriangles(); for (Triangle<FaceMeshPoint> triangle : triangles) { // 3 Points connecting to each other and representing a triangle area. List<FaceMeshPoint> connectedPoints = triangle.getAllPoints(); } }