Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Mengidentifikasi bahasa teks dengan ML Kit di Android

Anda dapat menggunakan ML Kit untuk mengidentifikasi bahasa pada suatu string teks. Anda dapat mengetahui bahasa string yang paling mungkin serta skor keyakinan untuk semua bahasa string yang mungkin.

ML Kit mengenali teks dalam lebih dari 100 bahasa berbeda dalam skrip aslinya. Selain itu, teks berbasis abjad Romawi yang digunakan untuk bahasa Arab, Bulgaria, China, Yunani, Hindi, Jepang, dan Rusia dapat dikenali. Lihat daftar lengkap bahasa dan skrip yang didukung.

	Paket	Dijual Terpisah
Nama library	`com.google.mlkit:language-id`	`com.google.android.gms:play-services-mlkit-language-id`
Penerapan	Model ditautkan secara statis ke aplikasi Anda pada waktu build.	Model didownload secara dinamis melalui Layanan Google Play.
Dampak ukuran aplikasi	Peningkatan ukuran sekitar 900 KB.	Peningkatan ukuran sekitar 200 KB.
Waktu inisialisasi	Model akan langsung tersedia.	Mungkin harus menunggu model didownload sebelum penggunaan pertama.

Cobalah

Coba aplikasi contoh untuk melihat contoh penggunaan API ini.

Sebelum memulai

API ini memerlukan Android API level 23 atau yang lebih tinggi. Pastikan file build aplikasi Anda menggunakan nilai minSdkVersion 23 atau yang lebih tinggi.

Dalam file build.gradle level project, pastikan Anda menyertakan repositori Maven Google di bagian buildscript dan allprojects.

Tambahkan dependensi untuk library Android ML Kit ke file gradle level aplikasi modul Anda, biasanya app/build.gradle. Pilih salah satu dependensi berikut berdasarkan kebutuhan Anda:

Untuk memaketkan model dengan aplikasi Anda:

dependencies {
  // ...
  // Use this dependency to bundle the model with your app
  implementation 'com.google.mlkit:language-id:17.0.6'
}

Untuk menggunakan model di Layanan Google Play:

dependencies {
  // ...
  // Use this dependency to use the dynamically downloaded model in Google Play Services
  implementation 'com.google.android.gms:play-services-mlkit-language-id:17.0.0'
}

Jika Anda memilih untuk menggunakan model di layanan Google Play, Anda dapat mengonfigurasi aplikasi untuk mendownload model secara otomatis ke perangkat setelah aplikasi diinstal dari Google Play Store. Untuk melakukannya, tambahkan deklarasi berikut ke file AndroidManifest.xml aplikasi Anda:
```
<application ...>
      ...
      <meta-data
          android:name="com.google.mlkit.vision.DEPENDENCIES"
          android:value="langid" >
      
</application>
```
Anda juga dapat memeriksa ketersediaan model secara eksplisit dan meminta download melalui ModuleInstallClient API layanan Google Play.

Jika Anda tidak mengaktifkan download model waktu-instal atau meminta download eksplisit, model akan didownload saat pertama kali Anda menjalankan ID. Permintaan yang Anda buat sebelum download selesai tidak akan menghasilkan apa pun.

Mengidentifikasi bahasa string

Untuk mengidentifikasi bahasa string, panggil LanguageIdentification.getClient() untuk mendapatkan instance LanguageIdentifier, lalu teruskan string ke metode identifyLanguage() dari LanguageIdentifier.

Contoh:

Kotlin

val languageIdentifier = LanguageIdentification.getClient()
languageIdentifier.identifyLanguage(text)
        .addOnSuccessListener { languageCode ->
            if (languageCode == "und") {
                Log.i(TAG, "Can't identify language.")
            } else {
                Log.i(TAG, "Language: $languageCode")
            }
        }
        .addOnFailureListener {
            // Model couldn’t be loaded or other internal error.
            // ...
        }LanguageIdentificationActivity.kt

Java

LanguageIdentifier languageIdentifier =
        LanguageIdentification.getClient();
languageIdentifier.identifyLanguage(text)
        .addOnSuccessListener(
                new OnSuccessListener<String>() {
                    @Override
                    public void onSuccess(@Nullable String languageCode) {
                        if (languageCode.equals("und")) {
                            Log.i(TAG, "Can't identify language.");
                        } else {
                            Log.i(TAG, "Language: " + languageCode);
                        }
                    }
                })
        .addOnFailureListener(
                new OnFailureListener() {
                    @Override
                    public void onFailure(@NonNull Exception e) {
                        // Model couldn’t be loaded or other internal error.
                        // ...
                    }
                });LanguageIdentificationActivity.java

Jika panggilan ini berhasil, kode bahasa BCP-47 akan diteruskan ke pemroses yang berhasil, yang menunjukkan bahasa teks. Jika tidak ada bahasa yang dapat dideteksi secara meyakinkan, kode und (tidak ditentukan) akan diteruskan.

Secara default, ML Kit akan menampilkan nilai selain und hanya jika bahasa yang teridentifikasi memiliki tingkat keyakinan minimal 0,5. Anda dapat mengubah nilai minimum ini dengan meneruskan objek LanguageIdentificationOptions ke getClient():

Kotlin

val languageIdentifier = LanguageIdentification
        .getClient(LanguageIdentificationOptions.Builder()
                .setConfidenceThreshold(0.34f)
                .build())LanguageIdentificationActivity.kt

Java

LanguageIdentifier languageIdentifier = LanguageIdentification.getClient(
        new LanguageIdentificationOptions.Builder()
                .setConfidenceThreshold(0.34f)
                .build());LanguageIdentificationActivity.java

Mendapatkan bahasa string yang paling mendekati

Guna mendapatkan tingkat keyakinan untuk bahasa string yang paling mungkin, dapatkan instance LanguageIdentifier, lalu teruskan string tersebut ke metode identifyPossibleLanguages().

Contoh:

Kotlin

val languageIdentifier = LanguageIdentification.getClient()
languageIdentifier.identifyPossibleLanguages(text)
        .addOnSuccessListener { identifiedLanguages ->
            for (identifiedLanguage in identifiedLanguages) {
                val language = identifiedLanguage.languageTag
                val confidence = identifiedLanguage.confidence
                Log.i(TAG, "$language $confidence")
            }
        }
        .addOnFailureListener {
            // Model couldn’t be loaded or other internal error.
            // ...
        }LanguageIdentificationActivity.kt

Java

LanguageIdentifier languageIdentifier =
        LanguageIdentification.getClient();
languageIdentifier.identifyPossibleLanguages(text)
        .addOnSuccessListener(new OnSuccessListener<List<IdentifiedLanguage>>() {
            @Override
            public void onSuccess(List<IdentifiedLanguage> identifiedLanguages) {
                for (IdentifiedLanguage identifiedLanguage : identifiedLanguages) {
                    String language = identifiedLanguage.getLanguageTag();
                    float confidence = identifiedLanguage.getConfidence();
                    Log.i(TAG, language + " (" + confidence + ")");
                }
            }
        })
        .addOnFailureListener(
                new OnFailureListener() {
                    @Override
                    public void onFailure(@NonNull Exception e) {
                        // Model couldn’t be loaded or other internal error.
                        // ...
                    }
                });LanguageIdentificationActivity.java

Jika panggilan ini berhasil, daftar objek IdentifiedLanguage akan diteruskan ke pemroses yang berhasil. Dari setiap objek, Anda bisa mendapatkan kode BCP-47 bahasa dan tingkat keyakinan bahwa string ditulis dalam bahasa tersebut. Perhatikan bahwa nilai ini menunjukkan keyakinan bahwa seluruh string ditulis dalam satu bahasa tertentu; ML Kit tidak mengidentifikasi banyak bahasa dalam satu string.

Secara default, ML Kit hanya menampilkan bahasa dengan nilai keyakinan minimal 0,01. Anda dapat mengubah nilai minimum ini dengan meneruskan objek LanguageIdentificationOptions ke getClient():

Kotlin

val languageIdentifier = LanguageIdentification
      .getClient(LanguageIdentificationOptions.Builder()
              .setConfidenceThreshold(0.5f)
              .build())

Java

LanguageIdentifier languageIdentifier = LanguageIdentification.getClient(
      new LanguageIdentificationOptions.Builder()
              .setConfidenceThreshold(0.5f)
              .build());

Jika tidak ada bahasa yang memenuhi batas minimal ini, daftar akan memiliki satu item, dengan nilai und.

Mengidentifikasi bahasa teks dengan ML Kit di Android Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Cobalah

Sebelum memulai

Mengidentifikasi bahasa string

Kotlin

Java

Kotlin

Java

Mendapatkan bahasa string yang paling mendekati

Kotlin

Java

Kotlin

Java

Mengidentifikasi bahasa teks dengan ML Kit di Android