A API de reconhecimento de texto do Kit de ML é capaz de reconhecer texto em vários scripts e idiomas. Há três níveis de suporte de idioma:
- Os idiomas compatíveis são aqueles que priorizamos e cujos desempenhos avaliamos regularmente.
- Os idiomas experimentais são os que estão em desenvolvimento ativo, mas não são avaliados regularmente.
- Os idiomas mapeados são aqueles com suporte ao mapeamento para
outro código de idioma ou para um reconhecedor geral de caracteres. Por exemplo,
"
en-GB" é compatível, mas não é tratado de maneira diferente de "en" para reconhecer texto.
Idiomas compatíveis
Os idiomas a seguir são priorizados e avaliados regularmente.
Para filtrar por idioma, digite o idioma desejado na caixa de pesquisa abaixo:
| linguagem | Idioma (nome em português) | Código de idioma BCP-47 | Script / observações |
|---|---|---|---|
| Africâner | Africâner | af | Latn |
| shqip | Albanês | sq | Latn |
| Catalão | Catalão | ca | Latn |
| 中文 | Chinês | zh | Hans/Hant; com suporte na v2 |
| Hrvatski | Croata | h | Latn |
| Čeština | Tcheco | cs | Latn |
| Dansk | Dinamarquês | da | Latn |
| Nederlands | Holandês | nl | Latn |
| Inglês | Inglês | en | Latn; Americano |
| Eesti keel | Estoniano | et | Latn |
| Filipino | Filipino | fil ou tl | Latn |
| Suomi | Finlandês | fi | Latn |
| Français | Francês | fr | Latn; Europeu |
| Deutsch | Alemão | de | Latn |
| हिन्दी | Hindi | hi | Deva; suportado na v2 |
| Magyar | Húngaro | hu | Latn |
| Íslenska | Islandês | é | Latn |
| Bahasa Indonesia | Indonésio | id | Latn |
| Italiano | Italiano | it | Latn |
| 日本語 | Japonês | ja | Jpan; suportado na v2 |
| 한국어 | Coreano | ko | Kore; suportado na v2 |
| Latviešu | Letão | lv | Latn |
| Lietuvių | Lituano | lt | Latn |
| Bahasa Melayu | Malaio | ms | Latn |
| मराठी | Marati | mr | Deva; suportado na v2 |
| नेपाली | Nepalês | ne | Deva; suportado na v2 |
| Norsk | Norueguês | não | Latn; Bokmål |
| Polski | Polonês | pl | Latn |
| Português | Português | pt | Latn; Brasileiro |
| Română | Romeno | ro | Latn |
| Српски (латиница) | Sérvio | sr-Latn | Latn |
| Slovenčina | Eslovaco | sk | Latn |
| Slovenščina | Esloveno | sl | Latn |
| Español | Espanhol | es | Latn; Europeu |
| Svenska | Sueco | sv | Latn |
| Türkçe | Turco | tr | Latn |
| Tiếng Việt | Vietnamita | vi | Latn |
Idiomas experimentais
Os idiomas a seguir estão em desenvolvimento ativo e ainda não são avaliados regularmente.
| linguagem | Idioma (nome em português) | Código de idioma BCP-47 | Script / observações |
|---|---|---|---|
| Azərbaycan | Azerbaijano | az | Latn |
| Euskara | Basco | eu | Latn |
| Bosanski | Bósnio | bs | Latn |
| Cebuano | Cebuano | ceb | Latn |
| Esperanto | Esperanto | eo | Latn |
| Galego | Galego | gl | Latn |
| Kreyòl Ayisyen | Creole haitiano | ht | Latn |
| Gaeilge | Irlandês | ga | Latn |
| Jawa | Javanês | jv | Latn |
| Latim | Latina | la | Latn |
| Malti | Maltês | mt | Latn |
| संस्कृतम् | Sânscrito | sa | Deva; suportado na v2 |
| Suaíli | Suaíli | sw | Latn |
| oʻzbekcha | Usbeque | uz | Latn |
| Cymraeg | Galês | cy | Latn |
| IsiZulu | Zulu | zu | Latn |
Idiomas mapeados
Os idiomas a seguir são mapeados para outro código de idioma ou para um reconhecedor geral de caracteres.
| linguagem | Idioma (nome em português) | Código de idioma BCP-47 | Script / observações | Mapeado para |
|---|---|---|---|---|
| بهسا | Achém | ace | Latn | Modelo de script latino |
| Lwo | Acholi | ach | Latn | Modelo de script latino |
| Dangme | Adangme | ada | Latn | Modelo de script latino |
| Akan | Akan | ak | Latn | Modelo de script latino |
| Anicinâbemowin | Algonquinian | alg | Latn | Modelo de script latino |
| Mapudungu | Araucanian/Mapuche | arn | Latn | Modelo de script latino |
| Asturianu | Asturiano | ast | Latn | Modelo de script latino |
| Dene | Athabaskan | ath | Latn | Modelo de script latino |
| Aymar aru | Aymara | ay | Latn | Modelo de script latino |
| Bhāṣa Bali | Balinês | ban | Latn | Modelo de script latino |
| Bamanankan | Bambara | bm | Latn | Modelo de script latino |
| Narrow Bantu | Bantu | bnt | Latn | Modelo de script latino |
| Toba–Batak | Batak | btk | Latn | Modelo de script latino |
| Chibemba | Bemba | bem | Latn | Modelo de script latino |
| Bikol Naga | Bikol | bik | Latn | Modelo de script latino |
| Bichelamar | Bislamá | bi | Latn | Modelo de script latino |
| Brezhoneg | Bretão | br | Latn | Modelo de script latino |
| 汉语 | Chinês | zh-Hans | Hans; simplificado; mandarim; compatível na v2 | zh |
| 漢語 | Chinês | zh-Hant | Hant, tradicional, mandarim, com suporte na v2 | zh |
| 普通話 | Chinês | zh-Hant-HK | Hant, mandarim, Hong Kong, compatível com a v2 | zh |
| Chahta' | Choctaw | cho | Latn | Modelo de script latino |
| Cree–Montagnais–Naskapi | Cree | cr | Latn | Modelo de script latino |
| Mvskoke | Creek | mus | Latn | Modelo de script latino |
| Dakhótiyapi, Dakȟótiyapi | Dakota | dak | Latn | Modelo de script latino |
| Douala | Duala | dua | Latn | Modelo de script latino |
| Ikɔ Efik | Efik | efi | Latn | Modelo de script latino |
| Inglês (britânico) | Inglês | en-GB | Latn; Britânica | en |
| Èʋegbe | Ewe | ee | Latn | Modelo de script latino |
| føroyskt mál | Faroês | fo | Latn | Modelo de script latino |
| Na Vosa Vakaviti | Fijiano | fj | Latn | Modelo de script latino |
| fɔ̀ngbè | Fon | fon | Latn | Modelo de script latino |
| Français canadien | Francês | fr-CA | Latn; Canadá | fr |
| Fulani, Fulah, Peul | Fulah | ff | Latn | Modelo de script latino |
| Gã | Ga | gaa | Latn | Modelo de script latino |
| Luganda | Ganda | lg | Latn | Modelo de script latino |
| Basa Gayo | Gayo | gay | Latn | Modelo de script latino |
| Quiribati | Gilbertese | gil | Latn | Modelo de script latino |
| Gothic | Gothic | got | Latn | Modelo de script latino |
| Guaraní | Guarani | gn | Latn | Modelo de script latino |
| Harshen/Halshen Hausa هَرْشَن هَوْسَ | Hauçá | ha | Latn | Modelo de script latino |
| ʻŌlelo Hawaiʻi | Havaiano | haw | Latn | Modelo de script latino |
| Otjiherero | Herero | hz | Latn | Modelo de script latino |
| Ilonggo | Hiligaynon | hil | Latn | Modelo de script latino |
| Jaku Iban | Iban | iba | Latn | Modelo de script latino |
| Asụsụ Igbo | Igbo | ig | Latn | Modelo de script latino |
| Ilokano | Iloko | ilo | Latn | Modelo de script latino |
| Taqbaylit | Kabyle | kab | Latn | Modelo de script latino |
| Jingpho | Kachin | kac | Latn | Modelo de script latino |
| Groenlandês | Groenlandês | kl | Latn | Modelo de script latino |
| Kikamba | Kamba | kam | Latn | Modelo de script latino |
| Kanuri | Kanuri | kr | Latn | Modelo de script latino |
| Ka Ktien Khasi | Khasi | kha | Latn | Modelo de script latino |
| Gĩkũyũ | Kikuyu | ki | Latn | Modelo de script latino |
| Kinyarwanda | Kinyarwanda | rw | Latn | Modelo de script latino |
| Kikongo | Quicongo | kg | Latn | Modelo de script latino |
| Kosraean | Kosraean | kos | Latn | Modelo de script latino |
| Oshikwanyama | Kuanyama | kj | Latn | Modelo de script latino |
| Ngala | Lingala | ln | Latn | Modelo de script latino |
| Plattdütsch, Plattdeutsch, Nedersaksisch | Baixo-alemão | nds | Latn | Modelo de script latino |
| siLozi | Lozi | loz | Latn | Modelo de script latino |
| Kiluba | Luba-katanga | lu | Latn | Modelo de script latino |
| Dholuo | Luo | luo | Latn | Modelo de script latino |
| Madhura, Basa Mathura, بَهاسَ مَدورا | Madurês | mad | Latn | Modelo de script latino |
| Malgaxe | Malgaxe | mg | Latn | Modelo de script latino |
| Mandinka, لغة مندنكا | Mandingo | homem | Latn | Modelo de script latino |
| Gaelg, Gailck | Manx | gv | Latn | Modelo de script latino |
| Te reo Māori | Maori | mi | Latn | Modelo de script latino |
| Ebon | Marshallese | mh | Latn | Modelo de script latino |
| Mɛnde yia | Mende | men | Latn | Modelo de script latino |
| Inglês médio | Inglês médio | enm | Latn | Modelo de script latino |
| Mittelhochdeutsch | Alto-alemão médio | gmh | Latn | Modelo de script latino |
| Baso Minangkabau, باسو مينڠكاباو | Minangkabau | min | Latn | Modelo de script latino |
| Kanienʼkéha | Mohawk | moh | Latn | Modelo de script latino |
| Nkundu | Mongo | lol | Latn | Modelo de script latino |
| Nāhuatl | Náuatle | nah | Latn | Modelo de script latino |
| Diné bizaad | Navajo | nv | Latn | Modelo de script latino |
| Ndonga | Ndonga | ng | Latn | Modelo de script latino |
| ko e vagahau Niuē | Niueano | niu | Latn | Modelo de script latino |
| Zimbabwe Ndebele | Ndebele do norte | nd | Latn | Modelo de script latino |
| Sesotho sa Leboa | Sotho do norte | nso | Latn | Modelo de script latino |
| Chichewa, Chinyanja | Nianja | ny | Latn | Modelo de script latino |
| Runyankore | Nyankole | nyn | Latn | Modelo de script latino |
| Chitonga | Nyasa Tonga | tog | Latn | Modelo de script latino |
| Appolo | Nzima | nzi | Latn | Modelo de script latino |
| Occitan, lenga d'òc, provençal | Occitano | oc | Latn | Modelo de script latino |
| Anishinaabemowin, ᐊᓂᔑᓈᐯᒧᐎᓐ | Ojibwa | oj | Latn | Modelo de script latino |
| Ænglisc, Englisc, Anglisc | Inglês antigo | ang | Latn | Modelo de script latino |
| Franceis, François, Romanz | Francês antigo | fro | Latn | Modelo de script latino |
| Diutisk, Althochdeutsch | Alto alemão antigo | goh | Latn | Modelo de script latino |
| Dǫnsk tunga | Norueguês antigo | non | Latn | Modelo de script latino |
| Anciano occitano | Provençal antigo | pro | Latn | Modelo de script latino |
| ирон ӕвзаг | Ossetic | os | Cyrl | Modelo de script Cirílico |
| Kapampangan | Pampanga | pam | Latn | Modelo de script latino |
| Salitan Pangasinan | Língua pangasiana | pag | Latn | Modelo de script latino |
| Papiamentu | Papiamento | pap | Latn | Modelo de script latino |
| Português (Portugal) | Português | pt-PT | Latn; Europeu | pt |
| Kechua / Runa Simi | Quíchua | qu | Latn | Modelo de script latino |
| Rumantsch | Romanche | rm | Latn | Modelo de script latino |
| Romani čhib | Romani | rom | Latn | Modelo de script latino |
| Ikirundi | Rundi | rn | Latn | Modelo de script latino |
| Gagana faʻa Sāmoa | Samoano | sm | Latn | Modelo de script latino |
| yângâ tî sängö | Sango | sg | Latn | Modelo de script latino |
| (Trança) Escocês, Lallans, Dórico | Escocês | sco | Latn | Modelo de script latino |
| Gàidhlig | Gaélico escocês | gd | Latn | Modelo de script latino |
| chiShona | Xona | sn | Latn | Modelo de script latino |
| Songhay | Songhai | son | Latn | Modelo de script latino |
| Sesotho | soto do sul | st | Latn | Modelo de script latino |
| Espanhol (América Latina) | Espanhol | es-419 | Latn; América Latina | es |
| ᮘᮞ ᮞᮥᮔ᮪ᮓ , Basa Sunda | Sundanês | su | Latn | Modelo de script latino |
| siSwati | Swati | ss | Latn | Modelo de script latino |
| Reo Tahiti | Taitiano | ty | Latn | Modelo de script latino |
| KʌThemnɛ | Temne | tem | Latn | Modelo de script latino |
| lea faka-Tonga | Tonga | a | Latn | Modelo de script latino |
| Xitsonga | Tsonga | ts | Latn | Modelo de script latino |
| Setsuana | Tswana | tn | Latn | Modelo de script latino |
| Türkmençe | Turcomano | tk | Latn | Modelo de script Cirílico |
| Tshivenḓa | Venda | ve | Latn | Modelo de script latino |
| Frysk | Frísio ocidental | fy | Latn | Modelo de script latino |
| Wolof | Wolof | wo | Latn | Modelo de script latino |
| isiXhosa | Xosa | xh | Latn | Modelo de script latino |
| Èdè Yorùbá | Iorubá | yo | Latn | Modelo de script latino |
| Diidxazá | Zapotec | zap | Latn | Modelo de script latino |