Metin çıkarma için desteklenen dosya türleri

Cloud Search, dosya türünden bağımsız olarak gönderilen tüm öğeleri dizine ekler (MIME veya içerik türü). Dizine ekleme, bir dosyanın meta veri verileri üzerinde gerçekleştirilir ve ve destekleniyorsa içeriğini gösterir. Aşağıda, hangi içeriğin kullanılacağı dosya türlerinin dizine ekleme desteklenmez.

  • Microsoft Word (DOC)
  • Microsoft Word (DOCX)
  • Microsoft Excel (XLS)
  • Microsoft Excel (XLSX)
  • Microsoft PowerPoint (PPT)
  • Microsoft PowerPoint (PPTX)
  • Adobe'nin Taşınabilir Belge Biçimi (PDF)
  • Zengin Metin Biçimi (RTF)
  • Metin Biçimi (TXT)
  • Hypertext Biçimlendirme Dili (HTML)
  • Genişletilebilir Biçimlendirme Dili (XML)

Bu dosya türlerine ek olarak Cloud Search, içeriklerin dizine eklenmesini de destekler metin dosyası içinde.

Optik Karakter Tanıma (OCR) dosya türleri ve özellikleri

Google Cloud Search, aşağıdaki dosya türlerindeki metinleri ayıklamak için OCR de kullanır:

Dosya türü Maksimum boyut
Ortak Fotoğraf Uzmanları Grubu (JPG) 10 MB
Grafik Değişim Biçimi (GIF) 10 MB
Etiketli Resim Dosyası Biçimi (TIFF) 10 MB
Ölçeklenebilir Vektör Grafiği (SVG) 10 MB
PostScript Resim Biçimi (PS) 10 MB
Taşınabilir Belge Biçimi (PDF) 30 MB

OCR, aşağıdaki özelliklere sahip dosyalarda da çalışır:

  • El yazısı dokümanlar. Latin alfabesi, Japonca ve Korece getirili belgeler en iyi sonuçları elde edersiniz.
  • Japonca olanlar gibi dikey olarak yazılmış belgeler.
  • İbranice gibi sağdan sola yazılan dokümanlar.