Von Google indexierbare Dateitypen
Google kann den Inhalt der meisten textbasierten Dateien und von bestimmten codierten Dokumentformaten indexieren. Der Dateityp wird durch den HTTP-Header Content-Type bestimmt, der zurückgegeben wird, wenn Google die Datei crawlt. In einigen Fällen verwendet Google jedoch die Dateiendung oder parst die Datei mit einem anderen Parser neu, wenn der Header Content-Type fehlt oder falsch ist.
Unterstützte Flatfile-Typen
Die folgenden Flatfile-Typen werden unterstützt. Dies sind Dateien, in denen der Inhalt als einfacher, nicht codierter Text gespeichert ist (obwohl sie möglicherweise Markup-Tags verwenden).
- Kommagetrennte Werte (.csv)
- Google Earth (.kml, .kmz)
- GPS Exchange Format (.gpx)
- HTML (.htm, .html oder andere Dateierweiterungen)
- Skalierbare Vektorgrafiken (.svg)
- TeX/LaTeX (.tex)
-
Textdateien (.txt, .text oder andere Dateiendungen), einschließlich Quellcode in gängigen Programmiersprachen, z. B.:
- Basic-Quellcode (.bas)
- C/C++ Quellcode (.c, .cc, .cpp, .cxx, .h, .hpp)
- C#-Quellcode (.cs)
- Java-Quellcode (.java)
- Perl-Quellcode (.pl)
- Python-Quellcode (.py)
- Wireless Markup Language (.wml, .wap)
- XML (.xml)
Unterstützte codierte Dateitypen
Die folgenden codierten Dateitypen werden unterstützt. Dies sind Binärdateien oder komplexe Container, für die ein bestimmter Parser erforderlich ist, um den menschenlesbaren Text zu extrahieren.
- Adobe Portable Document Format (.pdf)
- Adobe PostScript (.ps)
- Electronic Publication (.epub)
- Hancom Hanword (.hwp)
- Microsoft Excel (.xls, .xlsx)
- Microsoft PowerPoint (.ppt, .pptx)
- Microsoft Word (.doc, .docx)
- OpenOffice-Präsentation (.odp)
- OpenOffice-Tabelle (.ods)
- OpenOffice-Text (.odt)
- Rich Text Format (.rtf)
Unterstützte Medienformate
Google kann außerdem die folgenden Medienformate indexieren:
- Bildformate: BMP, GIF, JPEG, PNG, WebP, SVG und AVIF
- Videoformate: 3GP, 3G2, ASF, AVI, DivX, M2V, M3U, M3U8, M4V, MKV, MOV, MP4, MPEG, OGV, QVT, RAM, RM, VOB, WebM, WMV und XAP
Nach Dateityp suchen
Mit dem Operator „filetype:“ in der Google Suche kannst du die Ergebnisse auf einen bestimmten Dateityp oder eine bestimmte Dateiendung beschränken. Du kannst zum Beispiel mit filetype:rtf galway nach RTF-Dateien und URLs suchen, die auf .rtf enden und deren Inhalt den Begriff „galway“ enthält.