Tipos de arquivos indexáveis pelo Google
O Google indexa o conteúdo da maioria dos arquivos de texto e de alguns formatos de documentos codificados. O tipo de arquivo é determinado pelo cabeçalho HTTP Content-Type retornado quando o Google faz o rastreamento. No entanto, em alguns casos, o Google pode usar a extensão de arquivo ou verificar novamente o conteúdo usando outro analisador se o cabeçalho Content-Type estiver ausente ou incorreto.
Tipos de arquivos simples aceitos
Os seguintes tipos de arquivos simples são aceitos. Neles, o conteúdo é armazenado em texto simples e não codificado, embora possam conter tags de marcação.
- Valores separados por vírgula (.csv)
- Google Earth (.kml, .kmz)
- Formato GPS eXchange (.gpx)
- HTML (.htm, .html e outras extensões de arquivo)
- Elementos gráficos vetoriais escaláveis (.svg)
- TeX/LaTeX (.tex)
-
Texto (.txt, .text, outras extensões de arquivo), incluindo código-fonte em linguagens de programação comuns, como:
- Código-fonte básico (.bas)
- Código-fonte C/C++ (.c, .cc, .cpp, .cxx, .h, .hpp)
- Código-fonte C# (.cs)
- Código-fonte Java (.java)
- Código-fonte PERL (.pl)
- Código-fonte Python (.py)
- Wireless Markup Language (.wml, .wap)
- XML (.xml)
Tipos de arquivos codificados compatíveis
Os seguintes tipos de arquivos codificados são aceitos. São arquivos binários ou contêineres complexos que exigem um analisador específico para extrair o texto legível por humanos.
- Formato de documento portátil da Adobe (.pdf)
- Adobe PostScript (.ps)
- Publicação eletrônica (.epub)
- Hancom Hanword (.hwp)
- Microsoft Excel (.xls, .xlsx)
- Microsoft PowerPoint (.ppt, .pptx)
- Microsoft Word (.doc, .docx)
- Apresentação do OpenOffice (.odp)
- Planilha do OpenOffice (.ods)
- Texto do OpenOffice (.odt)
- Formato Rich Text (.rtf)
Formatos de mídia compatíveis
O Google também pode indexar os seguintes formatos de mídia:
- Formatos de imagem: BMP, GIF, JPEG, PNG, WebP, SVG e AVIF
- Formatos de vídeo: 3GP, 3G2, ASF, AVI, DivX, M2V, M3U, M3U8, M4V, MKV, MOV, MP4, MPEG, OGV, QVT, RAM, RM, VOB, WebM, WMV e XAP
Pesquisar por tipo de arquivo
Você pode usar o operador filetype: na Pesquisa Google para limitar os resultados a um tipo ou extensão de arquivo específicos. Por exemplo, filetype:rtf galway vai pesquisar arquivos RTF e URLs que terminam em .rtf com o termo "galway" no conteúdo.