ประเภทไฟล์ที่ Google จัดทำดัชนีได้
Google สามารถจัดทำดัชนีเนื้อหาของไฟล์แบบข้อความส่วนใหญ่และเอกสารที่เข้ารหัสบางรูปแบบได้ ประเภทไฟล์จะกำหนดโดยส่วนหัว HTTP ของ Content-Type ที่แสดงเมื่อ Google
ทำการ Crawl ไฟล์ แม้ว่าในบางกรณี Google อาจใช้นามสกุลไฟล์หรือแยกวิเคราะห์ไฟล์อีกครั้งโดยใช้
ตัวแยกวิเคราะห์อื่นหากไม่มีส่วนหัว Content-Type หรือส่วนหัวไม่ถูกต้อง
ประเภทไฟล์ Flat ที่รองรับ
ระบบรองรับไฟล์ Flat ประเภทต่อไปนี้ ไฟล์เหล่านี้คือไฟล์ที่จัดเก็บเนื้อหาเป็นข้อความธรรมดาแบบไม่มีการเข้ารหัส (แม้ว่าอาจใช้แท็กมาร์กอัป)
- ค่าที่คั่นด้วยคอมมา (.csv)
- Google Earth (.kml, .kmz)
- รูปแบบ GPS eXchange (.gpx)
- HTML (.htm, .html และไฟล์นามสกุลอื่นๆ)
- กราฟิกเวกเตอร์ที่ปรับขนาดได้ (.svg)
- TeX/LaTeX (.tex)
-
Text (.txt, .text และนามสกุลไฟล์อื่นๆ) ซึ่งรวมถึงซอร์สโค้ดในภาษาโปรแกรมทั่วไป เช่น
- ซอร์สโค้ด Basic (.bas)
- ซอร์สโค้ด C/C++ (.c, .cc, .cpp, .cxx, .h, .hpp)
- ซอร์สโค้ด C# (.cs)
- ซอร์สโค้ด Java (.java)
- ซอร์สโค้ด Perl (.pl)
- ซอร์สโค้ด Python (.py)
- Wireless Markup Language (.wml, .wap)
- XML (.xml)
ประเภทไฟล์แบบเข้ารหัสที่รองรับ
ระบบรองรับไฟล์แบบเข้ารหัสประเภทต่อไปนี้ ไฟล์เหล่านี้เป็นไฟล์ไบนารีหรือคอนเทนเนอร์ที่ซับซ้อนซึ่ง ต้องใช้ตัวแยกวิเคราะห์ที่เฉพาะเจาะจงเพื่อดึงข้อความที่มนุษย์อ่านได้
- Adobe Portable Document Format (.pdf)
- Adobe PostScript (.ps)
- สื่อเผยแพร่อิเล็กทรอนิกส์ (.epub)
- Hancom Hanword (.hwp)
- Microsoft Excel (.xls, .xlsx)
- Microsoft PowerPoint (.ppt, .pptx)
- Microsoft Word (.doc, .docx)
- งานนำเสนอ OpenOffice (.odp)
- สเปรดชีต OpenOffice (.ods)
- ข้อความ OpenOffice (.odt)
- Rich Text Format (.rtf)
รูปแบบสื่อที่รองรับ
Google ยังจัดทําดัชนีรูปแบบสื่อต่อไปนี้ได้ด้วย
- รูปแบบรูปภาพ: BMP, GIF, JPEG, PNG, WebP, SVG, and AVIF
- รูปแบบวิดีโอ: 3GP, 3G2, ASF, AVI, DivX, M2V, M3U, M3U8, M4V, MKV, MOV, MP4, MPEG, OGV, QVT, RAM, RM, VOB, WebM, WMV, และ XAP
ค้นหาตามประเภทไฟล์
คุณสามารถใช้โอเปอเรเตอร์ filetype: ใน Google Search เพื่อจํากัดผลการค้นหาให้เป็นไฟล์หรือนามสกุลไฟล์ที่เจาะจงได้ ตัวอย่างเช่น โอเปอเรเตอร์ filetype:rtf galway จะค้นหาไฟล์ RTF และ URL ที่ลงท้ายด้วย .rtf ซึ่งในเนื้อหามีคําว่า "galway"