סוגי קבצים נתמכים לחילוץ טקסט
קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
מערכת Cloud Search מוסיפה לאינדקס את כל הפריטים שנשלחים, בלי קשר לסוג הקובץ (MIME או content-type). האינדוקס מתבצע על נתוני המטא-נתונים של הקובץ, ואם הפורמט נתמך, גם על התוכן שלו. בהמשך מופיעה רשימה של סוגי קבצים שבהם נתמכת הוספה לאינדקס של תוכן ב-Google.
Microsoft Word (DOC)
Microsoft Word (DOCX)
Microsoft Excel (XLS)
Microsoft Excel (XLSX)
Microsoft Powerpoint (PPT)
Microsoft Powerpoint (PPTX)
פורמט מסמך נייד (PDF) של Adobe
פורמט Rich Text (RTF)
פורמט טקסט (TXT)
Hypertext Markup Language (HTML)
Extensible Markup Language (XML)
בנוסף לסוגי הקבצים האלה, Cloud Search תומך בהוספה לאינדקס של תוכן בכל קובץ טקסט רגיל.
סוגי קבצים ומאפיינים של זיהוי תווים אופטי (OCR)
ב-Google Cloud Search נעשה שימוש ב-OCR גם כדי לחלץ טקסט מסוגי הקבצים הבאים:
סוג הקובץ
גודל מקסימלי
Joint Photographic Experts Group (JPG)
10MB
פורמט להחלפת גרפיקה (GIF)
10MB
Tagged Image File Format (TIFF)
10MB
Scalable Vector Graphics (SVG)
10MB
פורמט תמונה של PostScript (PS)
10MB
Portable Document Format (PDF)
30 MB
זיהוי תווים אופטי (OCR) פועל גם בקבצים עם המאפיינים הבאים:
מסמכים בכתב יד. התוצאות הכי טובות מתקבלות ממסמכים בכתב לטיני, ביפנית ובקוריאנית.
[[["התוכן קל להבנה","easyToUnderstand","thumb-up"],["התוכן עזר לי לפתור בעיה","solvedMyProblem","thumb-up"],["סיבה אחרת","otherUp","thumb-up"]],[["חסרים לי מידע או פרטים","missingTheInformationINeed","thumb-down"],["התוכן מורכב מדי או עם יותר מדי שלבים","tooComplicatedTooManySteps","thumb-down"],["התוכן לא עדכני","outOfDate","thumb-down"],["בעיה בתרגום","translationIssue","thumb-down"],["בעיה בדוגמאות/בקוד","samplesCodeIssue","thumb-down"],["סיבה אחרת","otherDown","thumb-down"]],["עדכון אחרון: 2025-12-04 (שעון UTC)."],[],[]]