סוגי קבצים נתמכים לחילוץ טקסט
קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
מערכת Cloud Search מוסיפה לאינדקס את כל הפריטים שנשלחים, בלי קשר לסוג הקובץ (MIME או content-type). האינדוקס מתבצע על נתוני המטא-נתונים של הקובץ, ועל התוכן שלו אם הוא נתמך. בהמשך מופיעה רשימה של סוגי קבצים שנתמכים בהם תהליך הוספת התוכן לאינדקס.
Microsoft Word (DOC)
Microsoft Word (DOCX)
Microsoft Excel (XLS)
Microsoft Excel (XLSX)
Microsoft Powerpoint (PPT)
Microsoft Powerpoint (PPTX)
פורמט מסמך נייד (PDF) של Adobe
פורמט Rich Text(.rtf)
פורמט טקסט (TXT)
Hypertext Markup Language (HTML)
שפת סימון מורחבת (XML)
בנוסף לסוגי הקבצים האלה, Cloud Search תומך בהוספה לאינדקס של תוכן בכל קובץ טקסט פשוט.
סוגי קבצים ומאפיינים של זיהוי תווים אופטי (OCR)
ב-Google Cloud Search נעשה שימוש ב-OCR גם כדי לחלץ טקסט מסוגי הקבצים הבאים:
סוג הקובץ
גודל מקסימלי
Joint Photographic Experts Group (JPG)
10MB
פורמט GIF
10MB
Tagged Image File Format (TIFF)
10MB
Scalable Vector Graphics (SVG)
10MB
פורמט תמונה של PostScript (PS)
10MB
Portable Document Format (PDF)
30 MB
זיהוי התווים האופטי (OCR) פועל גם בקבצים עם המאפיינים הבאים:
מסמכים בכתב יד. התוצאות הכי טובות מתקבלות ממסמכים בכתב לטיני, ביפנית ובקוריאנית.
[[["התוכן קל להבנה","easyToUnderstand","thumb-up"],["התוכן עזר לי לפתור בעיה","solvedMyProblem","thumb-up"],["סיבה אחרת","otherUp","thumb-up"]],[["חסרים לי מידע או פרטים","missingTheInformationINeed","thumb-down"],["התוכן מורכב מדי או עם יותר מדי שלבים","tooComplicatedTooManySteps","thumb-down"],["התוכן לא עדכני","outOfDate","thumb-down"],["בעיה בתרגום","translationIssue","thumb-down"],["בעיה בדוגמאות/בקוד","samplesCodeIssue","thumb-down"],["סיבה אחרת","otherDown","thumb-down"]],["עדכון אחרון: 2026-04-23 (שעון UTC)."],[],[]]