支援的文字擷取檔案類型
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
無論檔案類型為何,Cloud Search 都會為傳送的所有項目建立索引
(MIME 或 content-type)。索引是用於檔案的中繼資料資料,以及
(如果支援的話) 包含內容。以下清單列出 SYAML 檔案的內容
索引功能「支援」。
- Microsoft Word (DOC)
- Microsoft Word (DOCX)
- Microsoft Excel (XLS)
- Microsoft Excel (XLSX)
- Microsoft PowerPoint (PPT)
- Microsoft PowerPoint (PPTX)
- Adobe 可攜式文件格式 (PDF)
- RTF 格式
- 文字格式 (TXT)
- 超文字標記語言 (HTML)
- 可延伸標記語言 (XML)
除了這些檔案類型外,Cloud Search 也支援內容索引
任何純文字檔
光學字元辨識 (OCR) 檔案類型與特性
Google Cloud Search 也會使用 OCR 擷取下列檔案類型的文字:
檔案類型 |
大小上限 |
聯合攝影專家團體 (JPG 格式) |
10 MB |
圖片交換格式 (GIF) |
10 MB |
標記影像檔案格式 (TIFF) |
10 MB |
可擴充向量圖形 (SVG) |
10 MB |
PostScript 圖片格式 (PS) |
10 MB |
可攜式文件格式 (PDF) |
30 MB |
OCR 也適用於具有下列特性的檔案:
- 手寫文件。拉丁語系、日語和韓語文書
最佳成效
- 直向文件,例如日文文件。
- 從右到左撰寫的文件,例如希伯來文。
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2024-09-03 (世界標準時間)。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"缺少我需要的資訊"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"過於複雜/步驟過多"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"過時"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻譯問題"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"示例/程式碼問題"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"容易理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"確實解決了我的問題"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]
{"lastModified": "\u4e0a\u6b21\u66f4\u65b0\u6642\u9593\uff1a2024-09-03 (\u4e16\u754c\u6a19\u6e96\u6642\u9593)\u3002"}
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["缺少我需要的資訊","missingTheInformationINeed","thumb-down"],["過於複雜/步驟過多","tooComplicatedTooManySteps","thumb-down"],["過時","outOfDate","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["示例/程式碼問題","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2024-09-03 (世界標準時間)。"]]