Puoi configurare Google Cloud Search in modo che restituisca i risultati delle condivisioni Microsoft Windows della tua organizzazione, oltre ai contenuti di Google Workspace. Puoi utilizzare il connettore dei sistemi di file di Google Cloud Search e configurarlo per accedere alle condivisioni Windows specificate. Una singola istanza del connettore può supportare più condivisione Microsoft Windows.
Considerazioni importanti
Aggiornamenti automatici continui
Per impostazione predefinita, il connettore monitora continuamente i percorsi di avvio (valori da fs.src
nel file di configurazione del connettore) all'avvio. Quando il file system segnala modifiche ai controlli dei contenuti o di accesso, il connettore viene attivato per eseguire nuovamente la scansione del file system. Questa nuova scansione può richiedere molte risorse. Per disattivare il monitoraggio del file system, imposta fs.monitorForUpdates
su false
. Riduci notevolmente l'utilizzo delle risorse del connettore, ma ritardi il momento in cui il connettore riflette le modifiche. Scopri di più
Controllo dell'accesso DFS
Il sistema DFS applica il controllo dell'accesso ai propri link e in genere ogni link DFS ha il proprio ACL. Un meccanismo utilizzato da DFS è l'enumerazione basata sull'accesso (ABE), che può limitare i link DFS restituiti a un utente. Gli utenti potrebbero ricevere solo un sottoinsieme dei link DFS o addirittura un solo link quando ABE isola le home directory ospitate. Quando il connettore attraversa un sistema DFS, rispetta l'ACL del link DFS e l'ACL della condivisione della destinazione, che eredita l'ACL DFS.
Limitazioni note
- File System: il connettore File System non supporta le unità mappate e le unità locali.
- Distributed File System: una unità mappata a un UNC DFS non funziona correttamente. Alcune ACL non vengono lette correttamente.
- Il connettore File System supporta gli spazi dei nomi e i link del Distributed File System (DFS). Tuttavia, il connettore supporta i link DFS solo in uno spazio dei nomi DFS, non le cartelle normali nello spazio dei nomi DFS.
- I link ai file restituiti in cloudsearch.google.com non sono cliccabili. Anche i link ai file restituiti dall'API Query non sono cliccabili nella maggior parte dei browser.
Requisiti di sistema
Requisiti di sistema | |
---|---|
Sistema operativo |
|
Software |
|
Protocolli del file system |
Non supportati: file system Windows locali, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 o file system Linux locali. |
Esegui il deployment del connettore
Prerequisiti
Prima di eseguire il deployment del connettore Cloud Search File Systems, assicurati che il tuo ambiente disponga di tutti i seguenti componenti prerequisiti:
Informazioni di Google Workspace necessarie per stabilire relazioni tra Google Cloud Search e l'origine dati:
- Chiave privata di Google Workspace (che contiene l'ID account di servizio). Per informazioni su come ottenere una chiave privata, vai a Configurare l'accesso all'API REST di Google Cloud Search.
- ID origine dati di Google Workspace. Per informazioni su come ottenere un ID origine dati, vai a Aggiungere un'origine dati per la ricerca.
- Un ID origine identità. Per informazioni su come ottenere un ID origine identità, vai a Creare un'origine identità. Se sincronizzi la directory di Google Workspace con Active Directory, configura l'origine identità con GCDS.
In genere, l'amministratore di Google Workspace della tua organizzazione può fornirti queste credenziali.
Assicurati che l'account Windows disponga delle autorizzazioni sufficienti, come descritto nella sezione seguente.
Autorizzazioni dell'account Microsoft Windows richieste
L'account Microsoft Windows in cui viene eseguito il connettore deve disporre di autorizzazioni sufficienti per eseguire le seguenti azioni:
- Elenca i contenuti delle cartelle
- Leggere i contenuti dei documenti
- Leggere gli attributi di file e cartelle
- Autorizzazioni di lettura (ACL) per file e cartelle
- Autorizzazioni di scrittura per gli attributi di base
L'appartenenza a uno dei seguenti gruppi concede a un account Windows le autorizzazioni sufficienti necessarie al connettore:
- Amministratori
- Utenti esperti
- Operatori di stampa
- Operatori di server
Passaggio 1: Installare il connettore File System di Google Cloud Search
Recupera il repository del connettore da GitHub e compilalo.
Per utilizzare git sul server Windows:
Clona il repository:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
Controlla la versione del connettore che ti interessa:
> git checkout tags/v1-0.0.3
Per scaricare direttamente da GitHub:
- Vai alla pagina https://github.com/google-cloudsearch/windows-filesystems-connector.
- Fai clic su Clona o scarica Scarica file ZIP.
- Decomprimi il pacchetto.
- Vai alla nuova directory:
> cd windows-filesystems-connector
Crea il connettore. Se necessario, installa Apache Maven.
> mvn package
Per saltare i test durante la creazione del connettore, esegui
mvn package -DskipTests
anzichémvn package
.Copia il file ZIP del connettore nella directory di installazione locale:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
Passaggio 2: Crea il file di configurazione del connettore
Nella stessa directory dell'installazione del connettore, crea un file e assegnagli il nome
connector-config.properties
.Aggiungi i parametri come coppie chiave/valore ai contenuti del file, come nell'esempio seguente:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
Per descrizioni dettagliate di ciascun parametro, consulta le informazioni di riferimento sui parametri di configurazione.
(Facoltativo) Configura altri parametri del connettore, se necessario. Per maggiori dettagli, vai a Parametri del connettore forniti da Google.
Passaggio 3: Abilita il logging
- Crea una cartella denominata
logs
nella directory contenente il file binario del connettore. Crea un file ASCII o UTF-8 denominato
logging.properties
nella directory contenente il file binario del connettore e aggiungi i seguenti contenuti:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Passaggio 4: (Facoltativo) Configurare i tipi di contenuti multimediali
Per impostazione predefinita, il connettore tenta di rilevare il tipo di media per ogni file con il rilevamento del tipo di media fornito dal JDK. Su Microsoft Windows, JDK si basa sul Registro di sistema di Windows per determinare i tipi di contenuti multimediali per i file. Una voce del registro mancante può comportare un tipo di media nullo per determinati file.
Se necessario, puoi specificare un tipo di media che sovrascriva eventuali associazioni esistenti o impedisca un tipo di media nullo.
- Nella directory del connettore, crea un file criptato in Latin-1 denominato
mime-type.properties
. Inserisci le estensioni dei file e i relativi tipi di media come negli esempi seguenti:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
Passaggio 5: esegui il connettore File System
Dopo aver installato e configurato il connettore File System, per avviarlo sulla macchina ospitante, esegui un comando come l'esempio seguente:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
Specifica il percorso del file di configurazione se è diverso da quello predefinito (nella stessa directory del file binario con il nome connector-config.properties
).
Riferimento ai parametri di configurazione
Accesso a origine dati
Impostazione | Parametro |
ID origine dati | api.sourceId=1234567890abcdef
Obbligatorio. L'ID origine di Google Cloud Search configurato dall'amministratore di Google Workspace. |
Percorso del file della chiave privata dell'account di servizio | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Obbligatorio. Il file della chiave dell'account di servizio Google Cloud Search per l'accessibilità del connettore dei file system di Google Cloud Search. |
ID origine identità | api.identitySourceId=x0987654321
Obbligatorio. L'ID dell'origine identità Cloud Search configurato dall'amministratore di Google Workspace per la sincronizzazione delle identità di Active Directory utilizzando GCDS. |
Accesso al file system
Impostazione | Parametro |
File system di origine | fs.src=path1[,path2, ...]
Obbligatorio. Specifica i file system di origine come una o più origini UNC separate dal delimitatore configurato da |
Carattere separatore di percorso
Impostazione | Parametro |
Carattere separatore di percorso | fs.src.separator=separator-character
Il separatore predefinito è ";". Se i percorsi di origine contengono punti e virgola, puoi impostare un delimitatore diverso, ad esempio una virgola (","), che non entri in conflitto con i caratteri nei percorsi e non sia riservato dalla sintassi del file di proprietà stessa. Se il valore |
Comportamento del connettore
Impostazione | Parametro |
Dominio Windows | fs.supportedDomain=domain
Obbligatorio per consentire agli utenti configurati con GCDS di accedere ai documenti tramite Cloud Search. Specifica un singolo nome di dominio NetBIOS di Active Directory. |
Includi gli account negli ACL | fs.supportedAccounts=account-1[, account-2,...]
Un elenco di account separati da virgole da includere nelle ACL, indipendentemente dal fatto che si tratti di account integrati. Il valore predefinito è |
Escludere gli account integrati dalle ACL | fs.builtinGroupPrefix=prefix
Specifica il prefisso degli account integrati. Un account che inizia con questo prefisso è considerato un account integrato e verrà escluso dagli ACL. Il valore predefinito è |
Consenti l'indicizzazione di file e cartelle nascosti | fs.crawlHiddenFiles=boolean
Impostato su |
Consenti l'indicizzazione delle schede delle cartelle sottoposte a scansione e delle enumerazioni dello spazio dei nomi DFS | fs.indexFolders=boolean
Se impostato su |
Attiva il monitoraggio delle modifiche al file system | fs.monitorForUpdates=boolean
Se impostato su |
Imposta la dimensione massima della cache delle directory | fs.directoryCacheSize=number-of-entries
La dimensione massima della cache della directory. Il connettore utilizza la cache per identificare le cartelle nascoste al fine di evitare l'indicizzazione di file e cartelle in cartelle nascoste. Il valore predefinito è 50.000 voci, che in genere consumano 10-15 megabyte di RAM. |
Conservazione del timestamp e controllo della scansione
Impostazione | Parametro |
Mantieni il timestamp dell'ultimo accesso | fs.preserveLastAccessTime=value
Quando il connettore esegue la scansione di file e cartelle, può modificare il timestamp dell'ultimo accesso dei file e delle cartelle in base all'ora della scansione. Se le ore dell'ultimo accesso non vengono conservate, i sistemi di backup e archiviazione potrebbero non spostare i file e le cartelle appropriati nello spazio di archiviazione secondario a causa della visita del connettore. Per impostazione predefinita, il connettore tenta di conservare l'ora dell'ultimo accesso ( Valori possibili:
|
Esegui la scansione solo dei file a cui è stato eseguito l'accesso dopo una determinata data | fs.lastAccessedDate=YYYY-MM-DD
Esegui la scansione dei contenuti solo se l'ultima ora di accesso è successiva alla data specificata. Il valore predefinito è Specifica la data nel formato ISO8601: AAAA-MM-GG. Ad esempio, se il valore è 01-01-2010, il connettore esegue la scansione solo dei contenuti a cui è stato eseguito l'accesso dopo l'inizio del 2010. Se specifichi |
Esegui la scansione solo dei file a cui è stato eseguito l'accesso negli ultimi giorni | fs.lastAccessedDays=number-of-days
Esegui la scansione dei contenuti solo se l'ultima data di accesso rientra nel numero di giorni prima del giorno corrente. Il valore predefinito è Utilizza questa proprietà per far scadere i contenuti indicizzati in precedenza a cui non è stato eseguito l'accesso da un po' di tempo. Ad esempio, impostalo su 365 per eseguire la scansione dei contenuti solo se sono stati acceduti nell'ultimo anno. Se specifichi |
Esegui la scansione solo dei file modificati dopo una determinata data | fs.lastModifiedDate=YYYY-MM-DD
Esegui la scansione dei contenuti solo se l'ora dell'ultima modifica è successiva alla data specificata. Il valore predefinito è Specifica la data nel formato ISO8601: AAAA-MM-GG. Ad esempio, se il valore è 01-01-2010, il connettore esegue la scansione solo dei contenuti modificati dopo l'inizio del 2010. Se specifichi |
Esegui la scansione solo dei file modificati negli ultimi giorni | fs.lastModifiedDays=number-of-days
Esegui la scansione dei contenuti solo se la data e l'ora dell'ultima modifica rientrano nel numero di giorni prima della data corrente. Il valore predefinito è Utilizza questa proprietà per far scadere i contenuti precedentemente indicizzati che non sono stati modificati da un po' di tempo. Ad esempio, impostalo su 365 per eseguire la scansione dei contenuti solo se sono stati modificati nell'ultimo anno. Se specifichi |
Saltare il controllo dell'accesso alla condivisione dei file
Per impostazione predefinita, il connettore preserva l'integrità del controllo dell'accesso quando invia elenchi di controllo dell'accesso (ACL) all'API di indicizzazione, inclusi gli ACL sulla condivisione file. Tuttavia, in alcune configurazioni il connettore potrebbe non disporre delle autorizzazioni sufficienti per leggere l'ACL della condivisione. In questi casi, il connettore non restituisce i file gestiti nella condivisione file nei risultati di ricerca.
Puoi impostare il connettore in modo che ignori l'ACL della condivisione in modo che i contenuti vengano sempre restituiti nei risultati di ricerca. In questo caso, l'API di indicizzazione riceve un ACL di condivisione completamente permissivo anziché l'ACL di condivisione effettivo.
Impostazione | Parametro |
Saltare il controllo dell'accesso alla condivisione dei file | fs.skipShareAccessControl=boolean
Imposta su |