Puoi configurare Google Cloud Search in modo che restituisca risultati dall'account della tua organizzazione che Microsoft Windows condivide oltre ai tuoi contenuti di Google Workspace. Tu utilizzare il connettore Google Cloud Search File Systems e configurarlo affinché acceda condivisioni Windows specificate. Una singola istanza del connettore può supportare più Condivisioni di Microsoft Windows.
Considerazioni importanti
Aggiornamenti automatici continui
Per impostazione predefinita, il connettore monitora continuamente i percorsi di inizio (valori da fs.src
nel file di configurazione del connettore) all'avvio. Quando il file system segnala modifiche ai contenuti o ai controlli di accesso, il connettore viene attivato per eseguire nuovamente la scansione del file system. Questa nuova scansione può richiedere molte risorse. Per disattivare il monitoraggio del file system, imposta fs.monitorForUpdates
su false
. L'utilizzo delle risorse del connettore viene ridotto in modo significativo, ma viene ritardato quando il connettore applica le modifiche. Scopri di più
Controllo dell'accesso DFS
Il sistema DFS applica il controllo dell'accesso ai propri link e di solito ogni link DFS ha il proprio ACL. Un meccanismo utilizzato da DFS è Access-based Enumeration (ABE), che può limitare i link DFS restituiti a un utente. Gli utenti potrebbero ricevere solo un sottoinsieme dei link DFS o anche un solo link quando ABE isola le home directory ospitate. Quando il connettore attraversa un sistema DFS, rispetta l'ACL del link DFS e l'ACL di condivisione della destinazione, mentre l'ACL di condivisione eredita l'ACL DFS.
Limitazioni note
- File system: il connettore File system non supporta le unità mappate e le unità locali.
- File system distribuito: un'unità mappata a un file system UNC non funziona correttamente. Alcuni ACL non vengono letti correttamente.
- Il connettore File Systems supporta gli spazi dei nomi e i link Distributed File System (DFS). Tuttavia, il connettore supporta i link DFS solo in uno spazio dei nomi DFS, non nelle normali cartelle nello spazio dei nomi DFS.
- I link ai file restituiti in cloudsearch.google.com non sono cliccabili. Inoltre, i link ai file restituiti dall'API Query non sono selezionabili nella maggior parte dei browser.
Requisiti di sistema
Requisiti di sistema | |
---|---|
Sistema operativo |
|
Software |
|
Protocolli file system |
Non supportato: file system Windows locali, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 o file system Linux locale. |
Esegui il deployment del connettore
Prerequisiti
Prima di eseguire il deployment del connettore file system Cloud Search, assicurati che include tutti i seguenti componenti prerequisiti:
Informazioni su Google Workspace necessarie per stabilire relazioni tra Google Cloud Search e l'origine dati:
- Chiave privata di Google Workspace (che contiene l'ID account di servizio). Per informazioni su come ottenere una chiave privata, visita Configura l'accesso all'API REST di Google Cloud Search.
- ID origine dati Google Workspace. Per informazioni su come ottenere un ID origine dati, vai a Aggiungi un'origine dati per la ricerca.
- Un ID origine identità. Per informazioni su come ottenere un'origine identità ID, vai a Crea un'origine identità. Se sincronizzi la directory di Google Workspace con Active Directory, configura l'origine identità con GCDS.
In genere, puoi ricevere queste credenziali dall'amministratore di Google Workspace della tua organizzazione.
Assicurati che l'account Windows disponga di autorizzazioni sufficienti, come descritto in la sezione che segue.
Autorizzazioni richieste per l'account Microsoft Windows
L'account Microsoft Windows in cui è in esecuzione il connettore deve avere autorizzazioni sufficienti per eseguire le azioni seguenti:
- Elenca i contenuti delle cartelle
- Leggi i contenuti dei documenti
- Leggi gli attributi di file e cartelle
- Autorizzazioni di lettura (ACL) per file e cartelle
- Autorizzazioni di scrittura degli attributi di base
L'appartenenza a uno dei seguenti gruppi concede a un account Windows le autorizzazioni sufficienti necessarie per il connettore:
- Amministratori
- Utenti esperti
- Operatori di stampa
- Operatori server
Passaggio 1. Installare il connettore Google Cloud Search File Systems
Recupera il repository del connettore da GitHub e crealo.
Per utilizzare Git sul server Windows:
Clona il repository:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
Verifica la versione del connettore che ti interessa:
> git checkout tags/v1-0.0.3
Per scaricare direttamente da GitHub:
- Vai a https://github.com/google-cloudsearch/windows-filesystems-connector.
- Fai clic su Clona o scarica Scarica zip.
- Decomprimi il pacchetto.
- Passa alla nuova directory:
> cd windows-filesystems-connector
Crea il connettore. Se necessario, installa Apache Maven.
> mvn package
Per saltare i test quando crei il connettore, esegui
mvn package -DskipTests
anzichémvn package
.Copia il file ZIP del connettore nella directory di installazione locale:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
Passaggio 2: Crea il file di configurazione del connettore
Nella stessa directory dell'installazione del connettore, crea un file e assegnagli il nome
connector-config.properties
.Aggiungi i parametri come coppie chiave/valore ai contenuti del file, come nell'esempio seguente:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
Per una descrizione dettagliata di ciascun parametro, consulta la documentazione di riferimento sui parametri di configurazione.
(Facoltativo) Configura gli altri parametri del connettore in base alle esigenze. Per maggiori dettagli, vai a Parametri dei connettori forniti da Google.
Passaggio 3: Abilita il logging
- Crea una cartella denominata
logs
nella directory che contiene il connettore binario. Crea un file ASCII o UTF-8 denominato
logging.properties
nel che contiene il file binario del connettore e aggiungi il contenuto seguente:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Passaggio 4: (Facoltativo) Configurare i tipi di media
Per impostazione predefinita, il connettore prova a rilevare il tipo di supporto per ogni file forniti dal JDK il rilevamento dei tipi di media. Su Microsoft Windows, JDK si basa sul registro di Windows per determinare i tipi di file multimediali. Una voce di registro mancante può restituire un valore nullo tipo di media per determinati file.
Se necessario, puoi specificare un tipo multimediale che sovrascriva eventuali associazioni esistenti o impedisca un tipo multimediale nullo.
- Nella directory del connettore, crea un file criptato con Latin-1 denominato
mime-type.properties
. Inserisci le estensioni dei file e i tipi di media corrispondenti come nei seguenti esempi:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
Passaggio 5: esegui il connettore dei file system
Dopo aver installato e configurato il connettore dei file system, avvialo sul macchina host, esegui un comando come nell'esempio seguente:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
Specifica il percorso del file di configurazione se è diverso da quello predefinito (nella stessa directory del file binario con il nome connector-config.properties
).
Riferimento per i parametri di configurazione
Accesso a origine dati
Impostazione | Parametro |
ID origine dati | api.sourceId=1234567890abcdef
Obbligatorio. L'ID origine di Google Cloud Search configurato dall'amministratore di Google Workspace. |
Percorso del file della chiave privata dell'account di servizio | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Obbligatorio. Il file delle chiavi dell'account di servizio di Google Cloud Search per l'accessibilità del connettore file system di Google Cloud Search. |
ID origine identità | api.identitySourceId=x0987654321
Obbligatorio. L'ID origine identità di Cloud Search configurato dall'amministratore di Google Workspace per la sincronizzazione delle identità di Active Directory mediante GCDS. |
Accesso al file system
Impostazione | Parametro |
File system di origine | fs.src=path1[,path2, ...]
Obbligatorio. Specifica i file system di origine come una o più origini UNC separate dal delimitatore configurato da |
Carattere separatore del percorso
Impostazione | Parametro |
Carattere separatore del percorso | fs.src.separator=separator-character
Il separatore predefinito è ";". Se i percorsi di origine contengono punti e virgola, puoi impostare un delimitatore diverso, ad esempio una virgola (","), che non entri in conflitto con i caratteri dei percorsi e non sia riservato dalla sintassi del file delle proprietà. Se il valore |
Comportamento del connettore
Impostazione | Parametro |
Dominio Windows | fs.supportedDomain=domain
Obbligatorio per consentire agli utenti che hanno configurato GCDS di accedere ai documenti tramite Cloud Search. Specifica come singolo nome di dominio NetBIOS di Active Directory. |
Includi gli account negli ACL | fs.supportedAccounts=account-1[, account-2,...]
Un elenco di account delimitato da virgole da includere negli ACL, indipendentemente dal fatto che si tratti di account integrati. Il valore predefinito è |
Escludi gli account integrati dagli ACL | fs.builtinGroupPrefix=prefix
Specifica il prefisso degli account integrati. Un account che inizia con questo prefisso è considerato un account integrato e verrà escluso dagli ACL. Il valore predefinito è |
Consenti l'indicizzazione di file e cartelle nascosti | fs.crawlHiddenFiles=boolean
Imposta |
Consenti l'indicizzazione di elenchi di cartelle sottoposte a scansione e di enumerazioni dello spazio dei nomi DFS | fs.indexFolders=boolean
Se il criterio è impostato su |
Abilita il monitoraggio delle modifiche al file system | fs.monitorForUpdates=boolean
Se il criterio viene impostato su |
Imposta la dimensione massima della cache delle directory | fs.directoryCacheSize=number-of-entries
La dimensione massima della cache della directory. Il connettore utilizza la cache per identificare le cartelle nascoste ed evitare l'indicizzazione di file e cartelle all'interno di cartelle nascoste. Il valore predefinito è 50.000 voci, che in genere consumano 10-15 MB di RAM. |
Conservazione dei timestamp e controllo della scansione
Impostazione | Parametro |
Mantieni timestamp dell'ultimo accesso | fs.preserveLastAccessTime=value
Quando il connettore esegue la scansione di file e cartelle, può modificare il timestamp dell'ultimo accesso di file e cartelle impostandolo sull'ora della scansione. Quando non vengono conservate le ore dell'ultimo accesso, i sistemi di backup e archiviazione potrebbero non spostare i file e le cartelle appropriati nello spazio di archiviazione secondario a causa della visita del connettore. Per impostazione predefinita, il connettore tenta di conservare l'ora dell'ultimo accesso ( Valori possibili:
|
Esegui la scansione solo dei file a cui si è avuto accesso dopo una determinata data | fs.lastAccessedDate=YYYY-MM-DD
Esegui la scansione dei contenuti solo se l'ora dell'ultimo accesso è successiva alla data specificata. Il valore predefinito è Specifica la data nel formato ISO8601: AAAA-MM-GG. Ad esempio, se il valore è 2010-01-01, il connettore sottopone a scansione solo i contenuti a cui si è eseguito l'accesso dopo l'inizio del 2010. Se specifichi |
Esegui la scansione solo dei file a cui si è avuto accesso negli ultimi giorni | fs.lastAccessedDays=number-of-days
Esegui la scansione dei contenuti solo se l'ora dell'ultimo accesso rientra nel numero di giorni precedenti alla presente. Il valore predefinito è Utilizza questa proprietà per far scadere in precedenza i contenuti indicizzati in precedenza, a cui non accedi da un po' di tempo. Ad esempio, imposta 365 per eseguire la scansione del contenuto solo se vi è stato eseguito l'accesso nell'ultimo anno. Se specifichi |
Esegui la scansione solo dei file modificati dopo una determinata data | fs.lastModifiedDate=YYYY-MM-DD
Esegui la scansione dei contenuti solo se l'ora dell'ultima modifica è successiva alla data specificata. Il valore predefinito è Specifica la data nel formato ISO8601: AAAA-MM-GG. Ad esempio, se il valore è 2010-01-01, il connettore sottopone a scansione solo i contenuti modificati dopo l'inizio del 2010. Se specifichi |
Esegui la scansione solo dei file modificati negli ultimi giorni | fs.lastModifiedDays=number-of-days
Esegui la scansione dei contenuti solo se l'ora dell'ultima modifica rientra nel numero di giorni precedenti alla presente. Il valore predefinito è Utilizza questa proprietà per far scadere in anticipo i contenuti indicizzati che non sono stati modificati da un po' di tempo. Ad esempio, puoi impostare 365 per eseguire la scansione dei contenuti solo se sono stati modificati nell'ultimo anno. Se specifichi |
Salta il controllo dell'accesso per la condivisione file
Per impostazione predefinita, il connettore conserva l'integrità del controllo dell'accesso quando invia elenchi di controllo dell'accesso (ACL) all'API per l'indicizzazione, compresi gli ACL nella condivisione file. In alcune configurazioni, tuttavia, il connettore potrebbe non disporre di autorizzazioni sufficienti per leggere l'ACL condiviso. In questi casi, il connettore non restituisce nei risultati di ricerca i file gestiti in quella condivisione file.
Puoi impostare il connettore in modo che ignori l'ACL di condivisione, in modo che i contenuti vengano sempre restituiti nei risultati di ricerca. In questo caso, l'API di indicizzazione riceve un ACL di condivisione completamente permissivo, anziché l'effettivo ACL di condivisione.
Impostazione | Parametro |
Salta il controllo dell'accesso per la condivisione file | fs.skipShareAccessControl=boolean
Imposta su |