Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından sonuç döndürecek şekilde ayarlayabilirsiniz. Google Cloud Search Dosya Sistemleri bağlayıcısını kullanır ve belirtilen Windows paylaşımlarına erişecek şekilde yapılandırırsınız. Tek bir bağlayıcı örneği, birden fazla Microsoft Windows paylaşımını destekleyebilir.
Dikkat edilmesi gerekenler
Sürekli otomatik güncellemeler
Varsayılan olarak bağlayıcı, bağlayıcı başlatılırken başlangıç yollarını (bağlayıcı yapılandırma dosyasındaki fs.src
değerleri) sürekli olarak izler. Dosya sistemi, içerik veya erişim kontrollerinde yapılan değişiklikleri bildirdiğinde bağlayıcı, dosya sistemini yeniden taramak için tetiklenir. Bu yeniden tarama işlemi yoğun kaynak gerektirebilir. Dosya sistemi izlemeyi devre dışı bırakmak için fs.monitorForUpdates
öğesini false
olarak ayarlayın. Bağlayıcının kaynak kullanımını önemli ölçüde azaltıyorsunuz, ancak bağlayıcının değişiklikleri yansıtmasını geciktiriyorsunuz. Daha fazla bilgi
DFS erişim denetimi
DFS sistemi, bağlantılarına erişim denetimi uygular ve genellikle her DFS bağlantısının kendi EKL'si vardır. DFS'nin kullandığı mekanizmalardan biri, kullanıcıya döndürülen DFS bağlantılarını kısıtlayabilen Access-based Enumeration (ABE) yöntemidir. Kullanıcılar DFS Bağlantılarının yalnızca bir alt kümesini veya ABE barındırılan ana dizinleri izole ettiğinde yalnızca bir bağlantıyı alabilir. Bağlayıcı bir DFS sistemini geçtiğinde bağlayıcı DFS bağlantı EKL'sine ve hedefin Paylaşım EKL'sine uyar. Paylaşım EKL'si, DFS EKL'den devralınır.
Bilinen sınırlamalar
- Dosya Sistemi: Dosya Sistemleri bağlayıcısı, eşlenen sürücüleri ve yerel sürücüleri desteklemez.
- Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü düzgün çalışmıyor. Bazı EKL'ler doğru okunmuyor.
- Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantılarını destekler. Bununla birlikte bağlayıcı, DFS ad alanındaki normal klasörleri değil, yalnızca bir DFS ad alanındaki DFS bağlantılarını destekler.
- cloudsearch.google.com sayfasında döndürülen dosya bağlantıları tıklanamaz. Query API'si tarafından döndürülen dosya bağlantıları da çoğu tarayıcıda tıklanabilir değildir.
Sistem gereksinimleri
Sistem gereksinimleri | |
---|---|
İşletim sistemi |
|
Yazılım |
|
Dosya sistemi protokolleri |
Desteklenmez: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya Yerel Linux dosya sistemi. |
Bağlayıcıyı dağıtma
Ön koşullar
Cloud Search Dosya Sistemleri bağlayıcısını dağıtmadan önce ortamınızın aşağıdaki ön koşul bileşenlerinin tümüne sahip olduğundan emin olun:
Google Cloud Search ile veri kaynağı arasında ilişki kurmak için gereken Google Workspace bilgileri:
- Google Workspace özel anahtarı (hizmet hesabı kimliğini içerir). Özel anahtar edinme hakkında bilgi edinmek için Google Cloud Search REST API'ye erişimi yapılandırma başlıklı makaleyi inceleyin.
- Google Workspace veri kaynağı kimliği. Veri kaynağı kimliği edinme hakkında bilgi edinmek için Arama yapmak için veri kaynağı ekleme bölümüne gidin.
- Kimlik kaynağı kimliği. Kimlik kaynağı kimliğini alma hakkında bilgi edinmek için Kimlik kaynağı oluşturma bölümüne gidin. Google Workspace dizininizi Active Directory ile senkronize ediyorsanız kimlik kaynağını GCDS ile ayarlayın.
Bu kimlik bilgilerini genellikle kuruluşunuzun Google Workspace yöneticisi alabilirsiniz.
Windows hesabının, aşağıdaki bölümde açıklandığı gibi yeterli izinlere sahip olduğundan emin olun.
Gerekli Microsoft Windows hesap izinleri
Bağlayıcının çalıştırıldığı Microsoft Windows hesabı, aşağıdaki işlemleri gerçekleştirmek için yeterli izinlere sahip olmalıdır:
- Klasörlerin içeriğini listeleme
- Belgelerin içeriğini okuyun
- Dosya ve klasörlerin özelliklerini okuma
- Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
- Temel özellik izinlerini yazma
Aşağıdaki gruplardan birinde üye olmak, bir Windows hesabına bağlayıcı için gereken yeterli izinleri sağlar:
- Yöneticiler
- Deneyimli Kullanıcılar
- Yazdırma Operatörleri
- Sunucu Operatörleri
1. Adım: Google Cloud Search Dosya Sistemleri bağlayıcısını yükleme
GitHub'dan bağlayıcı deposunu alın ve derleyin.
Windows sunucusunda git kullanmak için:
Kod deposunu klonlayın:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
Bağlayıcının istediğiniz sürümünü kontrol edin:
> git checkout tags/v1-0.0.3
GitHub'dan doğrudan indirmek için:
- https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
- Klonla veya indir Zip dosyasını indir'i tıklayın.
- Paketi açın.
- Yeni dizine taşıyın:
> cd windows-filesystems-connector
Bağlayıcıyı oluşturun. Gerekirse Apache Maven'i yükleyin.
> mvn package
Bağlayıcıyı oluştururken testleri atlamak için
mvn package
yerinemvn package -DskipTests
komutunu çalıştırın.Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
2. adım: Bağlayıcı yapılandırma dosyasını oluşturma
Bağlayıcı kurulumuyla aynı dizinde bir dosya oluşturun ve onu
connector-config.properties
olarak adlandırın.Parametreleri, aşağıdaki örnekte gösterildiği gibi, dosya içeriğine anahtar/değer çiftleri olarak ekleyin:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
Her parametreyle ilgili ayrıntılı açıklamalar için yapılandırma parametreleri referansı sayfasına gidin.
(İsteğe bağlı) Diğer bağlayıcı parametrelerini gerektiği şekilde yapılandırın. Ayrıntılar için Google'ın sağladığı bağlayıcı parametreleri bölümüne gidin.
3. adım: Günlük kaydını etkinleştir
- Dizinde, bağlayıcı ikili programını içeren
logs
adlı bir klasör oluşturun. Bağlayıcı ikili programını içeren dizinde
logging.properties
adlı bir ASCII veya UTF-8 dosyası oluşturun ve aşağıdaki içeriği ekleyin:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
4. Adım: (İsteğe bağlı) Medya türlerini yapılandırma
Varsayılan olarak bağlayıcı, JDK tarafından sağlanan medya türü algılama özelliğiyle her dosya için medya türünü algılamaya çalışır. Microsoft Windows'da JDK, dosyaların medya türlerini belirlemek için Windows kayıt defterini kullanır. Eksik bir kayıt defteri girişi, belirli dosyalar için boş medya türüne neden olabilir.
Gerekirse mevcut bağlamaların üzerine yazan veya boş medya türünü engelleyen bir medya türü belirtebilirsiniz.
- Bağlayıcı dizininde
mime-type.properties
adında, Latin-1 şifrelemeli bir dosya oluşturun. Aşağıdaki örneklerde gösterildiği gibi dosya uzantılarını ve karşılık gelen medya türlerini girin:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
5. Adım: Dosya Sistemleri bağlayıcısını çalıştırın
Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra ana makinede başlatmak için aşağıdaki örnekteki gibi bir komut çalıştırın:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
Varsayılandan farklıysa yapılandırma dosyası yolunu belirtin (connector-config.properties
adlı ikili programla aynı dizinde).
Yapılandırma parametreleri referansı
Veri kaynağı erişimi
Yer | Parametre |
Veri kaynağı kimliği | api.sourceId=1234567890abcdef
Zorunlu. Google Workspace yöneticisi tarafından oluşturulan Google Cloud Search kaynak kimliği. |
Hizmet hesabı özel anahtar dosyasının yolu | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası. |
Kimlik kaynağı kimliği | api.identitySourceId=x0987654321
Zorunlu. GCDS kullanarak etkin dizin kimliklerini senkronize etmek için Google Workspace yöneticisi tarafından oluşturulan Cloud Search kimlik kaynağı kimliği. |
Dosya sistemi erişimi
Yer | Parametre |
Kaynak dosya sistemleri | fs.src=path1[,path2, ...]
Zorunlu. Kaynak dosya sistemlerini, |
Yol ayırıcı karakteri
Yer | Parametre |
Yol ayırıcı karakteri | fs.src.separator=separator-character
Varsayılan ayırıcı ";" karakteridir. Kaynak yollarınız noktalı virgül içeriyorsa virgül (",") gibi, yollarınızdaki karakterlerle çakışmayan ve mülk dosyasının söz dizimine göre ayrılmayan farklı bir ayırıcı ayarlayabilirsiniz.
|
Bağlayıcı davranışı
Yer | Parametre |
Windows alanı | fs.supportedDomain=domain
GCDS'yi kullanan kullanıcıların Cloud Search aracılığıyla dokümanlara erişmesine izin vermek için gereklidir. Active Directory için tek bir NetBIOS alan adı olarak belirtin. |
EKL'lere hesapları dahil et | fs.supportedAccounts=account-1[, account-2,...]
Yerleşik hesaplar olup olmadıklarına bakılmaksızın EKL'lere dahil edilecek hesapların virgülle ayrılmış listesi. Varsayılan değer: |
Yerleşik hesapları EKL'lerden hariç tut | fs.builtinGroupPrefix=prefix
Yerleşik hesapların önekini belirtin. Bu önekle başlayan bir hesap, yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur. Varsayılan değer: |
Gizli dosya ve klasörlerin dizine eklenmesine izin verme | fs.crawlHiddenFiles=boolean
Bağlayıcının gizli dosya ve klasörleri taramasına izin vermek için |
Taranan klasör listelerinin ve DFS Ad Alanı numaralandırmalarının dizine eklenmesine izin ver | fs.indexFolders=boolean
|
Dosya sistemi değişiklik izlemeyi etkinleştir | fs.monitorForUpdates=boolean
|
Dizinlerin önbelleğinin maksimum boyutunu ayarla | fs.directoryCacheSize=number-of-entries
Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörlerdeki dosya ve klasörlerin dizine eklenmesini önlemek amacıyla gizli klasörleri tanımlamak için önbelleği kullanır. Varsayılan değer 50.000 giriştir ve bu da genellikle 10-15 megabayt RAM kullanır. |
Zaman damgası koruması ve tarama denetimi
Yer | Parametre |
Son erişim zaman damgasını koru | fs.preserveLastAccessTime=value
Bağlayıcı, dosya ve klasörleri taradığında, bağlayıcı dosyaların ve klasörlerin son erişim zaman damgasını tarama zamanıyla değiştirebilir. Son erişim süreleri korunmadığında, bağlayıcının ziyareti nedeniyle yedekleme ve arşiv sistemleri uygun dosya ve klasörleri ikincil depolama alanına taşımayabilir. Varsayılan olarak, bağlayıcı son erişim zamanını korumaya çalışır ( Olası değerler:
|
Yalnızca belirli bir tarihten sonra erişilen dosyaları tara | fs.lastAccessedDate=YYYY-MM-DD
Yalnızca son erişim zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer: Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010 yılının başından itibaren erişilen içeriği tarar.
|
Yalnızca son birkaç gün içinde erişilen dosyaları tara | fs.lastAccessedDays=number-of-days
Yalnızca son erişim zamanı, şu andan önceki gün sayısı içindeyse içeriği tarayın. Varsayılan değer: Önceden dizine eklenmiş ve bir süredir erişilmemiş olan içeriğin süresini kaldırmak için bu özelliği kullanın. Örneğin, yalnızca geçen yıl erişildiyse içeriği taramak için 365 olarak ayarlayın.
|
Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tara | fs.lastModifiedDate=YYYY-MM-DD
Yalnızca son değiştirilme zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer: Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise, bağlayıcı yalnızca 2010 yılının başından sonra değiştirilen içeriği tarar.
|
Yalnızca son birkaç gün içinde değiştirilen dosyaları tara | fs.lastModifiedDays=number-of-days
Yalnızca son değiştirme zamanı, şu andan önceki gün sayısı içindeyse içeriği tarayın. Varsayılan değer: Önceden dizine eklenmiş ve bir süredir değiştirilmemiş içeriğin süresini kaldırmak için bu özelliği kullanın. Örneğin, yalnızca geçen yıl değiştirilmişse içeriği taramak için 365 olarak ayarlayın.
|
Dosya paylaşımı erişim denetimini atla
Varsayılan olarak bağlayıcı, dosya paylaşımındaki EKL'ler de dahil olmak üzere Erişim Kontrol Listeleri'ni (EKL'ler) dizine ekleme API'sine gönderirken erişim denetimi bütünlüğünü korur. Ancak bazı yapılandırmalarda bağlayıcı, paylaşım EKL'sini okumak için yeterli izne sahip olmayabilir. Böyle durumlarda, bağlayıcı arama sonuçlarında söz konusu dosya paylaşımında saklanan dosyaları döndürmez.
Bağlayıcıyı paylaşım EKL'sini yoksayacak şekilde ayarlayabilirsiniz. Böylece içerik, arama sonuçlarında her zaman döndürülür. Bu durumda, dizine ekleme API'si gerçek paylaşım EKL'si yerine tamamen serbest bir paylaşım EKL'si alır.
Yer | Parametre |
Dosya paylaşımı erişim denetimini atla | fs.skipShareAccessControl=boolean
Paylaşım EKL'lerini zorunlu kılmak için |