Microsoft Windows Dosya Sistemleri bağlayıcısını dağıtma

Google Cloud Search'ü, kuruluşunuzun çalışma verilerinden sonuç döndürecek şekilde ayarlayabilirsiniz. Microsoft Windows, Google Workspace içeriğinize ek olarak paylaşım yapar. Siz Google Cloud Search File Systems bağlayıcısını kullanıp belirtilen Windows paylaşımları. Tek bir bağlayıcı örneği, birden fazla Microsoft Windows paylaşımları.

Dikkat edilmesi gerekenler

Sürekli otomatik güncellemeler

Varsayılan olarak bağlayıcı, bağlayıcı başlatılırken başlangıç yollarını (bağlayıcı yapılandırma dosyasındaki fs.src değerleri) sürekli olarak izler. Dosya sistemi, içerik veya erişim kontrollerinde yapılan değişiklikleri bildirdiğinde bağlayıcı, dosya sistemini yeniden taramak için tetiklenir. Bu yeniden tarama işlemi yoğun kaynak gerektirebilir. Dosya sistemi izlemeyi devre dışı bırakmak için fs.monitorForUpdates öğesini false olarak ayarlayın. Bağlayıcının kaynak kullanımını önemli ölçüde azaltıyorsunuz ancak bağlayıcının değişiklikleri yansıtmasını geciktiriyorsunuz. Daha fazla bilgi

DFS erişim denetimi

DFS sistemi, bağlantılarına erişim denetimi uygular ve genellikle her DFS bağlantısının kendi EKL'si vardır. DFS'nin kullandığı mekanizmalardan biri, kullanıcıya döndürülen DFS bağlantılarını kısıtlayabilen Access-based Enumeration (ABE) yöntemidir. Kullanıcılar DFS Bağlantılarının yalnızca bir alt kümesini veya ABE barındırılan ana dizinleri izole ettiğinde yalnızca bir bağlantıyı alabilir. Bağlayıcı bir DFS sistemini geçtiğinde bağlayıcı DFS bağlantı EKL'sine ve hedefin Paylaşım EKL'sine uyar. Paylaşım EKL'si, DFS EKL'den devralınır.

Bilinen sınırlamalar

  • Dosya Sistemi: Dosya Sistemleri bağlayıcısı, eşlenen sürücüleri ve yerel sürücüleri desteklemez.
  • Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü düzgün çalışmıyor. Bazı EKL'ler doğru okunmuyor.
  • Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantılarını destekler. Bununla birlikte bağlayıcı, DFS ad alanındaki normal klasörleri değil, yalnızca bir DFS ad alanındaki DFS bağlantılarını destekler.
  • cloudsearch.google.com sayfasında döndürülen dosya bağlantıları tıklanamaz. Query API'si tarafından döndürülen dosya bağlantıları da çoğu tarayıcıda tıklanabilir değildir.

Sistem gereksinimleri

Sistem gereksinimleri
İşletim sistemi
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Yazılım
  • Google Cloud Search File Systems bağlayıcısını çalıştıracak bilgisayarda Java JRE 1.8 yüklü
Dosya sistemi protokolleri
  • Sunucu İleti Bloğu (SMB) - SMB1
  • Sunucu İleti Bloğu (SMB) - SMB2
  • Dağıtılmış Dosya Sistemi (DFS)

Desteklenmez: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya Yerel Linux dosya sistemi.

Bağlayıcıyı dağıtma

Ön koşullar

Cloud Search File Systems bağlayıcısını dağıtmadan önce ortam aşağıdaki ön koşul bileşenlerine sahiptir:

Gerekli Microsoft Windows hesap izinleri

Bağlayıcının çalıştırıldığı Microsoft Windows hesabının Aşağıdaki işlemleri gerçekleştirmek için yeterli izin:

  • Klasörlerin içeriğini listeleme
  • Belgelerin içeriğini okuyun
  • Dosya ve klasörlerin özelliklerini okuma
  • Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
  • Temel özellik izinlerini yazma

Aşağıdaki gruplardan birinde üye olmak, bir Windows hesabına bağlayıcı için gereken yeterli izinleri sağlar:

  • Yöneticiler
  • Deneyimli Kullanıcılar
  • Yazdırma Operatörleri
  • Sunucu Operatörleri

1. Adım: Google Cloud Search Dosya Sistemleri bağlayıcısını yükleme

  1. GitHub'dan bağlayıcı deposunu alın ve derleyin.

    Windows sunucusunda git kullanmak için:

    1. Kod deposunu klonlayın:

      > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
      > cd windows-filesystems-connector
    2. Bağlayıcının istediğiniz sürümünü kontrol edin:

      > git checkout tags/v1-0.0.3

    GitHub'dan doğrudan indirmek için:

    1. https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
    2. Klonla veya indir Zip dosyasını indir'i tıklayın.
    3. Paketi açın.
    4. Yeni dizine taşıyın:
      > cd windows-filesystems-connector
      .
  2. Bağlayıcıyı oluşturun. Gerekirse Apache Maven'i yükleyin.

    > mvn package

    Bağlayıcıyı oluştururken testleri atlamak için mvn package yerine mvn package -DskipTests komutunu çalıştırın.

  3. Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

2. adım: Bağlayıcı yapılandırma dosyasını oluşturma

  1. Bağlayıcı kurulumuyla aynı dizinde bir dosya oluşturun ve onu connector-config.properties olarak adlandırın.

  2. Parametreleri, aşağıdaki örnekte gösterildiği gibi, dosya içeriğine anahtar/değer çiftleri olarak ekleyin:

    ### File system connector configuration ###
    
    # Required parameters for Cloud Search data source and identity source access
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # Required parameters for file system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link
    
    # Optional parameters for file system monitoring
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Her parametreyle ilgili ayrıntılı açıklamalar için yapılandırma parametreleri referansı sayfasına gidin.

  3. (İsteğe bağlı) Diğer bağlayıcı parametrelerini gerektiği şekilde yapılandırın. Ayrıntılı bilgi için Google'ın sağladığı bağlayıcı parametreleri.

3. Adım: Günlük kaydını etkinleştir

  1. Bağlayıcıyı içeren dizinde logs adlı bir klasör oluşturun ikilik.
  2. logging.properties aşağıdaki içeriği ekleyin:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma

Varsayılan olarak bağlayıcı, birinci taraf verileri içeren her dosya için JDK tarafından sağlanır medya türü algılama. Microsoft Windows'da, JDK şunları yapmak için Windows kayıt defterini kullanır: dosyaların medya türlerini belirler. Eksik bir kayıt defteri girişi null değerine neden olabilir belirli dosyalar için medya türünü seçebilirsiniz.

Gerekirse mevcut bağlamaların üzerine yazan veya boş medya türünü engelleyen bir medya türü belirtebilirsiniz.

  1. Bağlayıcı dizininde mime-type.properties adında, Latin-1 şifrelemeli bir dosya oluşturun.
  2. Aşağıdaki örneklerde gösterildiği gibi dosya uzantılarını ve karşılık gelen medya türlerini girin:

    xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
    one=application/msonenote
    txt=text/plain
    pdf=application/pdf
    

5. Adım: Dosya Sistemleri bağlayıcısını çalıştırın

Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra aşağıdaki örnek gibi bir komut çalıştırın:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Varsayılandan farklıysa yapılandırma dosyası yolunu belirtin (connector-config.properties adlı ikili programla aynı dizinde).

Yapılandırma parametreleri referansı

Veri kaynağı erişimi

Yer Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Google Workspace yöneticisi tarafından oluşturulan Google Cloud Search kaynak kimliği.

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Zorunlu. GCDS kullanarak etkin dizin kimliklerini senkronize etmek için Google Workspace yöneticisi tarafından oluşturulan Cloud Search kimlik kaynağı kimliği.

Dosya sistemi erişimi

Yer Parametre
Kaynak dosya sistemleri fs.src=path1[,path2, ...]

Zorunlu. Kaynak dosya sistemlerini, fs.src.separator tarafından yapılandırılan sınırlayıcıyla ayrılmış bir veya daha fazla UNC kaynağı olarak belirtin. Latin1 dilinde olmayan karakterler kullanıyorsanız bunları Java Unicode çıkışlarıyla kodlayın.

Yol ayırıcı karakteri

Yer Parametre
Yol ayırıcı karakteri fs.src.separator=separator-character

Varsayılan ayırıcı ";" olacaktır. Kaynak yollarınız noktalı virgül içeriyorsa virgül (",") gibi, yollarınızdaki karakterlerle çakışmayan ve özellik dosyasının söz dizimine göre ayrılmayan farklı bir ayırıcı ayarlayabilirsiniz.

fs.src.separator değeri boş bir dizeyse fs.src değeri tek bir yol olarak değerlendirilir.

Bağlayıcı davranışı

Yer Parametre
Windows alanı fs.supportedDomain=domain

GCDS'yi kullanan kullanıcıların Cloud Search aracılığıyla dokümanlara erişmesine izin vermek için gereklidir. Active Directory için tek bir NetBIOS alan adı olarak belirtin.

EKL'lere hesapları dahil et fs.supportedAccounts=account-1[, account-2,...]

Yerleşik hesaplar olup olmadıklarına bakılmaksızın EKL'lere dahil edilecek hesapların virgülle ayrılmış listesi.

Varsayılan değer: BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users

Yerleşik hesapları EKL'lerden hariç tut fs.builtinGroupPrefix=prefix

Yerleşik hesapların önekini belirtin. Bu önekle başlayan bir hesap, yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur.

Varsayılan değer: BUILTIN\\

Gizli dosya ve klasörlerin dizine eklenmesine izin verme fs.crawlHiddenFiles=boolean

Bağlayıcının gizli dosya ve klasörleri taramasına izin vermek için true olarak ayarlayın (Windows dosya sistemlerinde, gizli DOS özelliği ayarlandığında dosya veya klasör gizli kabul edilir.) Varsayılan değer false değeridir.

Taranan klasör listelerinin ve DFS Ad Alanı numaralandırmalarının dizine eklenmesine izin ver fs.indexFolders=boolean

true (varsayılan) değerine ayarlanırsa bağlayıcı bir klasörü tararken bağlayıcı bir CONTAINER_ITEM nesnesi oluşturur. Yanlış değerine ayarlandığında bağlayıcı bunun yerine bir VIRTUAL_CONTAINER_ITEM nesnesi oluşturur.

Dosya sistemi değişiklik izlemeyi etkinleştir fs.monitorForUpdates=boolean

true (varsayılan) olarak ayarlandığında, içerikte veya erişim kontrollerinde yapılan değişiklikler bağlayıcıyı yeniden tarama işlemi tetikler. İzlemeyi kapattığınızda (false olarak ayarlanır), bağlayıcının kaynak kullanımını önemli ölçüde azaltırsınız ancak bağlayıcının değişiklikleri yansıtmasını geciktirirsiniz.

Dizinlerin önbelleğinin maksimum boyutunu ayarla fs.directoryCacheSize=number-of-entries

Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörlerdeki dosya ve klasörlerin dizine eklenmesini önlemek amacıyla gizli klasörleri tanımlamak için önbelleği kullanır.

Varsayılan değer 50.000 giriştir ve bu da genellikle 10-15 megabayt RAM kullanır.

Zaman damgası koruması ve tarama denetimi

Yer Parametre
Son erişim zaman damgasını koru fs.preserveLastAccessTime=value

Bağlayıcı, dosya ve klasörleri taradığında, bağlayıcı dosyaların ve klasörlerin son erişim zaman damgasını tarama zamanıyla değiştirebilir. Son erişim süreleri korunmadığında, bağlayıcının ziyareti nedeniyle yedekleme ve arşiv sistemleri uygun dosya ve klasörleri ikincil depolama alanına taşımayabilir.

Varsayılan olarak, bağlayıcı son erişim zamanını korumaya çalışır (fs.preserveLastAccessTime, ALWAYS olarak ayarlandı). Geçiş kullanıcısı, dosya özelliklerini yazmak için yeterli ayrıcalığa sahip değilse bağlayıcı, dosyaya son erişim zamanını geri yükleyemeyebilir. ALWAYS olarak ayarlandığında bağlayıcı, dosyaların son erişim zaman damgalarını değiştirmemesi için dosya sistemine yönelik tarama isteklerini reddeder.

Olası değerler:

  • ALWAYS: Bağlayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışır. Bağlayıcı son erişim zamanını ilk kez koruyamadığında, bağlayıcı son erişim zaman damgalarının değiştirilmesini önlemek için dosya sistemine yönelik sonraki tüm tarama isteklerini reddeder.
  • IF_ALLOWED: Bağlayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışır. Bazı zaman damgaları korunmasa bile tarama işlemine devam eder.
  • NEVER: Bağlayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışmaz.
Yalnızca belirli bir tarihten sonra erişilen dosyaları tara fs.lastAccessedDate=YYYY-MM-DD

Yalnızca son erişim zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer: disabled.

Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010 yılının başından itibaren erişilen içeriği tarar.

fs.lastAccessedDate değerini belirtirseniz fs.lastAccessedDays için aynı anda bir değer ayarlayamazsınız.

Yalnızca son birkaç gün içinde erişilen dosyaları tara fs.lastAccessedDays=number-of-days

Yalnızca son erişim zamanı, şu andan önceki gün sayısı içindeyse içeriği tarayın. Varsayılan değer: disabled.

Önceden dizine eklenmiş ve bir süredir erişilmemiş olan içeriğin süresini kaldırmak için bu özelliği kullanın. Örneğin, yalnızca geçen yıl erişildiyse içeriği taramak için 365 olarak ayarlayın.

fs.lastAccessedDays değerini belirtirseniz fs.lastAccessedDate için aynı anda bir değer ayarlayamazsınız.

Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tara fs.lastModifiedDate=YYYY-MM-DD

Yalnızca son değiştirilme zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer: disabled.

Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise, bağlayıcı yalnızca 2010 yılının başından sonra değiştirilen içeriği tarar.

fs.lastModifiedDate değerini belirtirseniz fs.lastModifiedDays için aynı anda bir değer ayarlayamazsınız.

Yalnızca son birkaç gün içinde değiştirilen dosyaları tara fs.lastModifiedDays=number-of-days

Yalnızca son değiştirme zamanı, şu andan önceki gün sayısı içindeyse içeriği tarayın. Varsayılan değer: disabled.

Önceden dizine eklenmiş ve bir süredir değiştirilmemiş içeriğin süresini kaldırmak için bu özelliği kullanın. Örneğin, yalnızca son bir yıl içinde değiştirilmişse içeriği taramak için 365 olarak ayarlayın.

fs.lastModifiedDays değerini belirtirseniz fs.lastModifiedDate için aynı anda bir değer ayarlayamazsınız.

Dosya paylaşımı erişim denetimini atla

Varsayılan olarak bağlayıcı, dosya paylaşımındaki EKL'ler de dahil olmak üzere Erişim Kontrol Listeleri'ni (EKL'ler) dizine ekleme API'sine gönderirken erişim denetimi bütünlüğünü korur. Ancak bazı yapılandırmalarda bağlayıcı, paylaşım EKL'sini okumak için yeterli izne sahip olmayabilir. Böyle durumlarda, bağlayıcı arama sonuçlarında söz konusu dosya paylaşımında saklanan dosyaları döndürmez.

Bağlayıcıyı paylaşım EKL'sini yoksayacak şekilde ayarlayabilirsiniz. Böylece içerik, arama sonuçlarında her zaman döndürülür. Bu durumda, dizine ekleme API'si gerçek paylaşım EKL'si yerine tamamen serbest bir paylaşım EKL'si alır.

Yer Parametre
Dosya paylaşımı erişim denetimini atla fs.skipShareAccessControl=boolean

Paylaşım EKL'lerini zorunlu kılmak için false (varsayılan) olarak ayarlayın. Paylaşım EKL'lerini yoksaymak için true olarak ayarlayın.