Google Cloud Search を設定すると、組織の Google Workspace のコンテンツに加えて、Microsoft Windows の共有機能も適用されます。マイページ Google Cloud Search File Systems コネクタを使用して 共有します。1 つのコネクタ インスタンスで、 Microsoft Windows 共有。
重要な考慮事項
継続的な自動更新
デフォルトでは、コネクタは起動時に開始パス(コネクタ構成ファイルの fs.src
の値)を継続的にモニタリングします。ファイル システムからコンテンツまたはアクセス制御の変更が報告されると、コネクタがトリガーされ、ファイル システムを再クロールします。この再クロールにより、リソースを大量に消費する可能性があります。ファイル システムのモニタリングを無効にするには、fs.monitorForUpdates
を false
に設定します。コネクタのリソース使用量は大幅に削減しますが、コネクタに変更が反映されるまで遅延します。詳細
DFS のアクセス制御
DFS システムはリンクにアクセス制御を適用し、通常、各 DFS リンクには独自の ACL があります。DFS が使用するメカニズムの一つに、Access-based Enumeration(ABE)があります。これは、ユーザーに返される DFS リンクを制限できます。ABE がホストされているホーム ディレクトリを隔離すると、DFS リンクの一部のみを取得することも、1 つのリンクのみを取得することも考えられます。コネクタが DFS システムを走査する場合、コネクタは DFS リンクの ACL とターゲットの共有 ACL に従い、共有 ACL は DFS ACL を継承します。
既知の制限事項
- ファイル システム: ファイル システム コネクタは、マッピングされたドライブとローカル ドライブをサポートしていません。
- 分散ファイル システム: UNC DFS にマッピングされたドライブは正しく動作しません。一部の ACL が正しく読み取られない。
- ファイル システム コネクタは、分散ファイル システム(DFS)の名前空間とリンクをサポートしています。ただし、コネクタは DFS 名前空間内の DFS リンクのみをサポートし、DFS 名前空間内の通常のフォルダはサポートしません。
- cloudsearch.google.com で返されたファイルリンクはクリックできません。また、Query API によって返されるファイルリンクは、ほとんどのブラウザでもクリックできません。
システム要件
システム要件 | |
---|---|
オペレーティング システム |
|
ソフトウェア |
|
ファイル システム プロトコル |
サポート対象外: ローカル Windows ファイル システム、Sun ネットワーク ファイル システム(NFS)2.0、Sun ネットワーク ファイル システム(NFS)3.0、ローカル Linux ファイル システム。 |
コネクタをデプロイする
前提条件
Cloud Search File Systems コネクタをデプロイする前に、 環境には、前提条件となる次のコンポーネントがすべて必要です。
Google Cloud Search とデータソースの関係を確立するために必要な Google Workspace の情報:
- Google Workspace の秘密鍵(サービス アカウント ID を含む)。対象 プライベート キーを取得する方法については、 Google Cloud Search REST API へのアクセスを構成する。
- Google Workspace データソースの ID。データソース ID を取得する方法については、 次に移動: 検索するデータソースを追加します。
- ID ソースの ID。ID ソースを取得する方法については、 ID については、 ID ソースを作成する。Google Workspace ディレクトリを Active Directory と同期する場合は、GCDS で ID ソースを設定します。
通常は、組織の Google Workspace 管理者がこれらの認証情報を取得できます。
次のセクションで説明するように、Windows アカウントに十分な権限がある。
必要な Microsoft Windows アカウント権限
コネクタを実行する Microsoft Windows アカウントには、次の操作を行うための十分な権限が必要です。
- フォルダの内容を一覧表示する
- ドキュメントの内容を読み取る
- ファイルやフォルダの属性を読み取る
- ファイルとフォルダ両方の権限(ACL)を読み取る
- 基本属性を書き込む
次のいずれかのグループのメンバーになると、コネクタが必要とする十分な権限が Windows アカウントに付与されます。
- 管理者
- Power Users
- Print Operators
- Server Operators
ステップ 1. Google Cloud Search File Systems コネクタをインストールする
GitHub からコネクタ リポジトリを取得してビルドします。
Windows サーバーで git を使用するには:
リポジトリのクローンを作成します。
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
希望するバージョンのコネクタをチェックアウトします。
> git checkout tags/v1-0.0.3
GitHub から直接ダウンロードするには:
- https://github.com/google-cloudsearch/windows-filesystems-connector に移動します。
- [Clone or download] [Download zip] をクリックします。
- パッケージを解凍します。
- 新しいディレクトリに移動します。
> cd windows-filesystems-connector
コネクタを作成します。必要に応じて、Apache Maven をインストールします。
> mvn package
コネクタのビルド時にテストをスキップするには、
mvn package
ではなくmvn package -DskipTests
を実行します。コネクタ zip ファイルをローカルのインストール ディレクトリにコピーします。
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
ステップ 2. コネクタ構成ファイルを作成する
コネクタのインストールと同じディレクトリにファイルを作成し、
connector-config.properties
という名前を付けます。次の例のように、パラメータを Key-Value ペアとしてファイルの内容に追加します。
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
各パラメータの詳細については、 構成パラメータのリファレンスをご覧ください。
(省略可)必要に応じて、他のコネクタ パラメータを構成します。詳しくは、 Google 提供のコネクタ パラメータ。
ステップ 3. ロギングを有効にする
- コネクタを含むディレクトリに
logs
という名前のフォルダを作成します。 バイナリです。 logging.properties
という名前の ASCII または UTF-8 ファイルを コネクタ バイナリを含むディレクトリを作成し、次の内容を追加します。handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
ステップ 4. (省略可)メディアタイプを設定する
デフォルトでは、コネクタはファイルごとにメディアタイプを検出しようとし、 JDK 提供 使用できます。Microsoft Windows では、JDK は Windows レジストリに依存して ファイルのメディアタイプを指定します。レジストリ エントリがない場合、null 値が返されることがある メディアタイプを指定します。
必要に応じて、既存のバインディングを上書きするか、null のメディアタイプを禁止するメディアタイプを指定できます。
- コネクタ ディレクトリに、
mime-type.properties
という名前の Latin-1 で暗号化されたファイルを作成します。 次の例に示すように、ファイル拡張子とそれに対応するメディアタイプを入力します。
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
ステップ 5: ファイル システム コネクタを実行する
File Systems コネクタをインストールして設定したら、 次の例のようなコマンドを実行します。
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
構成ファイルのパスがデフォルトと異なる場合は(connector-config.properties
という名前のバイナリと同じディレクトリにある)場合は指定します。
構成パラメータのリファレンス
データソース アクセス
設定 | パラメータ |
データソースの ID | api.sourceId=1234567890abcdef
必須。Google Workspace 管理者がセットアップした Google Cloud Search ソースの ID。 |
サービス アカウントの秘密鍵ファイルへのパス | api.serviceAccountPrivateKeyFile=./PrivateKey.json
必須。Google Cloud Search File Systems コネクタへのアクセスに必要な Google Cloud Search サービス アカウント キー ファイル。 |
ID ソースの ID | api.identitySourceId=x0987654321
必須。GCDS を使用して Active Directory の ID を同期するために Google Workspace 管理者がセットアップした、Cloud Search ID ソースの ID。 |
ファイル システムへのアクセス
設定 | パラメータ |
ソース ファイル システム | fs.src=path1[,path2, ...]
必須。ソースファイル システムを、 |
パス区切り文字
設定 | パラメータ |
パス区切り文字 | fs.src.separator=separator-character
デフォルトの区切り文字は「;」です。ソースパスにセミコロンが含まれている場合、パス内の文字と競合せず、プロパティ ファイルの構文自体で予約されていない別の区切り文字(カンマ(",")など)を設定できます。
|
コネクタの動作
設定 | パラメータ |
Windows ドメイン | fs.supportedDomain=domain
GCDS で設定されたユーザーが Cloud Search を介してドキュメントにアクセスできるようにするために必要です。Active Directory の単一の NetBIOS ドメイン名として指定します。 |
ACL にアカウントを含める | fs.supportedAccounts=account-1[, account-2,...]
組み込みアカウントであるかどうかに関係なく、ACL に含めるアカウントのカンマ区切りのリスト。 デフォルト値は |
組み込みアカウントを ACL から除外する | fs.builtinGroupPrefix=prefix
組み込みアカウントの接頭辞を指定します。この接頭辞で始まるアカウントは組み込みアカウントとみなされ、ACL から除外されます。 デフォルト値は |
非表示のファイルとフォルダのインデックス登録を許可する | fs.crawlHiddenFiles=boolean
|
クロールされたフォルダの一覧と DFS 名前空間の列挙型のインデックス登録を許可する | fs.indexFolders=boolean
|
ファイル システムの変更のモニタリングを有効にする | fs.monitorForUpdates=boolean
|
ディレクトリのキャッシュの最大サイズを設定する | fs.directoryCacheSize=number-of-entries
ディレクトリ キャッシュの最大サイズ。コネクタはキャッシュを使用して隠しフォルダを識別し、隠しフォルダ内のファイルやフォルダがインデックスに登録されないようにします。 デフォルトは 50,000 エントリで、通常は 10 ~ 15 MB の RAM を消費します。 |
タイムスタンプの保持とクロール制御
設定 | パラメータ |
最終アクセスのタイムスタンプを保持する | fs.preserveLastAccessTime=value
コネクタは、ファイルやフォルダをクロールする際に、ファイルとフォルダの最終アクセスのタイムスタンプをクロール時刻に変更します。最終アクセス日時が保持されていない場合、コネクタのアクセスが原因で、バックアップ システムとアーカイブ システムで適切なファイルとフォルダがセカンダリ ストレージに移動されない可能性があります。 デフォルトでは、コネクタは最終アクセス日時( 考えられる値は次のとおりです。
|
特定の日付以降にアクセスされたファイルのみをクロールする | fs.lastAccessedDate=YYYY-MM-DD
最終アクセス日時が指定した日付より後の場合にのみ、コンテンツをクロールします。デフォルト値は 日付は、ISO8601 日付形式(YYYY-MM-DD)で指定します。たとえば、値が 2010-01-01 の場合、コネクタは 2010 年初頭以降にアクセスされたコンテンツのみをクロールします。
|
過去数日以内にアクセスされたファイルのみをクロールする | fs.lastAccessedDays=number-of-days
最終アクセス日時が現在の日数の範囲内である場合にのみ、コンテンツをクロールします。デフォルト値は このプロパティを使用して、以前にインデックスに登録され、しばらくアクセスされていないコンテンツを期限切れにします。たとえば、過去 1 年にアクセスされたコンテンツのみをクロールするには、365 に設定します。
|
特定の日付以降に変更されたファイルのみをクロールする | fs.lastModifiedDate=YYYY-MM-DD
最終更新日時が指定した日付より後の場合にのみコンテンツをクロールします。デフォルト値は 日付を ISO8601 日付形式(YYYY-MM-DD)で指定します。たとえば、値が 2010-01-01 の場合、コネクタは 2010 年の開始以降に変更されたコンテンツのみをクロールします。
|
過去数日以内に変更されたファイルのみをクロールする | fs.lastModifiedDays=number-of-days
最終更新日時が現時点までの日数の範囲内である場合にのみ、コンテンツをクロールします。デフォルト値は このプロパティを使用して、以前にインデックスに登録され、しばらく変更されていないコンテンツを期限切れにします。たとえば、前年に変更されたコンテンツのみをクロールするには、365 に設定します。
|
ファイル共有のアクセス制御をスキップする
デフォルトでは、コネクタはアクセス制御リスト(ACL)を Indexing API(ファイル共有上の ACL を含む)に送信する際に、アクセス制御の整合性を維持します。ただし、構成によっては、共有 ACL を読み取るための十分な権限がコネクタに付与されていないことがあります。このような場合、コネクタは、そのファイル共有に保持されているファイルを検索結果で返しません。
共有 ACL を無視するようにコネクタを設定することで、検索結果にコンテンツが常に返されるようになります。この場合、Indexing API は実際の共有 ACL ではなく、完全に制限の緩い共有 ACL を取得します。
設定 | パラメータ |
ファイル共有のアクセス制御をスキップする | fs.skipShareAccessControl=boolean
共有 ACL を適用するには、 |