Implementa el conector de Microsoft SharePoint On-Premises

Puedes configurar Google Cloud Search para que muestre resultados del contenido local de SharePoint de tu organización, además del contenido de Google Workspace. Usa el conector de SharePoint On-Prem de Cloud Search y configúralo para acceder a una fuente de datos específica de SharePoint.

Consideraciones importantes

Antes de implementar el conector de SharePoint On-Prem, ten en cuenta las siguientes consideraciones.

Configuración de SharePoint respetada

El conector siempre respeta la configuración de visibilidad de búsqueda en SharePoint. En el caso de los documentos en borrador, los permisos de la cuenta de usuario que usa el conector para acceder a SharePoint controlan qué documentos indexa y muestra. Si la cuenta tiene permisos de "Lectura completa", el conector respeta la configuración de "visibilidad del elemento en borrador".

También puedes limitar los resultados según el acceso a la cuenta de usuario con principales de Google y externos para definir LCA. Para aplicar el recorte de seguridad, sincroniza estas identidades externas con Google Cloud Directory:

  • Usuarios y grupos de Active Directory
  • Grupos locales de SharePoint (con grupos y usuarios de Active Directory como miembros)

Para sincronizar los usuarios y grupos de AD, usa Google Cloud Directory Sync y habilita los grupos asignados a la identidad. Para los grupos locales de SharePoint, usa el conector de identidad de SharePoint.

El conector también realiza búsquedas de Active Directory para recuperar información para sincronizar principales, como la asignación de SID a sAMAccountNames.

Optimización de la búsqueda

Mejora la experiencia de búsqueda configurando el conector para que muestre resultados relevantes. Usa parámetros de generación de HTML en el archivo de configuración para establecer niveles de impacto de los campos.

Para configurar un esquema, consulta Cómo crear y registrar un esquema. Cuando configures un esquema, ten en cuenta lo siguiente:

  • El conector normaliza los tipos de contenido de SharePoint a nombres de definición de objetos válidos (A-Z, a-z, 0-9). Por ejemplo, "Artículo de noticias" se convierte en "NewsArticle".
  • Si el conector no puede hacer coincidir una definición de objeto, usa el tipo de objeto de resguardo (itemMetadata.objectType). Consulta Parámetros de configuración de metadatos.
  • El conector normaliza los nombres de las propiedades decodificando los caracteres hexadecimales y quitando los prefijos "ows_".

Manejo de mensajes de Microsoft Outlook

El conector anula el tipo de medio para los archivos .msg de Microsoft Outlook y los indexa como application/vnd.ms-outlook.

Configuraciones de múltiples instancias

Para las implementaciones de múltiples instancias, configura el modo de colección de sitios:

  • Otorga a la cuenta del conector permisos de administrador de colección de sitios.
  • Establece sharepoint.server en la URL de la colección de sitios (p.ej., http://sharepoint.example.com/sites/collection).
  • Establece sharepoint.siteCollectionOnly en true.

Configura una instancia de conector por colección de sitios.

Limitaciones conocidas

  • El tiempo de detección de los cambios aumenta con la cantidad de bases de datos supervisadas.
  • El uso de memoria aumenta con la cantidad de grupos y usuarios únicos en las LCA.
  • El conector solo admite identidades de un dominio de Active Directory.
  • Las notificaciones de eliminación pueden tardar más de cuatro horas en propagarse.

Requisitos del sistema

Requisitos del sistema
Sistema operativo Windows Server 2016, Ubuntu, Red Hat Enterprise Linux 5.0 o SUSE Enterprise Linux 10 (64 bits)
Software SharePoint Server 2013 o 2016; Java JRE 1.8
Autenticación NTLM, Kerberos, HTTP Basic o ADFS

Implementa el conector

Sigue estos pasos para implementar el conector de SharePoint On-Prem.

Requisitos previos

  1. Crea una clave privada de Google Workspace. Consulta Configura el acceso a la API de Cloud Search.
  2. Agrega una fuente de datos a la búsqueda y registra su ID. Consulta Agrega una fuente de datos a la búsqueda.
  3. Para los resultados basados en LCA, tu administrador debe crear dos fuentes de identidad (una para Active Directory y otra para los grupos locales de SharePoint) y proporcionar el ID de cliente de Google Workspace. Consulta Asigna identidades de usuario.
  4. Configura una cuenta de usuario para el conector con permisos de lectura completa.
  5. Asegúrate de que la aplicación web de SharePoint tenga una colección de sitios raíz.
  6. Si las colecciones de sitios están bloqueadas para escritura, ejecuta la PrepareWriteLockedSites.ps1 secuencia de comandos.

Paso 1: Instala el software del conector

  1. Clona el repositorio:
    $ git clone https://github.com/google-cloudsearch/sharepoint-connector.git
    $ cd sharepoint-connector
  2. Extrae la versión seleccionada (p.ej., v1-0.0.5):
    $ git checkout tags/v1-0.0.5
  3. Compila el conector:
    $ mvn package
    Para omitir las pruebas, usa mvn package -DskipTests.
  4. Extrae el archivo ZIP en tu directorio de instalación.

Paso 2: Crea el archivo de configuración

Crea connector-config.properties en el directorio de instalación. Agrega parámetros como pares clave-valor:

api.sourceId=08ef8becd116faa4546b8ca2c84b2879
api.serviceAccountPrivateKeyFile=service_account.json
api.identitySourceId=08ef8becd116faa475de26d9b291fed9
sharepoint.server=http://sp-2016:32967/sites/collection
sharepoint.siteCollectionOnly=true
sharepoint.username=contoso\\admin
sharepoint.password=password
adLookup.host=dc.contoso.com
adLookup.username=contoso\\admin
adLookup.password=password

Consulta la referencia o los parámetros proporcionados por Google para obtener más detalles.

Paso 3: Agrega SharePoint como un host confiable (HTTPS)

Si usas HTTPS, exporta el certificado de SharePoint y, luego, impórtalo al almacén de claves del conector:

$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint

Paso 4: Configura el registro

Crea una carpeta logs y un archivo logging.properties con este contenido: properties handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler .level = INFO java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log

Paso 5: Configura el conector de identidad

Para aplicar LCA basadas en la identidad, crea sharepoint-onprem-identity-connector.config con tu api.customerId y otros parámetros de conexión.

Paso 6: Inicia el conector

  1. Ejecuta GCDS para sincronizar los usuarios y grupos de Active Directory.
  2. Ejecuta el conector de identidad de SharePoint para sincronizar los grupos de la colección de sitios.
  3. Ejecuta el conector de SharePoint On-Prem para indexar contenido.

Referencia de los parámetros de configuración

En las siguientes secciones, se enumeran los parámetros de configuración que se usan para configurar el conector de SharePoint On-Prem.

Acceso a la fuente de datos

Configuración Parámetro
ID de la fuente de datos api.sourceId=ID
Cuenta de servicio api.serviceAccountPrivateKeyFile=path

Acceso local a SharePoint

Configuración Parámetro
URL del servidor sharepoint.server=URL
Credenciales sharepoint.username y sharepoint.password

Generación de contenido HTML

Configuración Parámetro
Campo de título contentTemplate.sharePointItem.title=Title
Campos de calidad contentTemplate.sharePointItem.quality.high, medium o low