Bạn có thể thiết lập Google Cloud Search để trả về kết quả từ nội dung SharePoint Online của tổ chức ngoài nội dung Google Workspace. Sử dụng trình kết nối Cloud Search SharePoint Online và định cấu hình trình kết nối đó để truy cập vào một nguồn dữ liệu SharePoint Online cụ thể.
Điểm quan trọng cần lưu ý
Trước khi triển khai trình kết nối SharePoint Online, hãy lưu ý những điểm sau.
Chế độ cài đặt SharePoint được ưu tiên
Trình kết nối luôn ưu tiên chế độ cài đặt Search Visibility (Khả năng hiển thị trong tìm kiếm) trên SharePoint. Đối với tài liệu bản nháp, quyền trên tài khoản người dùng mà trình kết nối sử dụng để truy cập vào SharePoint Online sẽ kiểm soát những tài liệu bản nháp mà trình kết nối lập chỉ mục và trả về. Nếu tài khoản chỉ có quyền "Full Read" (Đọc toàn bộ), thì trình kết nối sẽ ưu tiên chế độ cài đặt "Draft item visibility" (Khả năng hiển thị của mục bản nháp).
Bạn cũng có thể định cấu hình trình kết nối để giới hạn kết quả dựa trên quyền truy cập vào tài khoản người dùng. Để áp dụng tính năng cắt tỉa bảo mật, hãy đồng bộ hoá các danh tính bên ngoài này với Google Cloud Directory:
- Người dùng Office 365 / Azure AD.
- Nhóm bảo mật Office 365 / Azure AD.
- Nhóm SharePoint (có người dùng và nhóm Office 365 là thành viên).
Tối ưu hóa công cụ tìm kiếm
Cải thiện trải nghiệm tìm kiếm bằng cách định cấu hình trình kết nối để trả về kết quả có liên quan. Sử dụng các tham số tạo HTML trong tệp cấu hình để đặt mức độ ảnh hưởng của trường.
Để thiết lập một lược đồ, hãy xem Tạo và đăng ký lược đồ. Khi thiết lập một lược đồ:
- Trình kết nối chuẩn hoá các loại nội dung SharePoint thành tên định nghĩa đối tượng hợp lệ (A-Z, a-z, 0-9). Ví dụ: "News Article" (Bài viết tin tức) trở thành "NewsArticle".
- Nếu không thể so khớp định nghĩa đối tượng, trình kết nối sẽ sử dụng loại đối tượng dự phòng (
itemMetadata.objectType). Hãy xem bài viết Tham số cấu hình siêu dữ liệu. - Trình kết nối ánh xạ tên thuộc tính SharePoint với định nghĩa thuộc tính.
- Trình kết nối ghi đè loại phương tiện cho các tệp
.msgcủa Microsoft Outlook và lập chỉ mục các tệp đó dưới dạngapplication/vnd.ms-outlook.
Các hạn chế đã biết của trình kết nối
- Mỗi thực thể trình kết nối chỉ lập chỉ mục nội dung từ một tập hợp trang web duy nhất. Để lập chỉ mục nhiều bộ sưu tập trang web, hãy thiết lập các thực thể bổ sung.
- Mức sử dụng bộ nhớ tăng lên theo số lượng người dùng và nhóm riêng biệt trong danh sách kiểm soát truy cập (ACL).
- Thông báo xoá có thể mất hơn 4 giờ để truyền tải.
Yêu cầu về hệ thống
| Yêu cầu về hệ thống | |
|---|---|
| Hệ điều hành | Windows Server 2016, Ubuntu, Red Hat Enterprise Linux 5.0 hoặc SUSE Enterprise Linux 10 (64 bit). |
| Xác thực | Xác thực trực tiếp. |
| Phần mềm | Môi trường SharePoint Online; Java JRE 1.8. |
Triển khai trình kết nối
Hãy làm theo các bước sau để triển khai trình kết nối SharePoint Online.
Điều kiện tiên quyết
- Tạo khoá riêng tư Google Workspace. Xem bài viết Định cấu hình quyền truy cập vào Cloud Search API.
- Thêm một nguồn dữ liệu để tìm kiếm và ghi lại mã nguồn dữ liệu đó. Xem bài viết Thêm một nguồn dữ liệu để tìm kiếm.
- Đối với kết quả dựa trên danh sách kiểm soát truy cập (ACL), quản trị viên phải tạo hai nguồn nhận dạng (một cho Office 365 và một cho nhóm SharePoint) và cung cấp mã khách hàng Google Workspace. Xem bài viết Ánh xạ danh tính người dùng.
- Thiết lập một tài khoản người dùng cho trình kết nối có đặc quyền Quản trị viên tập hợp trang web SharePoint Online.
- Tạo thông tin xác thực ứng dụng Azure Active Directory có quyền
Group.Read.AllvàUser.Read.All. Ghi lại Mã ứng dụng, Người thuê và Khoá bí mật của ứng dụng khách.
Bước 1. Cài đặt phần mềm trình kết nối
- Sao chép kho lưu trữ:
$ git clone https://github.com/google-cloudsearch/sharepoint-connector.git $ cd sharepoint-connector
- Kiểm tra phiên bản bạn đã chọn (ví dụ:
v1-0.0.3):$ git checkout tags/v1-0.0.3
- Tạo trình kết nối:
Để bỏ qua các bài kiểm thử, hãy sử dụng$ mvn package
mvn package -DskipTests. - Giải nén tệp ZIP vào thư mục cài đặt.
Bước 2. Tạo tệp cấu hình
Tạo sharepoint-online-connector.config trong thư mục cài đặt. Thêm các tham số dưới dạng cặp khoá-giá trị, như trong ví dụ sau:
api.sourceId=08ef8becd116faa4546b8ca2c84b2879
api.serviceAccountPrivateKeyFile=service_account.json
sharepoint.server=https://mydomain.onmicrosoft.com
sharepoint.siteCollectionOnly=true
sharepoint.username=admin@mydomain.onmicrosoft.com
sharepoint.password=password
sharepoint.formsAuthenticationMode=LIVE
sharepoint.deploymentType=ONLINE
api.identitySourceId=08ef8becd116faa475de26d9b291fed9
api.referenceIdentitySources=defaultIdentitySource
api.referenceIdentitySource.defaultIdentitySource.id=08ef8becd116faa5d3783f8c5a80e5aa
Xem tài liệu tham khảo hoặc các tham số do Google cung cấp để biết thông tin chi tiết.
Bước 3. Thiết lập tính năng ghi nhật ký
Tạo một thư mục logs và một tệp logging.properties có nội dung sau:
handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
# Default log level
.level = INFO
# uncomment line below to increase logging level for SharePoint APIsa
#com.google.enterprise.cloudsearch.sharepoint.level=FINE
# uncomment line below to increase logging level to enable API trace
#com.google.api.client.http.level = FINE
java.util.logging.ConsoleHandler.level = INFO
java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log
java.util.logging.FileHandler.limit=10485760
java.util.logging.FileHandler.count=10
java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Bước 4. Định cấu hình trình kết nối danh tính SharePoint
Để áp dụng danh sách kiểm soát truy cập (ACL) dựa trên danh tính, hãy tạo sharepoint-online-identity-connector.config bằng api.customerId và các tham số kết nối khác như trong ví dụ sau:
```properties
### SharePoint Online identity connector configuration ###
# Required parameters for data source access
api.customerId=C05d3djk8
api.serviceAccountPrivateKeyFile=service_account.json
# Required parameters for SharePoint Online access
sharepoint.server=https://mydomain.onmicrosoft.com
sharepoint.siteCollectionOnly=true
sharepoint.username=admin@mydomain.onmicrosoft.com
sharepoint.password=pa$sw0rd
sharepoint.formsAuthenticationMode=LIVE
sharepoint.deploymentType=ONLINE
# SharePoint identity mapping parameters
api.identitySourceId=08ef8becd116faa475de26d9b291fed9
api.referenceIdentitySources=defaultIdentitySource
api.referenceIdentitySource.defaultIdentitySource.id=08ef8becd116faa5d3783f8c5a80e5aa
```
Bước 5. Cài đặt trình kết nối danh tính Office 365
Nếu bạn đang sử dụng danh sách kiểm soát truy cập (ACL) dựa trên danh tính SharePoint Online, hãy thực hiện bước này. Nếu bạn đang sử dụng danh sách kiểm soát truy cập (ACL) công khai, hãy bỏ qua bước này.
Sao chép kho lưu trữ Office 365:
$ git clone https://github.com/google-cloudsearch/office-365-connector.git $ cd office-365-connectorKiểm tra và tạo trình kết nối bằng
mvn package.Giải nén tệp ZIP vào thư mục cài đặt.
Bước 6. Định cấu hình trình kết nối danh tính Office 365
Trong cùng một thư mục với bản cài đặt trình kết nối danh tính, hãy tạo một tệp có tên là
o365-identity-connector.configvà thêm các tham số dưới dạng cặp khoá-giá trị:### Office 365 Identity connector configuration ### api.identitySourceId=<var>12345abcde</var> api.customerId=<var>abcde12345</var> o365.clientId=<var>a63c6eb3-29e7-486</var> o365.tenant=<var>185ef9ed-29e7-486</var> o365.clientSecret=<var>raHJN15vRLBKs</var>Để biết nội dung mô tả tham số, hãy xem bài viết Trình kết nối danh tính Office 365.
Trong cùng một thư mục, hãy tạo một thư mục có tên là
logs.Trong cùng một thư mục, hãy tạo một tệp có tên là
logging.propertiescó nội dung sau:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = INFO # uncomment line below to increase logging level for Office 365 APIs #com.google.enterprise.cloudsearch.o365.level=FINE # uncomment line below to increase logging level to enable Google API traces #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-o365.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Bước 7. Khởi chạy trình kết nối
Sau khi định cấu hình trình kết nối, hãy chạy trình kết nối đó để bắt đầu đồng bộ hoá và lập chỉ mục. Chạy từng lệnh trong cửa sổ dòng lệnh riêng.
Chạy trình kết nối danh tính Office 365 để đồng bộ hoá người dùng và nhóm:
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-office-365-connector-v1-0.0.3.jar -Dconfig=o365-identity-connector.configChạy trình kết nối danh tính SharePoint Online để đồng bộ hoá các nhóm tập hợp trang web:
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-0.0.3.jar -Dconfig=sharepoint-online-identity-connector.configChạy trình kết nối SharePoint Online để lập chỉ mục nội dung:
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-0.0.3.jar -Dconfig=sharepoint-online-connector.config
Tài liệu tham khảo về tham số cấu hình
Các phần sau đây liệt kê các tham số cấu hình dùng để định cấu hình trình kết nối SharePoint Online.
Truy cập nguồn dữ liệu
| Cài đặt | Tham số |
| Mã nguồn dữ liệu | api.sourceId=1234567890abcdef
Bắt buộc. Mã nguồn dữ liệu Google Cloud Search do quản trị viên Google Workspace thiết lập. |
| Đường dẫn đến tệp khoá riêng tư của tài khoản dịch vụ | api.serviceAccountPrivateKeyFile=PrivateKey.json
Bắt buộc. Đường dẫn đến tệp khoá tài khoản dịch vụ Google Cloud Search. |
Quyền truy cập vào SharePoint Online
| Cài đặt | Tham số |
| Tên miền đủ điều kiện cho Tập hợp trang web SharePoint | sharepoint.server=http://yoursharepoint.example.com/
Bắt buộc. Nếu tên miền không đủ điều kiện, hãy đặt chế độ ghi đè DNS trên máy chủ trình kết nối. |
| Chế độ chỉ tập hợp trang web | sharepoint.siteCollectionOnly=true
Bắt buộc. Đối với SharePoint Online, hãy đặt giá trị |
| Tên người dùng SharePoint | sharepoint.username=username
Bắt buộc. Tên người dùng cho tài khoản dùng để truy cập vào SharePoint Online. |
| Mật khẩu SharePoint | sharepoint.password=user_password
Bắt buộc. Mật khẩu cho tài khoản dùng để truy cập vào SharePoint Online. |
| Chế độ xác thực | sharepoint.formsAuthenticationMode=LIVE
Bắt buộc. Đối với SharePoint Online, giá trị luôn là `LIVE`. |
| Loại hình triển khai | sharepoint.deploymentType=ONLINE
Bắt buộc. Đối với SharePoint Online, giá trị luôn là `ONLINE`. |
Ánh xạ danh tính SharePoint
| Cài đặt | Tham số |
| ID nguồn nhận dạng | api.identitySourceId=1234567890abcdef
Bắt buộc. ID nguồn nhận dạng Cloud Search cho nguồn nhận dạng nhóm SharePoint. |
| Nguồn nhận dạng tham chiếu | api.referenceIdentitySources=defaultIdentitySource
Bắt buộc. Đối với SharePoint Online, giá trị luôn là `defaultIdentitySource`. |
| Mã nguồn nhận dạng tham chiếu | api.referenceIdentitySource.defaultIdentitySource.id=112233abcd
Bắt buộc. ID nguồn nhận dạng Cloud Search cho nguồn nhận dạng Người dùng và Nhóm Office 365. |
Tạo nội dung HTML
| Cài đặt | Tham số |
| Trường tiêu đề mẫu HTML | contentTemplate.sharePointItem.title=Title
Trường SharePoint dùng làm tiêu đề mẫu HTML cho HTML đã tạo. |
| Các trường có chất lượng tìm kiếm cao về nội dung HTML | contentTemplate.sharePointItem.quality.high=highField1[,highField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng các trường có chất lượng cao. Khi các cụm từ tìm kiếm khớp với các trường này, kết quả sẽ được xếp hạng cao hơn. |
| Các trường có chất lượng tìm kiếm trung bình về nội dung HTML | contentTemplate.sharePointItem.quality.medium=mediumField1[,mediumField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng các trường có chất lượng trung bình. |
| Các trường có chất lượng tìm kiếm thấp về nội dung HTML | contentTemplate.sharePointItem.quality.low=lowField1[,lowField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng các trường có chất lượng thấp. |
| Các cột chưa được ánh xạ nội dung HTML | contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Cách trình kết nối xử lý các cột chưa được ánh xạ. Giá trị là APPEND (nối thêm) (mặc định) hoặc IGNORE (bỏ qua).
|
Định cấu hình trình kết nối danh tính Office 365
| Cài đặt | Tham số |
| ID nguồn nhận dạng | api.identitySourceId=1234567890abcdef
Bắt buộc. ID nguồn nhận dạng Office 365. Giá trị này phải khớp với giá trị của `api.referenceIdentitySource.defaultIdentitySource.id` trong cấu hình trình kết nối SharePoint Online. |
| Mã khách hàng Google | api.customerId=c1b1d1e1
Bắt buộc. Mã khách hàng Google Workspace của tổ chức bạn. |
| Mã ứng dụng Office 365 | o365.clientId=a63c6eb3-29e7-486
Bắt buộc. Mã ứng dụng từ quá trình thiết lập ứng dụng Office 365. |
| Người thuê Office 365 | o365.tenant=185ef9ed-29e7-486
Bắt buộc. Người thuê cho tài khoản Office 365 của bạn (ứng dụng Azure Activity Directory) |
| Khoá bí mật của ứng dụng khách Office 365 | o365.clientSecret=raHJN15vRLBKs
Bắt buộc. Khoá bí mật của thông tin xác thực từ quá trình thiết lập Ứng dụng Office 365 |