Giờ hỗ trợ về SEO của Google tháng 6 năm 2023

Đây là bản chép lời của chương trình Giờ hỗ trợ về SEO của Google tháng 6 năm 2023. Để được trợ giúp cụ thể đối với từng trang web, bạn nên đăng câu hỏi trong Cộng đồng trợ giúp của Trung tâm Google Tìm kiếm.

Phiên bản tổng hợp xuất hiện trên Google Khám phá dù chúng tôi đã sử dụng các đường liên kết chính tắc. Vì sao vậy?

John: Beth hỏi: Chúng tôi cho phép tổng hợp nội dung của mình. Tuy nhiên, có nhiều lần phiên bản tổng hợp xuất hiện trên Google Khám phá dù chúng tôi có sử dụng các đường liên kết chính tắc. Chúng tôi có thể tránh điều này bằng cách nào?

Đây là vấn đề về thời gian. Mới đây, chúng tôi mở rộng hướng dẫn về nội dung tổng hợp để giải quyết vấn đề này. link rel=canonical là một tín hiệu giúp chúng ta chuẩn hoá, như một gợi ý. Nếu nội dung của bạn đang được tổng hợp và bạn hoàn toàn không muốn phiên bản tổng hợp xuất hiện trên Tìm kiếm, thì bạn nên đảm bảo rằng phiên bản tổng hợp cũng có thẻ meta robots noindex. Thao tác này sẽ ngăn trang web xuất hiện trên Tìm kiếm trong khi vẫn cho phép người dùng truy cập trang bình thường.

2 miền có TLD khác nhau có thể nhắm đến cùng một quốc gia cho các từ khoá giống nhau không?

Gary: Sagar hỏi: 2 miền có TLD khác nhau có thể nhắm đến cùng một quốc gia cho các từ khoá giống nhau không?

Tôi tự hỏi liệu điều này có gây nhầm lẫn cho người dùng của bạn hay không: việc hai tên miền có lẽ có cùng nội dung sẽ có thể gây nhầm lẫn. Dưới góc độ chính sách, việc này có vẻ giống như thao túng kết quả tìm kiếm, bạn nên tham khảo Chính sách của Google về nội dung rác.

Cảnh báo JavaScript của Lighthouse có ảnh hưởng gì đến điểm xếp hạng hoặc thứ hạng của trang không?

Martin: Arnd đặt câu hỏi: Cảnh báo JavaScript của Lighthouse cho thư viện có các lỗ hổng bảo mật đã biết có ảnh hưởng gì đến điểm xếp hạng hoặc thứ hạng của trang không?

Chào Arnd, cảm ơn bạn đã đặt câu hỏi. Không. Thường thì bạn không nhận được thông tin nào về thứ hạng. Tuy nhiên, bạn không nên bỏ qua các cảnh báo và vấn đề bảo mật. Bạn nên khắc phục các vấn đề như vậy càng sớm càng tốt.

Làm cách nào để chặn Googlebot thu thập dữ liệu một phần cụ thể trên trang web?

John: Sean hỏi: Làm cách nào để chặn Googlebot thu thập dữ liệu một phần cụ thể trên trang web? Trên các trang sản phẩm, chúng tôi cũng có mục đã mua. Mục này thường chứa các tiện ích bổ sung nhỏ, không phải là một phần lớn trên trang web của chúng tôi.

Nói ngắn gọn thì bạn không thể chặn thu thập dữ liệu một phần cụ thể trên trang HTML. Tuy nhiên, có hai cách làm với tác dụng tương tự: bạn có thể sử dụng thuộc tính HTML data-nosnippet để ngăn văn bản xuất hiện trong đoạn trích tìm kiếm hoặc bạn có thể sử dụng iframe hoặc JavaScript có nguồn bị robots.txt chặn. Thường thì việc sử dụng iframe trong tệp robots.txt hoặc tệp JavaScript không phải là cách hay, vì việc này có thể gây ra sự cố khi thu thập dữ liệu và lập chỉ mục, khiến khó chẩn đoán và giải quyết. Nếu đây chỉ là nội dung được sử dụng lại trên các trang của bạn, tôi sẽ không lo lắng về điều đó — không cần chặn Googlebot thấy loại nội dung trùng lặp đó.

Tôi đã gửi một sơ đồ trang web nhưng nó không xuất hiện trong kết quả tìm kiếm. Vì sao vậy?

Gary: Có người hỏi: Tôi đã gửi một sơ đồ trang web nhưng nó không xuất hiện trong kết quả tìm kiếm.

Tôi cho là bạn đang nói về URL. Nếu đúng vậy, xin lưu ý rằng sơ đồ trang web là một cách để cho công cụ tìm kiếm biết nội dung của bạn ở đâu, chỉ vậy thôi. Điều này không đảm bảo rằng URL mà bạn cung cấp sẽ được thu thập dữ liệu và cũng không đảm bảo rằng chúng sẽ được lập chỉ mục. Cả hai việc này đều phụ thuộc vào chất lượng của nội dung và mức độ phổ biến tương đối của nội dung đó trên Internet.

Tại sao dữ liệu có cấu trúc hiện lỗi trên Google nhưng không thấy lỗi đó trên schema.org?

Martin: Corey hỏi: Tại sao dữ liệu có cấu trúc hiện lỗi trên Google nhưng không thấy lỗi đó trên schema.org? Google Search Console hiện lỗi giá trị enum không hợp lệ trong trường "returnFees" nhưng quy trình kiểm tra của chúng tôi trên schema.org không cho thấy lỗi. Vui lòng tư vấn.

Cảm ơn câu hỏi của Corey. schema.org là một pháp nhân mở và độc lập với nhà cung cấp, trong đó xác định các kiểu dữ liệu và thuộc tính cho dữ liệu có cấu trúc. Tuy nhiên, với tư cách nhà cung cấp, Google có thể có các yêu cầu cụ thể đối với một số thuộc tính và kiểu cho việc sử dụng dữ liệu có cấu trúc trong các tính năng của sản phẩm, chẳng hạn như kết quả nhiều định dạng trên Google Tìm kiếm. Vì vậy, có thể schema.org chấp nhận việc bạn bỏ một vài thuộc tính hoặc dùng một số kiểu giá trị nào đó cho một thuộc tính cụ thể. Tuy nhiên, những nhà cung cấp như Google và các nhà cung cấp khác có thể có yêu cầu cụ thể hơn để cho việc sử dụng dữ liệu có cấu trúc mà bạn cung cấp, nhằm nâng cao tính năng và sản phẩm.

Việc tích hợp các tiêu đề bảo mật, chẳng hạn như cho HSTS, có ảnh hưởng đến thứ hạng không?

John: Arnd hỏi: Việc tích hợp các tiêu đề bảo mật, chẳng hạn như cho HSTS, có ảnh hưởng đến thứ hạng không?

Không, tiêu đề HSTS không ảnh hưởng đến Tìm kiếm. Tiêu đề này dùng để cho người dùng biết phải truy cập trực tiếp vào phiên bản HTTPS và thường dùng kèm các lệnh chuyển hướng đến phiên bản HTTPS. Google sử dụng một quy trình gọi là chuẩn hoá để chọn phiên bản thích hợp nhất của một trang để thu thập dữ liệu và lập chỉ mục. Quy trình này không dựa vào tiêu đề như những tiêu đề dùng cho HSTS. Tất nhiên, việc sử dụng những tiêu đề này thật sự giúp ích người dùng.

Google có so sánh phiên bản sơ đồ trang web XML hiện tại với phiên bản trước đó không?

Gary: Bill hỏi: Google có so sánh phiên bản sơ đồ trang web XML hiện tại với phiên bản trước đó hay không, để xem có nội dung gì mới hoặc nội dung nào đã bị xoá khỏi trang web?

Chắc chắn là có, chúng tôi sẽ không xử lý lại sơ đồ trang web không có gì thay đổi kể từ lần thu thập dữ liệu gần nhất, nhưng đó chỉ là việc tối ưu hoá phần mềm để không lãng phí tài nguyên. Ngay sau khi bạn thay đổi gì đó trong sơ đồ trang web, dù là phần tử URL hay lastmod, sơ đồ trang web sẽ được phân tích cú pháp lại và thường được xử lý lại. Điều đó không có nghĩa là chúng tôi sẽ chắc chắn thu thập dữ liệu các URL đó, chúng sẽ được đánh giá chất lượng như mọi URL khác. Cũng cần lưu ý rằng nếu bạn xoá một URL khỏi sơ đồ trang web (có thể vì URL đó không còn tồn tại nữa), điều đó không có nghĩa là URL đó sẽ tự động bị loại khỏi chỉ mục hay thậm chí là được ưu tiên thu thập dữ liệu để sớm bị loại khỏi chỉ mục.

Có gì khác biệt giữa sơ đồ trang web XML và HTML? Tôi nhận được một thông báo lỗi trong Search Console.

John: Maro Samy hỏi: Có gì khác biệt giữa sơ đồ trang web XML và HTML? Trong trường hợp này thì giải pháp là gì – Search Console thông báo rằng "Sơ đồ trang web của bạn dường như là một trang HTML. Hãy sử dụng định dạng sơ đồ trang web được hỗ trợ để thay thế"?

Đây là một hậu quả đáng tiếc khi sử dụng khá nhiều tên giống nhau cho cả tệp XML lẫn trang HTML. Sơ đồ trang web HTML có thể giúp ích cho người dùng, nó giống một sơ đồ cấp cao hơn. Sơ đồ trang web XML thì chỉ dành cho trình thu thập dữ liệu. Tệp này dành cho robot. Tôi xin bổ sung rằng sơ đồ trang web HTML thường là một dấu hiệu cho thấy việc điều hướng trên trang web của bạn quá khó hiểu, vậy nên hãy cố gắng khắc phục điều đó thay vì tạo trang sơ đồ trang web.

Google làm thế nào để xử lý dữ liệu có cấu trúc có lỗi phân tích cú pháp?

Gary: Animesh hỏi: Google làm thế nào để xử lý dữ liệu có cấu trúc có lỗi phân tích cú pháp?

Google không xử lý. Nếu một số dữ liệu có cấu trúc không phân tích được cú pháp, chúng tôi sẽ không thể trích xuất thông tin có trong dữ liệu đó. Vì vậy, đơn giản là Google bỏ qua thông tin đó.

Việc dùng chữ số trong URL có gây hại cho hoạt động SEO không? Đó không phải ý hay phải không?

John: Việc dùng chữ số trong URL có gây hại cho hoạt động SEO không? Đó không phải ý hay phải không?

Không. Việc dùng số trong URL không gây hại. Bạn có thể dùng chữ số, chữ cái, chữ cái không phải ký tự La-tinh hoặc thậm chí biểu tượng Unicode nếu muốn. Điều duy nhất cần tránh trong URL là các giá trị nhận dạng tạm thời có thể thay đổi mỗi khi bạn truy cập một trang, vì điều này khiến cho việc thu thập dữ liệu trở nên rất khó khăn và khó hiểu.

Tại sao URL của trang web của tôi bị chặn?

Gary: Claudio hỏi: Tại sao URL của trang web của tôi bị chặn?

Không phải đâu, nó vẫn ổn mà, chỉ là chưa có thứ hạng thôi. Bạn nên tham khảo Cẩm nang SEO của chúng tôi để nắm được những gì bạn cần làm để cải thiện, tiếp đó tham khảo các mẹo qua những trang web và người có tiếng về SEO như MozAleyda Solis.

Tình trạng "Quá nhiều trong chỉ mục" ("Index Bloat") có thực không và nó có ảnh hưởng đến việc thu thập dữ liệu và lập chỉ mục của Google không?

John: Tình trạng "Quá nhiều trong chỉ mục" ("Index Bloat") có thực không và nó có ảnh hưởng đến việc thu thập dữ liệu và lập chỉ mục của Google không?

Tôi không biết đến khái niệm như vậy tại Google. Hệ thống của chúng tôi thực sự không giới hạn số trang được lập chỉ mục trên mỗi trang web. Bạn chỉ cần đảm bảo rằng các trang mà bạn cung cấp cho chỉ mục thực sự là các trang hữu ích, nhưng việc này không phụ thuộc vào số trang có trên trang web của bạn.

Làm thế nào để chặn hoàn toàn Googlebot tiếp cận trang web của tôi, chắc chắn và vĩnh viễn?

Gary: Có người hỏi: Làm thế nào để chặn hoàn toàn Googlebot tiếp cận trang web của tôi, chắc chắn và vĩnh viễn? Không phải trong vài tháng hay đại loại như vậy mà là mãi mãi.

Cách đơn giản nhất là robots.txt: nếu bạn thêm disallow: / cho tác nhân người dùng Googlebot, Googlebot sẽ không động đến trang web của bạn miễn là bạn duy trì quy tắc đó. Nếu muốn chặn cả quyền truy cập mạng, bạn sẽ phải tạo những quy tắc tường lửa tải dải IP của chúng tôi trong một quy tắc từ chối. Bạn có thể xem danh sách địa chỉ IP của chúng tôi trong tài liệu về việc xác minh Googlebot.

Công ty SEO có thể nhận được huy hiệu được Google chấp thuận không?

John: Michael hỏi: Công ty SEO có thể nhận được huy hiệu được Google chấp thuận không?

Tôi không biết có loại chứng nhận SEO nào của Google. Có một số chứng nhận cho một số sản phẩm nhất định, chẳng hạn như Google Ads, nhưng tôi không biết có chứng nhận nào về SEO. Đối với các chứng nhận chính thức, tôi sẽ kiểm tra kỹ ngay tại nguồn thay vì nghe lời ai đó.

Việc có nhiều trình đơn điều hướng có thể làm giảm hiệu suất SEO không?

Gary: Một người ẩn danh hỏi: Việc có nhiều trình đơn điều hướng có thể làm giảm hiệu suất SEO hay không? Một trình đơn chính có tất cả danh mục quan trọng nhất của trang web và các trình đơn "phụ" để phát triển các danh mục liên quan đến phần mở rộng thương hiệu.

Rất khó xảy ra việc tình trạng nhiều trình đơn điều hướng có tác động đến hiệu suất SEO của trang web của bạn.

Tôi đã cố gắng để các trang HTML và ASPX được lập chỉ mục nhưng chỉ một vài trang HTML được lập chỉ mục. Giúp tôi với!

John: Tôi đã cố gắng để các trang HTML và ASPX được lập chỉ mục nhưng chỉ một vài trang HTML được lập chỉ mục. Giúp tôi với!

Về phía chúng tôi, các đuôi tệp này không có gì đặc biệt. URL có các đuôi này có thể là trang HTML bình thường và chúng tôi có thể lập chỉ mục chúng. Việc ẩn đuôi không tác động gì đến các hệ thống của Google. Đối với các câu hỏi chung về việc thu thập dữ liệu và lập chỉ mục, bạn nên tham khảo cộng đồng trợ giúp của chúng tôi — các bạn ở đó cực kỳ tận tình.

Tôi thấy hai kết quả thuộc cùng một miền nhưng là các trang khác nhau, kết quả thứ hai có thụt lề một chút. Vì sao vậy?

Gary: Shin hỏi: Tôi thấy hai kết quả thuộc cùng một miền nhưng là các trang khác nhau, kết quả thứ hai có thụt lề một chút. Vậy là sao?

Chúng được gọi là nhóm lưu trữ! Bạn thực sự không thể tác động đến chúng bằng mã đánh dấu, nhưng điều đó cho biết bạn có nhiều hơn 1 trang có thể được xếp hạng cao cho một cụm từ tìm kiếm nhất định. Bạn có thể hợp nhất hai trang đó nếu có thể. Bạn có thể tìm hiểu thêm về nhóm lưu trữ trong thư viện phần tử trực quan của chúng tôi.

Googlebot có thể bị giả mạo không? Nó nhắc đến URL chính thức nhưng lại nằm trên một địa chỉ IP khác?

John: Arnd hỏi: Googlebot có thể bị giả mạo không? Nó nhắc đến URL chính thức nhưng lại nằm trên một địa chỉ IP khác?

Rất tiếc, ai cũng có thể chỉ định tên tác nhân người dùng bất kỳ. Trường hợp này là các tập lệnh sử dụng tên tác nhân người dùng Googlebot nhằm cố thể hiện sự chính thống. Trong tài liệu của chúng tôi, chúng tôi công bố các dải IP mà Googlebot sử dụng cũng như cách để xác nhận các yêu cầu chính thống. Trong trường hợp cụ thể của bạn, địa chỉ IP đó ánh xạ trở lại đến Hetzner Online, một dịch vụ lưu trữ ở Đức. Nếu thấy nhiều yêu cầu như vậy, thì bạn nên liên hệ với bộ phận chuyên trách của họ về hành vi vi phạm.

Có cách nào để từ chối địa chỉ IP thay cho tên miền không?

Gary: Muhammad hỏi: Có cách nào để từ chối địa chỉ IP thay cho tên miền không?

Không, không có cách nào như vậy.

NOODP thường xuất hiện trong Blogger nhằm mục đích gì?

John: NOODP thường xuất hiện trong Blogger nhằm mục đích gì?

Đó là chuyện xưa rồi! Google lâu nay không sử dụng thẻ meta robots. Đó là từ thời dự án thư mục mở DMOZ, trong đó các trang web được liệt kê kèm nội dung mô tả ngắn. Thẻ meta nhắc công cụ tìm kiếm bỏ qua nội dung mô tả đó. Dự án Thư mục mở (Open Directory Project – ODP) nay không còn nữa và thẻ meta này không còn hiệu lực. Việc này cũng không gây ra vấn đề gì nên bạn cũng có thể để nguyên.

Có phải "nội dung chính" có nghĩa là video phải chắc chắn là yếu tố đầu tiên trên trang không?

Gary: Frederick hỏi: Kể từ ngày 13 tháng 4, video phải là nội dung chính của trang nếu hình thu nhỏ xuất hiện trong SERP. Có phải "nội dung chính" có nghĩa là video phải chắc chắn là yếu tố đầu tiên trên trang không?

Không. Hãy nghĩ dưới góc nhìn của người dùng: họ vào trang của bạn và sau đó họ phải chủ động tìm kiếm chứ video không xuất hiện ngay trước mắt họ. Việc này sẽ khiến người dùng bối rối, và đó là lý do chúng tôi tìm những video là nội dung chính: về cơ bản là xuất hiện "ngay trước mắt". Chỉ cần nhìn vào các trang web video lớn như Vimeo hoặc YouTube là bạn có thể hình dùng được những gì mà thuật toán của chúng tôi đang tìm kiếm.