Tổng quan về dữ liệu có cấu trúc

Tổng quan về dữ liệu có cấu trúc

Đôi khi bạn thực hiện tìm kiếm trên Google, thay vì trả về kết quả là các liên kết, Google sẽ đưa về nhiều thông tin hữu ích hơn như: đánh giá bài viết, thông tin thêm về bộ phim, logo và lịch sử các công ty, địa điểm,… Những thông tin này gọi là kết quả chi tiết (rich resutls), có được là nhờ thông tin thu thập từ dữ liệu có cấu trúc (structured data). Bài viết này mình sẽ giới thiệu về dữ liệu có cấu trúc, cách kiểm tra và sử dụng.

Dữ liệu có cấu trúc không giúp tăng hạng trong kết quả tìm kiếm trả về, nhưng rõ ràng là kết quả tìm kiếm với kết quả chi tiết (rich results) sẽ giúp tăng tỷ lệ click cho bạn. Bên dưới là một ví dụ về kết quả chi tiết (rich resutls) trong một bài viết trên Vietrick. Các thông tin chi tiết gồm: đánh giá bài viết (rating), các câu hỏi thường gặp (FAQ).

Ví dụ về rich results trong một bài viết của Vietrick
Ví dụ về rich results trong một bài viết của Vietrick

Dữ liệu có cấu trúc (structured data) là gì?

Dữ liệu có cấu trúc (structured data) là dữ liệu được tổ chức và phân loại trong các trường theo một cấu trúc được quy định sẵn. Google sử dụng các dữ liệu có cấu trúc thu thập được từ trang web của bạn để phục vụ các đặc trưng như kết quả chi tiết (rich results).

Hướng dẫn thiết lập

Định dạng (Format)

Có nhiều loại định dạng dữ liệu, tuy nhiên để tương thích với đặc trưng kết quả chi tiết (rich resutls) từ Google, nội dung website của bạn cần được định dạng theo 3 loại sau:

  • JSON-LD
  • Microdata
  • RDFa

Sau khi đã chọn lựa chọn được định dạng phù hợp với cấu hình trang website bạn, chúng ta cần sử dụng định dạng này theo thư viện markup. Có 2 loại cấu trúc thư viện phổ biến hiện nay là schema.org và data-vocabulary.org markup. Hầu hết các công cụ tìm kiếm đều hỗ trợ tốt 2 loại markup này. Theo thông tin từ developers.google.com, Google cũng đang sử dụng schema.org cho rich results của họ. Vậy nên các bạn hãy cấu hình dữ liệu theo cấu trúc của Schema.org nhé.

Nếu trang blog của bạn có sử dụng data-vocabulary markup, hãy xem hướng dẫn sữa lỗi Breadcrumb: data-vocabulary.org schema deprecated.

Bên dưới là một ví dụ về sử dụng định dạng JSON-LD của Vietrick theo cấu trúc AggregateRating được chèn trong thẻ <head>:

<script type="application/ld+json">{
    "@context": "https://schema.org/",
    "@type": "CreativeWorkSeries",
    "name": "Các yếu tố ảnh hưởng đến SEO offpage [2020]",
    "aggregateRating": {
        "@type": "AggregateRating",
        "ratingValue": "4.9",
        "bestRating": "5",
        "ratingCount": "41"
    }
}</script>

Sau khi thiết lập xong, các bạn có thể sử dụng công cụ kiểm tra dữ liệu có cấu trúc của Google để kiểm tra trang web của mình có phù hợp với tiêu chuẩn của Google hay không.

Access

Đảm bảo không chặn Google bot truy cập trang chứa dữ liệu của bạn bằng tệp robots.txt, noindex hoặc các phương thức khác. Các bạn có thể sử dụng Google Search Console để kiểm tra.

Sau khi thực hiện cấu hình hoàn tất với dữ liệu, các bạn có thể kiểm tra xem trang web của mình có hỗ trợ kết quả chi tiết không nhờ vào công cụ kiểm tra kết quả chi tiết (rich results).

Nội dung

Những phần đánh giá nội dung sau đây không dễ dàng đo lường bằng cách sử dụng các công cụ kiểm tra. Tuy nhiên bạn nên tuân thủ theo các yêu cầu về nội dung bên dưới để tránh bị Google đánh dấu là spam.

Chất lượng nội dung

Nội dung bài viết trên trang web của bạn cần đảm bảo tuân thủ các điều kiện sau:

  • Tuân thủ theo hướng dẫn về nội dung của Google.
  • Cập nhật nội dung mới nhất, những bài viết có nội dung lỗi thời sẽ không Google sử dụng.
  • Cung cấp nội dung gốc, tránh sao chép bài viết.
  • Đảm bảo dữ liệu có cấu trúc hiển thị đến người đọc. Ví dụ bạn dùng JSON-LD cho việc đánh giá một bộ phim, hãy đảm bảo các thông tin như điểm đánh giá hiển thị với người đọc trong nội dung HTML.
  • Không đưa các dữ liệu không liên quan đến nội dung. Ví dụ đưa dữ liệu cấu trúc đánh giá về một cuốn sách trong bài viết đánh giá một bộ phim khác.
  • Không chứa các nội dung thúc đẩy, liên quan đến bạo lực, ấu dâm, kích động bạo lực và thù hận.
  • Không dùng dữ liệu có cấu trúc cho các nội dung bất hợp pháp.

Tính liên quan

Các dữ liệu cung cấp nên có liên quan chặt chẽ đến nội dung trang web/ bài viết của bạn. Ví dụ:

  • Nếu bạn có chương trình livestream, nên sử dụng nhãn broadcasts cho nội dung này.
  • Một bài viết hướng dẫn nấu nướng nên dùng nhãn recipes.

Cung cấp đầy đủ thông tin

Các dữ liệu mà bạn cung cấp phải đảm bảo đầy đủ các thông tin thiết yếu. Các bạn nên cung cấp càng chi tiết và đầy đủ các trường dữ liệu càng tốt.

  • Việc bạn cung cấp đầy đủ và chi tiết càng giúp công cụ tìm kiếm hiểu rõ hơn về nội dung bài viết của bạn.
  • Nội dung bạn cung cấp đầy đủ và chi tiết giúp nâng cao chất lượng kết quả tìm kiếm trả về cho người đọc.

Vị trí

Dữ liệu có cấu trúc cần được đặt ở trong trang chứa nội dung mà nó hiển thị trừ trường hợp đặc biệt cần được lưu trữ ở tài liệu khác.

Nếu trang web của bạn bị trùng lặp nội dung, bạn cũng nên đặt cùng 1 nội dung dữ liệu có cấu trúc y như vậy, chứ không nên chứ dùng ở mỗi trang chính(caninocal page).

Sử dụng cấu trúc chính xác

Hãy cố gắng sử dụng đúng loại nhãn dữ liệu với loại dữ liệu mà bạn cung cấp dựa trên danh sách các nhãn ở trên schema.org.

Hãy tuân thủ theo hướng dẫn về các loại nhãn được Google hỗ trợ.

Hình ảnh

Khi bạn cung cấp hình ảnh cho dữ liệu có cấu trúc, hãy đảm bảo cung cung cấp hình ảnh chính xác cho đối tượng.

Tất cả các hình ảnh mà bạn dùng đều phải được phép thu thập bởi bot của Google. Nếu bạn không chắc, hãy dùng Google Search Console để kiểm tra lại nhé.

Sử dụng nhiều loại cấu trúc khác nhau

Các bạn hoàn toàn có thể sử dụng nhiều loại cấu trúc khác nhau trên trang web, miễn là bạn đảm bảo nội dung đó hiện hữu đối với người dùng.

4.7/5 - (28 bình chọn)