Cách xếp hạng trong Google Dataset Search

Thảo luận trong 'Tin tức SEO' bắt đầu bởi kong_bs, 12/10/18.

  1. kong_bs

    kong_bs New Member

    View attachment 28
    Blog AI của Google đã xuất bản một bài viết thảo luận về cách hoạt động của Tìm kiếm dữ liệu và những dấu hiệu nào nó sử dụng để xếp hạng các tập dữ liệu. Google đã hiển thị kết quả chi tiết tập dữ liệu và có thể bắt đầu hiển thị nhiều hơn khi nhà xuất bản thêm đánh dấu Schema.org. Hiểu được bộ dữ liệu nào là gì và cách xếp hạng chúng là quan trọng vì nó có thể trở thành nguồn lưu lượng truy cập mới.

    View attachment 27
    Google đã thêm thông tin Tập dữ liệu vào kết quả phong phú.
    Trang nhà phát triển tập dữ liệu của Google đã được cập nhật vào tháng 5 năm 2018 để lưu ý rằng dữ liệu giàu dữ liệu sắp đến kết quả tìm kiếm của Google :

    Tính năng này đang được thử nghiệm và bạn có thể không thấy kết quả phong phú cho các tập dữ liệu. Tuy nhiên, chúng tôi khuyên bạn nên thêm dữ liệu có cấu trúc tập dữ liệu vào trang web của mình để chuẩn bị cho các tính năng tập dữ liệu mới trong Kết quả tìm kiếm.

    Mỗi nhà xuất bản nên cân nhắc thêm đánh dấu tập dữ liệu để chuẩn bị cho việc giới thiệu rộng rãi hơn tính năng này trong kết quả tìm kiếm của Google.

    Tìm kiếm tập dữ liệu
    Tìm kiếm tập dữ liệu dựa trên Siêu dữ liệu có cấu trúc sử dụng tiêu chuẩn Schema.org/Dataset .

    Google lấy dữ liệu có cấu trúc và liên kết nó với những gì nó biết thông qua Sơ đồ tri thức, cũng như xem xét các tín hiệu xếp hạng khác như liên kết, sau đó tạo chỉ mục tìm kiếm tập dữ liệu.

    Tập dữ liệu trùng lặp
    Google cho biết rằng nó phụ thuộc một phần vào thuộc tính sameAS của Schema.org . Thuộc tính sameAs có nghĩa là chuẩn hóa nhà xuất bản ban đầu.

    Đây là cách các đặc tả chính thức của Schema.org cho thuộc tính sameAs được định nghĩa:

    “URL của trang web tham chiếu chỉ rõ ràng danh tính của mục. Ví dụ: URL của trang Wikipedia của mục, mục nhập Wikidata hoặc trang web chính thức. ”

    Trong bối cảnh dữ liệu có cấu trúc tập dữ liệu, thuộc tính sameAs có thể được sử dụng để chuẩn hóa thông tin đến một URL cụ thể đại diện cho nhà xuất bản ban đầu của dữ liệu.

    Các dấu hiệu bổ sung mà Google sử dụng để xác định các tập dữ liệu trùng lặp:

    “Các tín hiệu khác bao gồm hai mô tả bộ dữ liệu trỏ đến cùng một trang chuẩn, có cùng một Mã định danh đối tượng kỹ thuật số (DOI) , chia sẻ liên kết để tải xuống tập dữ liệu hoặc có chồng chéo lớn trong các trường siêu dữ liệu khác.

    Không có tín hiệu nào trong số này hoàn toàn tách biệt, do đó chúng tôi kết hợp chúng để có được dấu hiệu mạnh nhất có thể khi hai bộ dữ liệu giống nhau. ”

    Google Scholar Graph Scholar and Ranking
    Đồ thị tri thức của Google đóng một vai trò trong việc xếp hạng thông tin tập dữ liệu. Sơ đồ tri thức giúp Google hiểu bối cảnh của các tập dữ liệu, bao gồm việc hiểu ngôn ngữ của nó và hiểu các từ viết tắt.

    Sơ đồ tri thức của Google cung cấp lớp dữ liệu để đối sánh các thực thể khác nhau. Vì vậy, nếu tập dữ liệu kết hợp một thương hiệu, một loại tiền tệ hoặc ngôn ngữ, nó có thể khớp với tập dữ liệu đó.

    Đây là những gì mà AI Blog Post của Google nói về nó:

    “Sơ đồ tri thức của Google là một nền tảng mạnh mẽ mô tả và liên kết thông tin về nhiều thực thể, bao gồm cả các thông tin xuất hiện trong siêu dữ liệu tập dữ liệu… Loại hòa giải này mở ra nhiều khả năng để cải thiện trải nghiệm tìm kiếm cho người dùng.

    Ví dụ: Tìm kiếm tập dữ liệu có thể bản địa hóa kết quả bằng cách hiển thị giá trị của siêu dữ liệu được điều chỉnh trong cùng một ngôn ngữ như phần còn lại của trang. Ngoài ra, nó có thể dựa vào các từ đồng nghĩa, sửa lỗi chính tả, mở rộng từ viết tắt hoặc sử dụng các mối quan hệ khác trong Sơ đồ tri thức để mở rộng truy vấn. "

    Google Scholar có thể là tín hiệu xếp hạng
    Theo Google, Google Scholar có thể cung cấp tín hiệu cho biết tập dữ liệu có thẩm quyền và tác giả của tập dữ liệu là ai.

    Điều này có thể giúp nhà xuất bản bộ dữ liệu xếp hạng tốt hơn. Nhưng nó cũng có thể hỗ trợ trong việc chống cào từ việc sử dụng dữ liệu của người khác.

    Bài đăng trên blog chính thức của Google mô tả nó như sau:

    “Biết bộ dữ liệu nào được tham chiếu và trích dẫn trong các ấn phẩm phục vụ ít nhất hai mục đích:

    1. Nó cung cấp một tín hiệu có giá trị về tầm quan trọng và sự nổi bật của tập dữ liệu.
    2. Nó cung cấp cho các tác giả tập dữ liệu một nơi dễ dàng để xem trích dẫn dữ liệu của họ và để có được tín dụng. ”

    Cách Google Ranks Datasets
    Google không có nhiều dữ liệu để sử dụng cho việc tìm hiểu cách người dùng tìm kiếm dữ liệu. Kết quả là Google đang sử dụng các thuật toán xếp hạng thông thường để xếp hạng các tập dữ liệu cho người dùng tìm kiếm tập dữ liệu của nó.

    Tuy nhiên, khi Google có đủ dữ liệu về cách mọi người tìm kiếm nó sẽ bắt đầu phát triển một thuật toán riêng biệt được điều chỉnh cụ thể theo tìm kiếm tập dữ liệu.

    Điều đó nói rằng, Google đang sử dụng các tín hiệu bổ sung cho các bộ dữ liệu xếp hạng tốt hơn:

    “… Bộ dữ liệu xếp hạng khác với xếp hạng các trang web và chúng tôi thêm một số tín hiệu bổ sung có tính đến chất lượng siêu dữ liệu, trích dẫn, v.v.”

    Tối ưu hóa tập dữ liệu của bạn
    Rất có thể trang web của bạn đã có bộ dữ liệu. Bây giờ là lúc để đánh dấu chúng với dữ liệu có cấu trúc Schema.org thích hợp.

    Giá trị của Google Datasets có thể là ở những người sử dụng Tìm kiếm dữ liệu để tìm dữ liệu của bạn và liên kết đến trang web của bạn. Nhưng một giá trị khác xuất hiện trong kết quả phong phú của Google cho các loại dữ liệu cụ thể. Tốt hơn bạn so với đối thủ cạnh tranh của bạn, phải không?

    Đọc Bài đăng trên blog AI của Google tại đây
    https://ai.googleblog.com/2018/09/building-google-dataset-search-and.html
     
  2. sangdienlanh

    sangdienlanh Member

    cám ơn những chia sẻ hữu ích của bạn nha
     
  3. Nguyễn Tài

    Nguyễn Tài New Member

    cám ơn thớt đã chia sẽ
     
  4. Ngân quý

    Ngân quý New Member

    thanks bác nhiều
     

trang này