Tháng này, tôi sẽ tập trung vào Liên kết dữ liệu mở (LOD - Linked Open Data) (http://en.wikipedia.org/wiki/Linked_Open_Data) cho phép bạn xuất bản dữ liệu có cấu trúc liên kết với nhau để thiết lập mối quan hệ. Điều này là quan trọng khi các mối quan hệ giữa các từ cho phép hiểu rõ về nội dung trang web của các bot tìm kiếm.

Trong tìm kiếm thực thể, tôi đã giải thích tìm kiếm ngữ nghĩa sử dụng một bản thể luận (ontology) hoặc ngôn ngữ như dữ liệu vĩ mô, RDFa … chia cắt câu thành chủ ngữ, vị ngữ và đối tượng hiển thị các mối quan hệ giữa các từ trong nội dung của bạn.

LOD được xây dựng dựa trên công nghệ web chuẩn như HTTP, RDF, URL…mở rộng chúng nên chúng có thể đọc tự động bằng máy tính. Đó là lý do tại sao nó quan trọng đối với SEO và sử dụng LOD khi đưa dữ liệu có cấu trúc vào nội dung để tạo điều kiện dễ dàng hơn cho các máy đọc nội dung đó.

Câu quan trọng hơn từ khóa

LOD được sử dụng để tận dụng “câu” trong lĩnh vực kỹ thuật số như chúng được dùng trong cuộc sống hàng ngày. Tối ưu hóa cho tìm kiếm ngữ nghĩa sử dụng LOD là việc sử dụng một màn biểu diễn kỹ thuật số có cấu trúc ngôn ngữ tự nhiên làm cơ sở để mô tả những nội dung. SEO cần phải xem xét đối với việc sử dụng các câu chứ không phải là từ khóa để nâng cao nội dung trên web hoặc trên các trang mạng nội bộ.

Dường như “tương lai SEO” sẽ đòi hỏi một nền tảng kỹ thuật hơn. Đây không phải là một chiến thuật tối ưu mới cho SEO để cắt và dán vào các trang web của khách hàng nhưng đó là kết cấu của các trang web và sẽ đòi hỏi thời gian, năng lượng, nghiên cứu và sự kiên trì để làm việc thông qua nó.

Để giải thích về dữ liệu liên kết bao gồm các thuật ngữ đơn giản, Tim Berners-Lee đã xác định các nguyên tắc LOD dưới đây:

Nguyên tắc LOD

Trong vấn đề thiết kế (http://www.w3.org/DesignIssues/LinkedData.html): Berners-Lee đã cung cấp 4 nguyên tắc LOD dưới đây:

- Sử dụng URI (Uniform Resource Identifiers) để chỉ ra những điều đó
- Sử dụng HTTP URIs được giới thiệu đến và tìm thấy bởi nhiều người hoặc phần mềm
- Khi nhìn vào một URIs, có tác dụng thúc đẩy thông tin hữu ích như RDF (Resource Description Framework) hoặc SPARQL (ngôn ngữ truy vấn RDF)
- Bao gồm liên kết tới những thứ có liên quan (URIs) khi công bố dữ liệu trên Web nên họ có thể khám phá ra những thứ khác.

Để giúp giải thích thêm về LOD là gì và cách bạn có thể sử dụng nó, tôi muốn chia sẻ bài phỏng vấn của Kingsley Idehen (https://twitter.com/kidehen), Giám đốc Điều hành và đồng thời là người sáng lập ra phần mềm OpenLink. Kingsley là một nhà sáng tạo trong công nghệ nổi tiếng và là nhà cung cấp của công nghệ khai thác LOD trên toàn doanh nghiệp và WWW (World Wide Web).

Dưới đây là nội dung đoạn video:

LOD là gì?
- Paul: Kingsley, bạn có thể cho chúng tôi biết ý tưởng LOD là gì không?
- Kingsley: LOD là biểu diễn dữ liệu có cấu trúc tăng cường thông qua việc sử dụng HTTP URIs (liên kết). Về cơ bản, đó là mối quan hệ thực thể dựa trên mô hình biểu diễn có cấu trúc mà các thực thể, các thuộc tính và giá trị thuộc tính được biểu hiện bằng các liên kết.

Tương lai của SEO: Liên kết dữ liệu mở

HTTP URIs được mặc định mở trong đó chúng biểu thị chức năng của giao thức HTTP trái ngược với giao thức đăng ký độc quyền nghiên cứu đến ứng dụng cụ thể. Bạn có thể đưa ra cho chúng tôi một ví dụ?

Các tuyên bố sau:
- Paris là thủ đô của nước Pháp.
Diễn tả mối quan hệ đại diện sử dụng ký hiệu ngôn ngữ tự nhiên qua đó tất cả người tham gia được biểu thị theo nghĩa đen sử dụng những từ “Paris” “capital” “France”

Và từng đóng một vai trò cụ thể, ví dụ “Paris” là chủ ngữ, “capital” là vị ngữ và “France” là đối tượng.

Báo cáo kết quả trên có thể được tăng cường bằng việc sử dụng các tài liệu tham khảo (như trái ngược với nghĩa đen) nhận dạng để chỉ các thực thể trong vai trò của chủ ngữ, vị ngữ và đối tượng.

<#Paris> <#capital> <#France>
Nếu sao chép các báo cáo trên một tài liệu và sau đó chuẩn bị tài liệu có sẵn cho người dùng trên mạng HTTP, tài liệu đó tự động thể hiện dữ liệu liên kết vì tôi sẽ có tập hợp các liên kết giới thiệu trong trình duyệt của tôi cho phép tôi khám phá những mối quan hệ thực thể đại diện bởi các tuyên bố liên kết tăng cường. Về mặt ngữ nghĩa, nó có nghĩa là:

<> <#type> <#Document>
<> <#mentions> <#Paris>
<> <#mentions> <#Capital>
<> <#mentions> <#France>
<#Paris> <#Capital> <#France>
Lưu ý: “<>” chỉ đơn giản là viết tắt của các HTTP URL của tài liệu được sử dụng như URI HTTP biểu thị chủ đề trong báo cáo trên.

Việc sử dụng các cụm từ HTTP URI và HTTP URL có thể là khó hiểu, vì vậy tốt nhất để xem làm thế nào chúng được đưa vào thực thể:

- HTTP URI biểu thị (tham khảo hoặc tên) bất cứ điều gì
- HTTP URL (một kiểu HTTP URI) biểu thị tài liệu Web
- WebIDs (một kiểu HTTP URI) biểu thị các cơ quan (người, tổ chức, phần mềm, máy móc và bất cứ thứ gì khác có khả năng hoạt động).

LOD cloud là gì?

Tôi đã nghe LOD là một tập dữ liệu lớn bao gồm tập dữ liệu từ nhiều lĩnh vực như : kiến thức phổ thông (Wikipedia), khoa học đời sống (Bio2RDF) , Phương tiện truyền thông ( BBC ), Chính phủ (Data.Gov và Data.Gov.UK) và một số lĩnh vực khác.

Bạn có thể giải thích LOD Cloud chi tiết hơn được không?

Tập dữ liệu lớn là một khu vực trên các trang web mà tất cả các dữ liệu có cấu trúc trong các tập dữ liệu được công bố, được biểu diễn và sau đó xuất bản inline với các nguyên tắc dữ liệu liên kết, ví dụ HTTP URI được sử dụng để biểu thị điều gì đó. Tóm lại, dữ liệu trở nên điều hướng và phát hiện bất cứ điều gì khác trên một mạng HTTP (ví dụ như World Wide Web).

<> <#type> <#Document> .
<> <#mentions> <#Paris> .
<> <#mentions> <#Capital> .
<> <#mentions> <#France> .
<#Paris> <#capital> <#France> .

<#Paris> <#sameAs> <http://dbpedia.org/resource/Paris> .
<#France> <#sameAs> <http://dbpedia.org/resource/France> .
Ví dụ, đặt các báo cáo trong một tài liệu xuất bản cho mạng HTTP mở rộng trên các trình diễn cơ bản của Linked Open Data. Như bạn thấy, liên kết của tôi không còn bị giới hạn trong tài liệu của tôi, tôi đã làm tham chiếu với dữ liệu trong DBpedia và LOD Cloud có thể gửi cho tôi bất cứ nơi nào.

Sự khác biệt giữa Linked Data và Linked Open Data?

Linked Data và Linked Open Data có tương tự nhau không?
Không hẳn là như thế. Các liên kết đến từ cấu trúc của một mô hình thực thể dựa vào tuyên bố (một loại câu). Sự cởi mở xuất phát từ việc sử dụng một chuẩn cho các thực thể biểu hiện dưới các hình thức HTTP URI. Lưu ý, nó có thể làm những bộ sưu tập lời tuyên bố mô hình quan hệ thực thể cung cấp đại diện cấu trúc dữ liệu sử dụng nhiều loại định danh, sự kỳ diệu của HTTP URI ở chỗ nó nằm trong openess cơ bản của URI và giao thức HTTP.

Bạn có thể có Linked Data mà không cần phải có “Open” thông qua việc sử dụng các định dạng độc quyền cho các thực thể. Tóm lại, đây là cách chúng tôi làm việc với tất cả các chương trình máy tính trong nhiều năm trước khi xuất hiện các URI và giao thức HTTP. Thậm chí RDF (đặt dưới sự ủy quyền của các URIs và thường được kết hợp với Linked Data) có thể được dùng để tạo ra Linked Data mà không phải là “Linked Open Data”.

Đồ thị dưới đây góp phần xua tan một vài bối rối quanh Linked Data và RDF,bằng cách nhắc nhở mọi người rằng Linked Data là cốt lõi của thiết kế ban đầu của Web. Gần đây, tôi điều chỉnh tài liệu đề xuất ban đầu của Berners-Lee bằng cách sử dụng HTTP URIs trái ngược với chuỗi biểu thị trong các nút (chủ ngữ hoặc đối tượng) và kết nối (vị ngữ) trong sơ đồ (hoặc đồ thị) mô tả mạng toàn cầu ban đầu của anh ấy.

Tương lai của SEO: Liên kết dữ liệu mở

LOD có lợi ích như thế nào đối với một nhà xuất bản (nhà cung cấp thương mại điện tử)?

Với công cụ tìm kiếm và sử dụng thương mại điện tử là một ví dụ, bạn có thể giải thích những lợi ích đó cho chúng tôi ?
Nó làm tăng Serendipitous Discovery Quotient (SDQ) của nội dung, nghĩa là nó làm tăng mức độ mà nội dung được tìm ra theo cách "dễ chịu bất ngờ" đến người dùng liên quan.

Serendipitous Discovery Quotient (SDQ) là gì?

SQD là một thước đo sự hiểu biết những ảnh hưởng của việc tăng cường dữ liệu cấu trúc thể hiện thông qua HTTP URIs. Golliher đã viết một bài rất hay có tiêu đề: Tương lai của SEO? Hoặc khái niệm trừu tượng?

IQ là một chỉ số liên quan đến trí thông minh. SDQ là một số liệu liên quan đến nội dung thông minh trên Web.

Lợi ích đối với thương mại điện tử là gì?

Các nhà cung cấp thương mại điện tử thực sự có thể tập trung vào những điều thực sự là dễ dàng đối với họ nghĩa là tạo ra các gói sản phẩm và dịch vụ của họ, mặc dù biết rằng mô tả rõ ràng luôn là yếu tố quan trọng dẫn đến sự phát triển của khách hàng. Nghĩa là mô tả các thực thể như chào hàng, sản phẩm, giá cả, tính sẵn có, giờ mở cửa và đóng cửa…trở thành tâm điểm của chiến lược nội dung web hơn rất nhiều so với tính thẩm mỹ trang web.

Schema.org là gì?

Schema.org, các thực thể và LOD liên hệ với nhau bằng cách nào?
Trong Schema.org, bạn có thể công bố dữ liệu có cấu trúc đơn giản hóa tích hợp với LOD Cloud. Từ LOD Cloud, bạn có schema.org tham chiếu chéo trong tập dữ liệu như DBpedia (http://dbpedia.org/About).

Ngày nay, nhiều nhà bán lẻ trực tuyến đã công bố dữ liệu có cấu trúc dựa trên các thuật ngữ từ Schema.org và với cách làm như vậy họ đang tăng cường cải tiến qua ba ranh giới quan trọng:

- Công cụ tìm kiếm
- Truyền thông xã hội
- LOD Cloud

Làm thế nào để Hashtags và Linked Data liên quan đến SEO?

Barbara Starr nói về mối quan hệ giữa Hashtags, Linked Data và SEO, bạn có thể nói rõ hơn một chút về vấn đề này?

Hashtags giải quyết một vấn đề mà từ lâu đã là thách thức của HTTP URI. Thông qua việc sử dụng hashtags, cộng đồng người dùng web đã sử dụng mô hình folksonomy định hướng cho mô hình viết tắt của HTTP URI.

Như vậy, thông qua các nhà cung cấp dịch vụ truyền thông xã hội, bạn có thể thực hiện các hành động của HTTP URI thông qua việc thực hành gắn với thẻ hash. Tất cả mọi người đang chú thích Web bằng cách thêm ngữ nghĩa vào các kết nối giữa các thực thể biểu hiện bằng các thẻ.

Ưu điểm của LOD

Dưới đây là một số lý do chính tại sao các học viên SEO phải lưu ý các thông tin trên dựa vào LOD:

- Tính mở: Điều này có nghĩa là tránh xa khỏi công cụ tìm kiếm và thay đổi định kỳ thuật toán xếp hạng, đây là tối ưu toàn bộ cho web.
- Tính hiệu quả chi phí: Tuổi thọ của SEO dựa trên mô tả thực thể, tài liệu theo định hướng công cụ tìm kiếm.
Để xây dựng LOD Cloud, tôi có thể hợp tác với Kingsley trong tương lai. Trong khi chờ đợi, bạn hãy tìm hiểu thêm về LOD để biết thêm thông tin.

- Bài viết của tác giả Paul Bruemmer (SearchEngineLand).