Semantic là gì?
Semantic dịch ra nghĩa là ngữ nghĩa học, nó mang nghĩa nghiên cứu về sự thật, ý nghĩa hoặc tham chiếu hoặc sự thật. Thuật ngữ này còn dùng để chỉ các lĩnh vực con của một số ngành khác nhau, bao gồm triết học, ngôn ngữ học và khoa học máy tính.
Semantic Search nghĩa là gì?
Semantic search – tìm kiếm ngữ nghĩa là thuật ngữ chỉ việc tìm kiếm có nghĩa, phân biệt với tìm kiếm từ vựng (khi công cụ tìm kiếm tìm các kết quả phù hợp theo nghĩa đen của từ được tìm kiếm hoặc các biến thể từ khóa mà không hiểu ý nghĩa tổng thể của truy vấn).
So với tìm kiếm từ vựng, tìm kiếm theo Semantic search cải thiện độ chính xác của tìm kiếm hơn gấp nhiều lần bằng cách hiểu ý định của người tìm kiếm, ý nghĩa ngữ cảnh để cung cấp các kết quả có liên quan được cá nhân hóa theo người dùng.
Semantic search cũng cho phép Google phân biệt các thực thể khác nhau (người, địa điểm và sự vật) và diễn giải truy vấn dựa trên các yếu tố như:
- Lịch sử tìm kiếm của người dùng
- Vị trí của người dùng
- Lịch sử tìm kiếm toàn cầu
- Các biến thể chính tả.
Semantic Search hoạt động như thế nào?
Việc theo đuổi tìm kiếm ngữ nghĩa của các công cụ tìm kiếm vốn là điều dễ hiểu. Tìm kiếm ngữ nghĩa giúp xử lý ngôn ngữ tự nhiên tốt hơn, ít spam hơn, hiểu rõ mục đích tìm kiếm hơn, dẫn đến trải nghiệm người dùng tốt hơn. Bên cạnh đó, dữ liệu Google tăng gấp đôi mỗi hai năm, do đó nó đòi hỏi các công cụ tìm kiếm cần được tổ chức tốt hơn, kết nối dữ liệu và cấu trúc và kết nối dữ liệu ngày càng tăng này.
Semantic search bắt đầu với bản cập nhật của Hummingbird được Google tung ra vào năm 2013. Đây là thuật toán sử dụng ngữ cảnh và mục đích tìm kiếm (không phải các từ khóa riêng lẻ trong truy vấn như trước đây) nhằm đảm bảo các trang hoạt động tốt hơn và đưa ra kết quả khớp chính xác từ khóa. Đó là một trong những thay đổi đầu tiên của Google nhằm phân phối kết quả và đảm bảo trải nghiệm tìm kiếm thỏa đáng.
Tháng 10.2015, Google tiếp tục ra mắt RankBrain như một phần của Hummingbird. Dù mục đích hai bản cập nhật tương tự nhau nhưng hoạt động khác nhau. RankBrain là một hệ thống học máy bao gồm 2 thành phần:
- Phân tích truy vấn: cố gắng diễn giải các truy vấn bằng cách kết hợp chúng với các truy vấn phổ biến hơn. Quá trình này được kích hoạt khi thuật toán gặp các truy vấn dài, không rõ ràng hoặc quen thuộc.
- Xếp hạng: để tìm các trang phù hợp tốt cho truy vấn, thành phần này phân tích các trang đã được lập chỉ mục cho các tính năng cụ thể. Ví dụ, các mẫu sử dụng cụm từ có liên quan nhất định, phân tích các kết quả tìm kiếm hoạt động tốt nhất (dựa vào BR, time on site, CTR…) và tìm kiếm sự tương đồng giữa các trang này. Do đó, các trang này dù không có cụm từ chính xác từ truy vấn nhưng cũng được xem là có liên quan.