Vào ngày 25 tháng 10 năm 2019, Google đã thay đổi mọi thứ một lần nữa với thông báo rằng mô hình xử lý ngôn
ngữ tự nhiên được hỗ trợ học tập sâu, BERT, giờ đây sẽ cung cấp các truy vấn
tìm kiếm. Với thông báo này, chuyên môn học máy cho SEO
không còn là tùy chọn . Hãy tìm hiểu xem điều này có
nghĩa là gì.
BERT là gì?
BERT là một mô hình ngôn ngữ lớn giúp các thuật toán học máy hiểu
và dự đoán các chuỗi từ, cụm từ, câu và khái niệm. BERT là viết tắt của Bidirectional Encoder Representations from Transformers (Đại diện
Bộ mã hóa hai chiều từ Transformers) , được Google cung cấp nguồn mở
vào năm 2018 .
Điều làm cho BERT trở nên khác biệt là nó có một biểu
diễn toán học tốt hơn về bối cảnh - ví dụ, nó hiểu rằng các công việc vận tải
đường bộ của Cameron và các công việc trong vận tải đường sắt có chức năng
ngang nhau. Nó cũng hiểu cách giới từ và các bài viết khác của bài phát biểu
sửa đổi và báo hiệu ý định của người tìm kiếm.
Nếu chúng ta nghĩ lại về SEO trường học cũ, chúng ta sẽ có một
trang cho mỗi điều khoản đó. Điều đó không còn cần thiết hoặc mong muốn; trong
thực tế, điều ngược lại là đúng
Tại sao BERT có vấn đề?
BERT quan trọng vì nó hiểu ngữ cảnh của một truy vấn tìm kiếm ở cấp
độ câu , bao gồm thứ tự từ và từ đồng nghĩa. Bạn có
thể có một trang về, ví dụ, các cửa hàng cà phê ở Boston và từ espresso có thể
không bao giờ xuất hiện trên trang. Nếu ai đó hỏi Trợ lý Google của họ,
thì Hey Hey Google, loại cà phê espresso gần nhất với tôi hiện đang mở là gì?,
BERT sẽ hiểu rằng một quán cà phê có thể phục vụ cà phê espresso và trang web của
bạn có thể hiển thị trong kết quả tìm kiếm.
BERT cũng rất quan trọng đối với chất lượng nội
dung . Bằng cách hiểu ngữ cảnh, câu và thậm chí toàn bộ tài
liệu, BERT có khả năng bẩm sinh để xác định liệu một phần nội dung có ý nghĩa
hay không (dựa trên dữ liệu được đào tạo) và cách nội dung đó so với các tính
năng E-A-T chính của Google: chuyên môn, thẩm quyền, và tin tưởng. Google
dành những khoản tiền và thời gian khổng lồ để tạo ra dữ liệu đào tạo được dán
nhãn về những gì cấu thành chuyên môn cao, quyền hạn cao và nội dung tin cậy
cao. Với mô hình ngôn ngữ của BERT, giờ đây có thể dễ dàng xác định hơn nếu
một phần nội dung có độ tương tự mức câu với nội dung tốt đã biết.
Điều quan trọng cần làm rõ là thông báo công khai của Google chỉ
tuyên bố rằng họ đang sử dụng BERT để hiểu rõ hơn các truy vấn tìm kiếm. Điều
chúng tôi suy luận là Google cũng sử dụng BERT để phân tích ngôn ngữ của các
trang mà nó ánh xạ các truy vấn tìm kiếm này và tiếp tục tinh chỉnh mô hình của
nó không chỉ dựa trên các truy vấn tìm kiếm mà còn dựa trên nội dung của các
trang nó lập chỉ mục, cùng với dữ liệu truyền thông xã hội, tin tức, v.v.
Tại sao Google AI xoay vòng để sử dụng Open Sourcing BERT? Ngoài các kết quả
chung tốt hơn từ các truy vấn tìm kiếm, một lý do lớn là
BERT phù hợp hơn để xử lý các truy vấn tìm kiếm hội thoại phức tạp bằng giao diện
giọng nói. Google đang đặt cược vào tìm kiếm ở nhiều định dạng.
Nhà tiếp thị cần thích ứng thực tiễn SEO hiện tại như thế nào?
SEO như chúng ta đã từng làm nó nên được nghỉ
hưu . Cách bắt đầu cũ với danh sách từ khóa đơn giản và tối
ưu hóa các trang cho từ khóa thực sự đã chết kể từ khi BERT ra mắt. Chắc
chắn, nếu đó là tất cả những gì bạn có, bạn sẽ nhận được một số lợi ích nhỏ
(trái ngược với việc xuất bản một trang hoàn toàn vô nghĩa), nhưng nếu bất kỳ đối
thủ cạnh tranh nào có khả năng nhỏ nhất về khoa học dữ liệu và học máy, họ sẽ
đánh bại bạn lên và ăn bữa trưa của bạn . Đây là điểm chính:
Từ khóa đã chết - Chủ đề sống lâu!
Vậy làm thế nào để chúng tôi xây dựng nội dung cho một thế giới
SEO sau BERT? Chỉ một lát nữa thôi, chúng ta sẽ nhanh chóng thực hiện quy
trình 10 bước sử dụng học máy để tối ưu hóa cho BERT. Trước khi chúng ta bắt
đầu, đây là một số điều kiện tiên quyết quan trọng.
Ngừng sử dụng trang trại nội dung / nhà văn khối
lượng chất lượng thấp thuê ngoài . Nếu bạn là một
trong những công ty có nhà thầu thuê ngoài có thể đăng bài trên blog của Google
$ 5, hãy ngừng sử dụng chúng. Có một cơ hội rất tốt mà họ có ít hoặc không
có chuyên môn về các chủ đề mà bạn quan tâm nhất và họ sẽ tạo ra nội dung sẽ
không được các mô hình dựa trên BERT công nhận là có thẩm quyền hoặc chuyên
gia. Trang trại nội dung sẽ làm tổn thương SEO của
bạn nhiều hơn là giúp đỡ bây giờ.
Tìm chuyên gia vấn đề nội bộ của bạn . Các
chuyên gia về vấn đề hiện nay quan trọng là TON, bởi vì khả năng xác định và
tìm kiếm từ đồng nghĩa của BERT là một vấn đề lớn; Các chuyên gia về vấn đề
của bạn có khả năng sử dụng các từ đồng nghĩa như vậy trong bản sao một cách tự
nhiên, đảm bảo nội dung của bạn có thông tin phong phú trong đó BERT có thể khớp
với.
Viết cho các câu hỏi đàm thoại . Trong
chủ đề của bạn, làm thế nào để mọi người nói chuyện một cách tự
nhiên? Google đã nói rõ rằng tìm kiếm hội thoại là mặc định bây giờ, từ việc
có chip AI (Artificial Intelligence: Trí tuệ nhân tạo) tích hợp trong điện thoại của họ cho đến các trợ lý thông minh được
nhúng trong mọi thứ. Hầu như không ai có thể nói, quán cà phê tốt nhất ở
Boston, với một người bạn. Họ sẽ nói rằng, Hey Hey, cà phê tốt nhất ở
Boston là gì?
Nếu bạn làm việc với một công ty SEO, hãy đảm
bảo rằng họ có cả chuyên môn về miền và khả năng học máy . Coi
chừng một cơ quan SEO nói rằng họ xử lý mọi ngành, mọi lĩnh vực. Trong thế
giới hậu BERT, kiến thức chung nông cạn gây hại thay vì giúp đỡ, và SEO là một
trò chơi chất lượng trước khi nó là một trò chơi số lượng. Vấn đề chuyên
môn tên miền! Thuê một đại lý với độ sâu băng ghế trong thích hợp / ngành
công nghiệp của bạn. Các cơ quan tốt nhất cũng sẽ có thể thực hiện một số
hoặc tất cả quy trình 10 bước dưới đây cho bạn, có khả năng tiết kiệm chi phí
đáng kể so với việc thuê một nhóm khoa học dữ liệu / máy học của riêng bạn.
Chọn chất lượng hơn số lượng . Nếu
bạn có thể, hãy tạo nội dung chất lượng cao ở quy mô, nhưng nếu bạn phải đưa ra
lựa chọn cung cấp nguồn lực, hãy chọn chất lượng trước. Chất lượng
nội dung là tối quan trọng bây giờ.
Hãy cùng tìm hiểu về thịt và khoai tây của SEO sau BERT trông như
thế nào, quy trình gồm 10 bước:
- Kiểm kê.
- Làm giàu
- Khám phá.
- Liên quan.
- Mở rộng.
- Xây dựng.
- Dự đoán.
- Cộng sự.
- Chưng cất.
- Vươn ra.
Chúng tôi sẽ phác thảo mỗi bước trong hai phần: phần giải thích kỹ
thuật và phần lấy chìa khóa cấp cao.
Bước 1: Kiểm kê
Trước bất cứ điều gì khác, bạn sẽ cần phải có danh mục và kiểm kê
dữ liệu của riêng bạn. Điều này rất quan trọng để hiểu những gì hiện đang
kiếm được lưu lượng truy cập của bạn; xem xét nó dữ liệu đào tạo của bên
thứ nhất để khám phá chủ đề trong tay.
Chìa khóa: biết những gì bạn có và nó hoạt động
tốt như thế nào.
Bước 2: Làm giàu
Đây là bước đầu tiên trong quy trình sẽ thúc đẩy chuyên gia về vấn
đề của bạn (SME). Doanh nghiệp vừa và nhỏ của bạn nên làm hai việc: thứ nhất,
cung cấp nội dung chuyên gia phản ánh nội dung có thẩm quyền nhất trong lĩnh vực
/ chủ đề / thích hợp của bạn trông như thế nào. Thứ hai, bạn sẽ trích xuất
dữ liệu của bên thứ ba đáng tin cậy từ các công cụ khám phá nội dung / SEO như
AHREFS hoặc BuzzSumo; doanh nghiệp vừa và nhỏ của bạn sẽ giúp bác sĩ thú y
xem nội dung nào có thẩm quyền và đáng tin cậy nhất và nội dung nào có chất lượng
thấp hơn.
Chìa khóa: xây dựng một thư viện những thứ tốt
nhất trong ngành của bạn.
Bước 3: Khám phá
Sử dụng học máy, xây dựng mô hình ngôn ngữ tự nhiên không giám sát
về dữ liệu đào tạo của bạn, bên thứ nhất và bên thứ ba. Mô hình này nên
khám phá chủ đề của bạn và làm nổi bật các chủ đề chính xảy ra bên trong chủ đề. Một
lần nữa, hãy sử dụng doanh nghiệp vừa và nhỏ của bạn để xác thực mô hình của bạn
và đảm bảo rằng nó sẽ chọn các chủ đề mà họ, với tư cách là một chuyên gia, sẽ
thấy.
Chìa khóa: vạch ra chủ đề / ngành của bạn để
tìm chủ đề hàng đầu.
Bước 4: Liên quan
Sử dụng máy học, vector hóa nội dung bên thứ nhất và nội dung bên
thứ ba đáng tin cậy của bạn. Vectorization là việc chuyển đổi văn bản
thành các biểu diễn toán học được gọi là nhúng và các nhúng này tạo thành cơ sở
cơ bản của những gì BERT sử dụng cho mô hình ngôn ngữ của nó. Những gì
BERT (và các mô hình ngôn ngữ hiện đại khác) làm là xem xét các mối quan hệ thống
kê giữa các từ, cụm từ, câu và chủ đề.
Khi bạn đã chuyển đổi dữ liệu đào tạo của mình thành các phần
nhúng, hãy so sánh bằng cách sử dụng phương pháp học có giám sát, hai bộ nhúng
với các chủ đề / câu / cụm từ hàng đầu đã biết của bạn được xác định bởi
SME. Bao nhiêu và mức độ chặt chẽ của nội dung của bạn phù hợp với các chủ
đề chính? Bao nhiêu và mức độ chặt chẽ của nội dung bên thứ ba sắp xếp? Khoảng
trống đó là khoảng trống chuyên môn nội dung của bạn mà bạn sẽ cần phải lấp đầy.
Nếu bạn có các kỹ năng và công nghệ cần thiết để triển khai BERT,
bạn cũng có thể sử dụng mô hình để tạo và xác thực các từ đồng nghĩa từ dữ liệu
đào tạo của mình, để có khả năng khám phá các chủ đề / chủ đề bạn chưa khám phá
và không xảy ra trong quá trình đào tạo của bạn dữ liệu. Đây là một bước
khá tiên tiến và là tùy chọn; Sự hiểu biết về bối cảnh của BERT không có
nghĩa là bạn phải dựa vào nó để hiểu những gì được tạo ra với các thuật ngữ, cụm
từ và chủ đề của bạn. Các công cụ học máy cũ hơn như FastText sẽ thực hiện
điều này một cách có khả năng với kết quả cạnh tranh và chi phí thấp hơn nhiều.
Chìa khóa: tìm khoảng cách giữa nội dung của bạn
và nội dung tốt nhất hiện có.
Bước 5: Mở rộng
Khi bạn đã xác định khoảng cách nội dung của mình và các chủ đề
chính, hãy mở rộng chủ đề thành một loạt các câu hỏi liên quan mà doanh nghiệp
vừa và nhỏ của bạn sẽ sử dụng để tạo nội
dung trong tương lai. Sử dụng mô hình BERT được điều chỉnh tốt của bạn để
đặt câu hỏi và nhận các câu hỏi liên quan hoặc thuật toán tạo câu hỏi bạn chọn
để xây dựng một bộ mã các câu hỏi đàm thoại. Các tùy chọn khác có thể bao
gồm GPT-2 và XLNet.
Doanh
nghiệp vừa và nhỏ của bạn cũng sẽ cần một danh sách kiểm tra các chủ đề và chủ
đề chính có liên quan chặt chẽ với nhau (mà bạn đã tìm thấy trong bước
trước bằng cách sử dụng vector hóa).
Chìa khóa: xây dựng một danh sách câu hỏi lớn
về các chủ đề chính mà bạn có khoảng trống để các doanh nghiệp vừa và nhỏ của bạn
trả lời.
Bước 6: Xây dựng
Doanh nghiệp vừa và nhỏ của bạn sẽ kiếm được bữa ăn tối của họ ở
đây. Sử dụng bất kỳ phương tiện hợp lý cần thiết, có câu trả lời cho doanh
nghiệp vừa và nhỏ của bạn, như nhiều câu hỏi chi tiết bạn đã tạo. Nắm bắt
câu trả lời của họ và chế tạo chúng thành các phần nội dung dài. Lý tưởng
nhất là sử dụng khung nội dung transmedia để bạn thu được lượng dữ liệu tối đa.
Điều quan trọng là bạn phải rất cẩn thận trong việc chỉnh sửa
doanh nghiệp vừa và nhỏ của mình. Hãy nhớ rằng BERT đang xem xét bối cảnh ở
cấp độ câu, do đó, việc chỉnh sửa quá mức một doanh nghiệp vừa và nhỏ có thể loại
bỏ các sắc thái mà thuật toán có thể thấy hữu ích để phân biệt giữa nội dung
chuyên gia và nội dung có giá trị thấp hơn.
Chìa khóa: tạo nội dung với các doanh nghiệp vừa
và nhỏ của bạn trả lời các câu hỏi chính.
Bước 7: Dự đoán
Mặc dù BERT là tin tức lớn trong ngày, chúng tôi cũng biết rằng
hơn 200 yếu tố xếp hạng đi vào thuật toán tổng thể của Google. Chúng tôi
biết tính thời vụ đóng một vai trò; Google thậm chí còn xuất bản một công
cụ để kiểm tra tính thời vụ, Google Xu hướng. Sử dụng dự báo chuỗi thời
gian, lấy các chủ đề chính và câu hỏi chính của bạn và dự báo chúng theo khung
thời gian 4, 13, 26 hoặc 52 tuần để xác định khi nào sự quan tâm tìm kiếm cho
các câu hỏi và chủ đề khác nhau của bạn sẽ đạt đến đỉnh điểm.
Xuất bản nội dung SME của bạn cho mỗi câu hỏi / chủ đề một vài tuần
trước khi đạt đến đỉnh điểm để nó có sẵn và mới mẻ khi đạt đến đỉnh điểm quan
tâm của khán giả.
Chìa khóa: thời gian nội dung SME của bạn với
thị trường.
Bước 8: Liên kết
Với kiến thức về các câu hỏi và chủ đề chính bao gồm lĩnh vực của
bạn, hãy thiết lập giám sát phương tiện trong một công cụ như Talkwalker và vạch
ra những người có ảnh hưởng nhất đến các chủ đề này trong không gian của bạn. Sử
dụng các kỹ thuật học máy như đồ thị mạng và thuật toán trung tâm phù hợp để
tìm ra người có ảnh hưởng nhất đến chủ đề và xây dựng mô hình những người bạn sẽ
cần để quảng bá nội dung do doanh nghiệp vừa và nhỏ của bạn tạo ra - và có thể
làm tăng thêm.
Chìa khóa: xác định những người có ảnh hưởng
cho nội dung SME của bạn để giúp chia sẻ.
Bước 9: Chưng cất
Với những người có ảnh hưởng của bạn được xác định, hãy nhập nội
dung xã hội của họ trong một khung thời gian dài (tối đa một năm) để xác định trang
web / nhà xuất bản nào họ chia sẻ và tham gia nhiều nhất. Những nơi nào nội
dung của bạn sẽ phù hợp một cách tự nhiên để xuất bản của khách (một phần, có lẽ
không đầy đủ), sao cho một người có ảnh hưởng có thể nhìn thấy nó một cách hữu
cơ và quảng bá nó mà không cần thêm đầu vào?
Sử dụng biểu đồ mạng và công cụ SEO bạn chọn để xây dựng biểu đồ về
các trang web được chia sẻ, liên kết nào đến các trang web đó và nơi các trang
web chính liên kết đến.
Chìa khóa: nơi nội dung của bạn có thể được
chia sẻ cũng quan trọng như người chia sẻ nội dung đó. Kiểm tra cảnh quan
để xác định cơ hội.
Bước 10: Tiếp cận
Đây là nơi mà một cơ quan, freelancer, hoặc nhóm sẽ hữu ích nhất. Khi
bạn đã xác định được những nơi mà nội dung của bạn cần đến, hãy liên hệ với những
người có ảnh hưởng, các trang web, nhà xuất bản, v.v. và làm những gì bạn có thể
để đặt, chia sẻ và liên kết - nhanh nhất có thể chuỗi thời gian dự báo bạn đã
xây dựng ở bước 7. Trong khi BERT thay đổi nội dung chúng tôi xuất bản, liên kết
trong nước, chia sẻ xã hội và bảo hiểm truyền thông vẫn là những yếu tố thiết yếu
để biểu thị thẩm quyền và độ tin cậy.
Chìa khóa: tiếp cận kịp thời với những người
có ảnh hưởng và nhà xuất bản để tối đa hóa sự tương tác với nội dung của bạn.
Kết luận
BERT thay đổi mọi thứ và theo một số cách nhưng BERT không thay đổi gì nếu nội dung của bạn luôn mạnh mẽ, được điều khiển bởi chuyên gia, phân phối tốt và đáng tin cậy.
Quy trình kỹ thuật
được nêu ở trên sẽ giúp bạn tối đa hóa sức mạnh của nội dung và mở khóa các cơ
hội nội dung mới, nhưng tập trung vào cách mọi người nói về chủ đề và chủ đề của
bạn trong cuộc trò chuyện sẽ đưa bạn đi xa hơn là tập trung vào những từ và cụm
từ lúng túng trong quá khứ.
Tôi hy vọng bạn thấy điều này hữu ích và hữu ích cho việc lập kế
hoạch về cách bạn sẽ thay đổi chiến lược SEO của mình ngay bây giờ khi BERT
đang hoạt động. Cửa sổ cơ hội để tận dụng lợi thế của thuật toán mới và xếp
hạng tốt hiện đang mở - hãy tận dụng nó thật tốt! Chúng tôi sử dụng quy
trình này cho chính mình và chỉ trong một năm, chúng tôi đã tăng lưu lượng tìm
kiếm không phải trả tiền 479,3% mỗi năm.
Trích nguồn: Trust Insights
Tags:
Thuật toán Google