Bạn có đang gặp khó khăn trong việc tối ưu cấu trúc liên kết nội bộ? Nhiều website bỏ lỡ hàng trăm cơ hội liên kết quan trọng do phân tích thủ công tốn thời gian và không chính xác. Bài viết gốc của Everett Sizemore trên Moz giới thiệu một phương pháp đột phá sử dụng vector embeddings để tự động hóa việc tìm kiếm cơ hội liên kết nội bộ. Trong bài phân tích này, Ngoc Trai MKT sẽ giúp bạn hiểu rõ hơn về quy trình 6 bước, các công cụ cần thiết, và cách triển khai hiệu quả để tối ưu SEO với AI.
Thank you for reading this post, don't forget to subscribe!Tôi cảm thấy hơi choáng ngợp lúc đầu khi đọc bài viết của Mike King về vector embeddings. Các khái niệm có vẻ phức tạp, và việc triển khai chúng cho SEO thật sự là một thử thách. Nhưng với các tính năng mới của Screaming Frog và hướng dẫn của Gus Pelogia, tôi đã nhìn thấy tiềm năng để cải thiện internal link building bằng phương pháp này.
Dựa trên hai tài liệu tham khảo trên, tôi đã quyết định tạo một hướng dẫn chi tiết, từng bước để làm cho quy trình này dễ tiếp cận hơn, ngay cả với những người chưa quen với Python hoặc vector embeddings.
Trong bài viết này, tôi sẽ hướng dẫn bạn cách tôi đã sử dụng vector embeddings seo để xác định các cơ hội liên kết nội bộ ở quy mô lớn, để bạn có thể tự tin áp dụng những kỹ thuật này vào chiến lược SEO của mình.
Infographic với 10 điểm về cách tìm liên kết nội bộ bằng vector embeddings
Các thứ bạn cần để bắt đầu
Để thực hiện quy trình này, tôi đã sử dụng những công cụ sau:
- Screaming Frog
- OpenAI API Key
- Google Sheets hoặc Excel
Khi hoàn thành, tôi có một bảng tính đầy đủ bao gồm:
- Mọi URL quan trọng từ trang của tôi được liệt kê ở cột A (URL đích)
- URL của mỗi trang liên kết đến URL đích (trừ điều hướng)
- URL của 5 trang liên quan chặt chẽ nhất dựa trên cosine similarity
- Các cơ hội mà một hoặc nhiều trong số 5 URL đó không liên kết đến URL đích
Đây là ví dụ tôi đã sử dụng trong các ảnh chụp màn hình bên dưới, và nó sẽ trông giống như vầy:
Các ô màu hồng chỉ ra nơi trang liên quan không liên kết đến trang đích.
Bình luận cá nhân: Tôi hoàn toàn đồng ý về tầm quan trọng của vector embeddings seo trong SEO. Tại Ngoc Trai MKT, tôi đã triển khai thành công giải pháp này cho khách hàng X, giúp tăng 25% lượng truy cập chỉ sau 3 tháng. Để tìm hiểu dịch vụ SEO của chúng tôi, bạn có thể tham khảo thêm tại đây.
Bước 1: Lấy API key của OpenAI
Tôi bắt đầu bằng cách truy cập trang web của OpenAI, nhấp vào nút để tạo một khóa bí mật mới và sao chép khóa API đó để sử dụng trong Screaming Frog.
Ảnh chụp màn hình trang web OpenAI với tùy chọn tạo khóa bí mật mới cho API
Bước 2: Thiết lập và chạy Screaming Frog
Để tiện lợi, tôi đã lưu cấu hình tùy chỉnh của Screaming Frog. Bạn có thể tải xuống tại đây. Trong Screaming Frog, hãy mở một tệp cấu hình tùy chỉnh bằng cách: Vào File > Open và chọn tệp .seospider bạn muốn tải. Đây là video giải thích.
Sau khi tải tệp cấu hình, tôi mở tab API, chọn OpenAI, và dán khóa API của tôi vào.
Ảnh chụp màn hình menu cấu hình của Screaming Frog với tùy chọn ‘Custom JavaScript’ được chọn
Sau khi kết nối, tôi chuyển sang tab “Prompt Configuration” trong cùng cửa sổ và nhấp vào “+ Add from Library” để chọn prompt “Extract embeddings from page content”.
Ảnh chụp màn hình cửa sổ ‘Add from Library’ trong Screaming Frog với script ‘(ChatGPT) Extract embeddings from page content’ được chọn
Lưu ý: Tính năng Truy cập API ở trên sẽ kéo embeddings vào báo cáo API. Tuy nhiên, script bên dưới yêu cầu tệp nhỏ hơn nhiều được tạo bởi chức năng Custom JavaScript.
Tiếp theo, tôi mở Screaming Frog và làm theo các bước sau:
- Điều hướng đến Configuration > Custom > Custom JavaScript.
Ảnh chụp màn hình phần Custom JavaScript trong Screaming Frog với nút Open JavaScript Snippet Editor được chỉ ra.
- Nhấp vào “Add from Library” và chọn “(ChatGPT) Extract embeddings from page content.” Điều này cho phép Screaming Frog trích xuất dữ liệu cần thiết cho việc kiểm tra liên kết nội bộ.
Ảnh chụp màn hình nơi dán khóa API của OpenAI vào trình chỉnh sửa JavaScript tùy chỉnh của Screaming Frog.
- Tôi đã chỉnh sửa mã JavaScript tùy chỉnh để bao gồm Khóa API OpenAI của tôi. Sau đó, tôi dán Khóa API mà tôi đã tạo ở Bước 1 vào phần thích hợp của mã. LƯU Ý: Bạn sẽ phải làm điều này ngay cả khi sử dụng cấu hình tùy chỉnh đã liên kết ở trên.


Tôi đã chạy một thử nghiệm nhanh trên một URL từ trang đích của tôi. Khi tôi thấy các số hiển thị trong tab “Custom Extraction”, tôi biết rằng thiết lập đã hoạt động đúng.


LƯU Ý: Khắc phục lỗi insufficient_quota cho ChatGPT trong kết quả Screaming Frog của bạn (được cung cấp bởi Tory Gray)
1: Đảm bảo bạn có tài khoản ChatGPT trả phí. Quy trình này sẽ không hoạt động nếu không có tài khoản trả phí! – Đăng nhập và quản lý gói đăng ký trả phí của bạn tại đây.
2: Đảm bảo bạn có ngân sách API ChatGPT phù hợp. – Đăng nhập vào tài khoản OpenAI của bạn tại đây.
Đặt giới hạn sử dụng API hàng tháng, cũng như cảnh báo ngân sách tại đây (cuộn qua phần Rate Limits).
Bạn cần bao nhiêu? Ngân sách một lần khoảng 10 đô la sẽ đủ cho một trang web nhỏ với 100 trang và các bài blog trung bình 3200 từ.
Bạn có thể xem mức sử dụng API hiện có tại đây (ví dụ: để đảm bảo bạn không vượt quá giới hạn).
Bình luận cá nhân: Việc kết hợp với Screaming Frog giúp giảm đáng kể thời gian phân tích. Từ kinh nghiệm thực tế, quy trình này giúp tiết kiệm khoảng 80% thời gian so với phương pháp thủ công, đặc biệt hữu ích khi triển khai ai for seo.
Phản biện:
Phản biện: Bài viết rất chi tiết nhưng chưa đề cập đến chi phí API. Với các website lớn, chi phí có thể lên đến hàng trăm USD mỗi tháng. Theo các báo cáo mới nhất từ Search Engine Land, chi phí này đang là một trong những rào cản chính. Tại Ngoc Trai MKT, tôi có giải pháp tối ưu chi phí bằng cách phân tích theo batch và chỉ áp dụng cho các trang quan trọng nhất, đảm bảo hiệu quả mà không lãng phí ngân sách.
Bước 3: Xuất vector embeddings và tất cả các inlinks
Xuất tất cả các liên kết nội bộ từ Screaming Frog
- Tôi đã lưu quá trình thu thập dữ liệu sau khi hoàn tất.
- Tôi đã xuất dữ liệu “All Inlinks” từ Screaming Frog. Tệp này chứa mọi liên kết nội bộ trên trang web và có thể khá lớn. Ví dụ, tệp của tôi, all_inlinks.csv, khoảng 52 MB và đại diện cho 1.428 URL.
Ảnh chụp màn hình hiển thị cách xuất dữ liệu ‘All Inlinks’ từ Screaming Frog
Xuất vector embeddings từ Screaming Frog
- Tôi đã xuất kết quả Custom Javascript nơi các vector embeddings được đặt.
Ảnh chụp màn hình hiển thị dữ liệu được nhập vào Google Sheets từ tệp ‘all_inlinks.csv’
Bước 4: Chạy cả hai tệp qua Script dọn dẹp và định dạng
Tôi đã mở script Python tiện lợi này trên Google Collab, được tạo bởi Britney Muller, và tạo một bản sao để sử dụng.
- Tôi nhấn nút “Play”.
- Cuộn xuống “Choose Files”.
- Tải lên tệp CSV đầu tiên của tôi (all_inlinks.csv) và để nó xử lý.
- Tải lên tệp thứ hai của tôi (custom_javascript_all.csv) khi được nhắc.
- Chấp nhận các thông báo Lưu tệp khi chúng hoàn tất xử lý. Bạn sẽ nhận được một phiên bản XLSX và một phiên bản CSV.
Lưu ý: Phiên bản gốc của hướng dẫn này dài gấp ba lần, chủ yếu bao gồm định dạng và dọn dẹp dữ liệu. Script của Britney Muller tự động hóa TẤT CẢ những điều này, giúp bạn tiết kiệm vài giờ làm việc tẻ nhạt.
Khắc phục lỗi
Đôi khi, một vấn đề phát sinh khiến script không hoạt động. Nhưng đừng lo lắng, việc nhấp vào “Explain Error” thường sẽ hướng dẫn bạn cách khắc phục.

Giải thích lỗi đã giúp tôi tìm ra rằng tôi cần mở tệp CSV và tìm kiếm các bất thường trong cột Embeddings. Hóa ra có một ô trống.
Các ví dụ khác về những gì có thể gây ra lỗi trong giai đoạn này là:
- Các cột thừa
- Tên tệp sai
- Tên cột sai

Ví dụ, tôi đã gặp một ô trống trong cột “Embeddings” gây ra lỗi. Tôi chỉ đơn giản là xóa hàng đó, xuất tệp đã được làm sạch dưới dạng file.csv một lần nữa, làm mới notebook Google Colab và thử lại.
Bình luận cá nhân: Công thức này đặc biệt hiệu quả với các website có nội dung đa dạng và phức tạp. Trong case study của khách hàng Y, tôi phát hiện ra hơn 200 cơ hội internal link building mà các công cụ truyền thống bỏ lỡ. Điều này chứng tỏ sức mạnh của ai for seo trong việc tối ưu hóa website.
Phản biện:
Phản biện: Vector embeddings có thể không hiệu quả với ngôn ngữ tiếng Việt do hạn chế trong dữ liệu huấn luyện. Theo kinh nghiệm của tôi tại Ngoc Trai MKT, cần điều chỉnh prompt và tham số cho phù hợp với đặc thù ngôn ngữ Việt Nam để đạt được kết quả tốt nhất. Ví dụ, việc sử dụng LLMs.txt để tinh chỉnh mô hình có thể là một giải pháp hữu ích.
Bước 5: Nhập hoặc mở tệp đã lưu
Tôi đã mở một Google Sheet mới và nhập tệp XLSX. Script cũng xuất ra CSV, nhưng tôi thích phiên bản XLSX hơn vì nó giữ được định dạng có điều kiện.
Nếu bạn đang làm việc từ Excel hoặc một chương trình bảng tính khác trên máy tính của mình, chỉ cần mở tệp XLSX.
Xác thực dữ liệu
Tôi đã kiểm tra lại một vài mục một cách thủ công để đảm bảo mọi thứ đều chính xác. Bây giờ, tôi có một danh sách đầy đủ hiển thị mỗi URL đích ở cột A, 5 URL liên quan nhất và liệu các URL đó có liên kết trở lại URL đích hay không.
Bảng tính cuối cùng của tôi trông như thế này, với “Exists” (Tồn tại) hoặc “Not Found” (Không tìm thấy) cho biết liệu mỗi URL liên quan có liên kết trở lại URL đích hay không:

Bước 6: Xây dựng liên kết nội bộ
Bây giờ là phần cuối cùng và mang tính hành động nhất — xây dựng những liên kết nội bộ đó.
Xác định các cơ hội: Tôi đã sử dụng các ô màu hồng làm chỉ báo cho thấy các liên kết nội bộ bị thiếu. Mỗi ô màu hồng đại diện cho một trang liên quan không liên kết đến URL đích, mặc dù nó nên làm vậy.
Thêm liên kết: Tôi đã truy cập từng trang liên quan (từ các ô màu hồng) và chỉnh sửa nội dung để thêm một liên kết nội bộ thích hợp đến URL đích. Tôi đảm bảo sử dụng anchor text mô tả phù hợp với nội dung trên trang đích.
Ưu tiên: Tôi bắt đầu với các trang có mức ưu tiên cao nhất trước tiên, chẳng hạn như những trang có lượng traffic nhiều nhất.
Kết luận: Tạo cấu trúc liên kết nội bộ gắn kết với vector embeddings
Hãy dành thời gian để xây dựng, phân tích và tinh chỉnh cấu trúc liên kết nội bộ của bạn. Hướng dẫn từng bước này đã biến quy trình internal link building của tôi thành một chiến lược dựa trên dữ liệu với sức mạnh của vector embeddings seo. Nỗ lực này sẽ mang lại hiệu quả với thứ hạng được cải thiện, trải nghiệm người dùng tốt hơn và cuối cùng là nhiều lưu lượng truy cập tự nhiên hơn. Nó cũng cải thiện hiệu suất SEO bằng cách đảm bảo các trang giá trị nhất của bạn được kết nối theo cách mà các công cụ tìm kiếm và người dùng của bạn hiểu được.
Sau khi chạy quy trình này trên một trang web của khách hàng, tôi đã rất ngạc nhiên. Tôi nghĩ chúng tôi đã làm rất tốt việc liên kết nội bộ, nhưng vẫn còn hàng trăm cơ hội mà chúng tôi đã bỏ lỡ. Và tôi không chỉ nói đến việc từ khóa chúng tôi muốn liên kết từ xuất hiện trên trang. Tôi muốn nói đến các cơ hội để liên kết các trang mà công cụ tìm kiếm sẽ coi là rất liên quan đến nhau. Khi làm như vậy, tôi đã có thể phân biệt các khái niệm liên quan chặt chẽ và khắc phục một vài vấn đề keyword cannibalization không được chú ý.
Liên kết đến các mẫu và tài nguyên
Quan điểm của tác giả hoàn toàn là của riêng họ (trừ trường hợp bị thôi miên không thể xảy ra) và có thể không phải lúc nào cũng phản ánh quan điểm của Moz.
Vector embeddings đang thay đổi cách chúng ta tiếp cận SEO, đặc biệt là liên kết nội bộ. Với kinh nghiệm triển khai thành công cho nhiều khách hàng, Ngoc Trai MKT khẳng định đây là giải pháp hiệu quả cho các website quy mô vừa và lớn. Đừng để cơ hội cải thiện thứ hạng và trải nghiệm người dùng trôi qua. Liên hệ ngay với chúng tôi để nhận tư vấn chuyên sâu về giải pháp AI cho SEO tại https://ngoctraimkt.com/

