Nội dung giống nhau trùng lặp trong SEO

Có hàng tỉ website đã, đang xây dựng và hoạt động hiện nay. Có rất nhiều website mắc phải lỗi trùng lặp, giống nhau về phần nội dung (duplicate content). Việc giống nhau, trùng lặp nội dung là những nội dung cùng xuất hiện trên nhiều website khác nhau. Những nội dung tương tự về ngữ pháp, hay các từ đồng nghĩa cũng sẽ được Google xếp vào danh sách duplicate content. Việc thuật toán Google Panda đã được ra nhằm kiểm tra, sàn lọc những website có nội dung trùng lặp sẽ bị phạt và làm ảnh hưởng nghiêm trọng đến kết quả SEO.

Giống nhau hay trùng lặp nội dung sẽ ảnh hưởng đến thứ hạng SEO
Giống nhau hay trùng lặp nội dung sẽ ảnh hưởng đến thứ hạng SEO

Có 3 loại giống nhau trùng lặp nội dung

Bản sao gốc : Là dạng website có nội dung hoàn toàn giống nhau với website chính thức, chỉ khác nhau về đường dẫn.

Tương tự gần giống với bản gốc: Là website có nội dung tương tự gần giống với bản gốc, nó chỉ khác nhau về câu chữ,  các hình ảnh và bố cục của website.

Giống một phần: Giống hoàn toàn một phần nội dung của website chính. Điều này thường xảy ra khi một nội dung được chia sẻ trên 2 website khác nhau với mỗi website sẽ là một phần nội dung gốc. Nên nó có thể là dạng nội dung của bản gốc hoặc dạng gần giống nội dung với bản gốc.

Những lí do nội dung giống nhau trùng lặp sẽ bị Google phạt

Giống nhau, trùng lặp nội dung sẽ làm ảnh hưởng đến việc tìm kiếm thông tin của người dùng do không đem lại thông tin hữu ích và đa chiều cho người sử dụng.

Thuật toán Google Panda sẽ chú trọng trong việc đánh giá nội dung trùng lặp. Nếu những website đã bị Google panda đánh giá là không tốt , các thuật toán của Google Panda sẽ tác động đến website đó,  làm cho website trùng lặp mất đi điểm để đánh giá xếp loại thứ hạng, nặng hơn thì có thể sẽ bị xóa mất hoàn toàn nội dung nội dung

Cách khắc phục lỗi giống nhau trùng lặp về nội dung

Bạn nên tìm hiểu, khảo sát và đánh giá nội dung trùng lặp có thực sự không đem lại lợi ích cho người tìm kiếm hay nó không đem lại cho bạn những lược traffic (ghé thăm) hay những liên kết (URL) thì bạn hãy nên xóa nó đi và để lỗi 404.

Chuyển hướng 301 : Bạn thông báo cho cả người dùng và bọ tìm kiếm của Google rằng website mà họ trang truy cập đã chuyển đến một địa chỉ khác. Và công cụ này sẽ chuyển hướng người dùng đến một liên kết của trang đích. Đây là cách làm tốt nếu nội dung bị giống nhau hay trùng lặp đó nằm trên URL  gắn thẻ canonical.

Robot.txt :Là giải pháp được dùng khi bạn muốn nội dung trùng lặp hiển thị với người dùng nhưng ngăn chặn không cho bọ tìm kiếm thu thập thông tin. Điều này chỉ hiệu quả với các website chưa index (Google cập nhật thông tin) , còn đối với các website đã được index thì nó sẽ không có tác dụng.

Meta Robots Tag : Được áp dụng nếu bạn muốn điều hướng khả năng tìm kiếm thông tin của bots tại trang. Nó sẽ tự động thông báo cho bots tìm kiếm không index trang này hoặc các liên kết trong đó.

Rel=canonical hay “canonical Tag” : Giúp webmaster có thể dễ dàng tạo ra canonical cho bất kỳ trang nào. Khi bots tìm kiếm thu thập thông tin trên một trang có gắn thẻ canonical nó sẽ hiểu và loại bỏ nội dung trùng lặp trên liên kết đó đó.

Google URL Removal: Đây là giải pháp cuối cùng nếu bạn phải bắt buộc thực hiện việc xóa bỏ các nội dung trùng lặp. Nó được sử dụng trong google webmaster tool.

Bạn thực hiện các bước sau:

Truy cập vào google webmaster tool

Trỏ chuột vào “Site Configuration”

tiếp tục trỏ chuột vào  “Crawler Access”

Sau khi thực hiện sẽ hiển thị ra 3 mục chuyển hướng (tab). Bạn hãy trỏ chuột vào “Remove URL” .

Posted in Tin tức

Leave a Comment

Your email address will not be published. Required fields are marked *

*
*