1. Diễn đàn là nơi Chia sẻ những kinh nghiệm hay về việc học ngoại ngữ, chọn trường/ trung tâm ngoại ngữ chất lượng . Các chủ đề xoay quay việc học ngoài ngữ . Các nội dung khác khi post bài đề nghị post đúng mục và chủ đề .. tránh tình trạng spam ...

Lỗi sơ đồ trang web và cách sửa lỗi (sitemap.XML )

Thảo luận trong 'Sitemaps.xml' bắt đầu bởi keokeo, Thg 7 21, 2017.

  1. keokeo

    keokeo Administrator

    URL không thể truy cập được
    Cho biết Google đã gặp lỗi khi thử xem một URL trong sơ đồ trang web của bạn.

    1. Hãy đảm bảo rằng tệp tồn tại tại vị trí đã chỉ định.
    2. Xác minh bằng cách sử dụng trình kiểm tra robots.txt để xác nhận tệp nào đang chặn Google.
    3. Sử dụng công cụ Tìm nạp như Google để xem Google có đang bị chặn bởi robots.txt hay không.
    4. Nếu chúng tôi đã cố thu thập dữ liệu URL từ sơ đồ trang web của bạn, hãy đảm bảo rằng sơ đồ trang web của bạn liệt kê chính xác URL.
    URL không theo dõi được
    Thường chỉ báo rằng Google không thể xử lý hoàn toàn sơ đồ trang web của bạn vì một số URL chứa quá nhiều chuyển hướng khiến trình thu thập dữ liệu web của Google không thể theo toàn bộ chúng. Chúng tôi đề nghị bạn nên thay thế mỗi URL chuyển hướng đến một trang khác bằng URL mà chuyển hướng đó trỏ tới (URL đích).

    Danh sách sau đây mô tả một số lý do bổ sung khiến Google không thể theo một chuyển hướng kèm theo các giải pháp khả thi:

    • Hãy sử dụng trình duyệt văn bản như Lynx để kiểm tra trang web của bạn vì có nhiều công cụ tìm kiếm có thể xem trang web của bạn như Lynx. Nếu tính năng như Javascript, cookie, ID phiên, khung, DHTML hoặc Flash ngăn bạn xem được toàn bộ trang web mình trong một trình duyệt văn bản thì khi đó các trình thu thập dữ liệu của công cụ tìm kiếm đơn giản có thể gặp khó khăn khi thu thập dữ liệu trang web của bạn.
    • Nếu bạn đang chuyển hướng vĩnh viễn từ trang này sang trang khác, bạn có thể sử dụng chuyển hướng vĩnh viễn; bạn nên tránh sử dụng JavaScript hoặc chuyển hướng loại làm mới meta.
    • Nếu có thể, hãy sử dụng liên kết tuyệt đối hoặc đầy đủ chứ không phải liên kết tương đối. Ví dụ: khi liên kết đến một trang khác trong trang web của bạn, hãy liên kết đến https://www.example.com/mypage.htmlhơn là chỉ mypage.html.
    URL không được phép
    Sơ đồ trang web của bạn bao gồm một số URL ở cấp cao hơn hoặc miền khác so với tệp sơ đồ trang web.

    Cấp cao hơn: Nếu sơ đồ trang web của bạn được liệt kê dưới http://www.example.com/mysite/sitemap.xml, các URL sau không hợp lệ cho sơ đồ trang web đó:

    Miền khác: Kiểm tra để đảm bảo tất cả URL đều bắt đầu với cùng một miền như vị trí sơ đồ trang web của bạn. Ví dụ, nếu sơ đồ trang web của bạn nằm tại http://www.example.com/sitemap.xml, các URL sau không hợp lệ cho sơ đồ trang web đó:

    Lỗi nén
    Google đã gặp phải lỗi khi tiến hành giải nén cho tệp nén sơ đồ trang web của bạn. Nén lại tệp sơ đồ trang web của bạn (bằng công cụ như gzip), tải tệp đã nén lên trang web và gửi lại.

    Sơ đồ trang web trống
    Sơ đồ trang web của bạn không chứa bất kỳ URL nào. Kiểm tra sơ đồ trang web của bạn và đảm bảo rằng nó không trống. Nếu sơ đồ trang web của bạn sử dụng giao thức sơ đồ trang web, đảm bảo rằng các URL được gắn thẻ chính xác.

    Lỗi kích thước tệp sơ đồ trang web: Sơ đồ trang web của bạn vượt quá giới hạn kích thước tệp tối đa...
    Sơ đồ trang web của bạn lớn hơn 50MB khi được giải nén. Nếu sơ đồ trang web của bạn lớn hơn giới hạn, hãy chia nó thành nhiều sơ đồ trang web nhỏ hơn và liệt kê chúng trong tệp chỉ mục sơ đồ trang web rồi gửi (các) tệp chỉ mục sơ đồ trang web.

    Giá trị thuộc tính không hợp lệ
    Bạn chỉ định một giá trị không hợp lệ cho thuộc tính thẻ XML. Kiểm tra sơ đồ trang web để đảm bảo rằng chỉ các thuộc tính được phép hiện diện, và bạn chỉ gán các giá trị được phép theo đặc tả sơ đồ trang web. Kiểm tra chính tả của thuộc tính và giá trị của bạn.

    Ngày không hợp lệ
    Sơ đồ trang web của bạn có chứa một hoặc nhiều giá trị ngày không hợp lệ. Lỗi này có thể là vì ngày có định dạng không đúng hoặc ngày không hợp lệ. Giá trị ngày phải sử dụng Chuẩn mã hoá ngày giờ W3C, mặc dù bạn có thể bỏ qua phần giờ. Đảm bảo rằng ngày của bạn khớp với một trong các định dạng ngày giờ W3C sau:

    Việc xác định thời gian là tùy chọn (thời gian mặc định là 00:00:00Z), nhưng nếu bạn chỉ định thời gian, bạn cũng phải xác định múi giờ.

    Giá trị thẻ không hợp lệ
    Sơ đồ trang web của bạn chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Lỗi sẽ liệt kê thẻ có lỗi. Kiểm tra đặc tả cho loại sơ đồ trang web của bạn (chỉ mục, tiêu chuẩn, video, v.v.).

    URL không hợp lệ
    Một URL trong sơ đồ trang web của bạn không hợp lệ. Lỗi này có thể là vì URL có chứa ký tự không được hỗ trợ, khoảng trắng hoặc các ký tự khác như dấu trích hoặc có thể có định dạng không chính xác (ví dụ, htp://thay vì http://). Hãy đảm bảo rằng các URL được liệt kê trong sơ đồ trang web của bạn được mã hóa để dễ đọc và thoát đúng cách. Kiểm tra xem có bất kỳ ký tự không đúng nào như khoảng trắng hay dấu trích hay không. Bạn cũng có thể thử sao chép URL vào một trình duyệt để xem trình duyệt đó có thể hiểu được URL này và tải được trang không.
    URL không hợp lệ trong tệp chỉ mục sơ đồ trang web: URL không đầy đủ
    Tệp chỉ mục sơ đồ trang web của bạn không bao gồm URL đầy đủ cho mỗi tệp Sơ đồ trang web trong chỉ mục. Khi chúng tôi nhìn thấy một tệp chỉ mục sơ đồ trang web, chúng tôi nhìn vào cùng một thư mục để tìm các tệp trong chỉ mục. Ví dụ: nếu tệp chỉ mục sơ đồ trang web của bạn nằm tại http://www.example.com/folder1/sitemap_index.xml và liệt kê một sơ đồ trang web dưới dạng sitemap.xml, chúng tôi sẽ tìm sơ đồ trang web đó tại http://www.example.com/folder1/sitemap.xml. Nếu chúng tôi không thể tìm thấy nó ở đó, bạn sẽ thấy lỗi cho lần thử này.

    Cập nhật tệp chỉ mục sơ đồ trang web của bạn để bao gồm đường dẫn đầy đủ đến từng tệp sơ đồ trang web được liệt kê, sau đó gửi lại.

    XML Không hợp lệ: quá nhiều thẻ
    Sơ đồ trang web của bạn chứa các thẻ trùng lặp. Ví dụ: mục nhập sau đây sẽ gây ra lỗi này vì thẻ <loc> được liệt kê hai lần:

    <url>
    <loc>http://www.example.com/</loc>
    <loc>http://www.example.com/page1.html</loc>
    <lastmod>2005-01-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
    </url>
    Lỗi liệt kê thẻ có vấn đề và số dòng. Xóa thẻ trùng lặp và gửi lại sơ đồ trang web của bạn.

    Thiếu thuộc tính XML
    Một thẻ trong sơ đồ trang web của bạn bị thiếu một thuộc tính bắt buộc. Kiểm tra sơ đồ trang web của bạn để đảm bảo rằng không có thuộc tính bắt buộc nào bị thiếu. Khi bạn đã sửa giá trị thuộc tính, hãy gửi lại sơ đồ trang web của bạn.
    Thiếu thẻ XML
    Một hoặc nhiều mục nhập trong sơ đồ trang web của bạn thiếu một thẻ bắt buộc. Thông báo lỗi liệt kê số dòng. Xem lại trang kiến thức cơ bản về sơ đồ trang web để biết thông tin về thẻ bắt buộc.

    URL hình ảnh thu nhỏ bị thiếu
    Một hoặc nhiều mục video bị thiếu URL cho hình ảnh thu nhỏ. Hãy đảm bảo xác định vị trí của bất kỳ URL hình ảnh thu nhỏ nào bằng cách sử dụng thẻ <video:thumbnail_loc>.

    Thiếu tiêu đề video
    Một hoặc nhiều mục video bị thiếu tiêu đề. Đảm bảo mỗi video trong sơ đồ trang web của bạn đều có tiêu đề, được xác định trong thẻ <video:title>.

    Định dạng chỉ mục sơ đồ trang web không chính xác: Chỉ mục sơ đồ trang web lồng ghép
    Một hoặc nhiều mục nhập trong tệp chỉ mục sơ đồ trang web của bạn sử dụng URL của riêng nó hoặc URL của một tệp chỉ mục sơ đồ trang web khác.

    Một tệp chỉ mục sơ đồ trang web chỉ được liệt kê các tệp sơ đồ trang web, không được liệt kê các tệp chỉ mục sơ đồ trang web khác.

    Xóa bất kỳ mục nhập nào trỏ đến tệp chỉ mục sơ đồ trang web rồi gửi lại sơ đồ trang web của bạn.
    Lỗi phân tích cú pháp
    Google không thể phân tích cú pháp XML của sơ đồ trang web.
    Vấn đề này thường được gây ra bởi một ký tự chưa được thoát trong URL. Cũng như với tất cả các tệp XML, bất kỳ giá trị dữ liệu nào (kể cả các URL) cũng phải sử dụng các mã thoát của thực thể cho các ký tự cụ thể như các biểu tượng & ' " <>. Hãy đảm bảo rằng URL của bạn được thoát đúng cách.

    Lỗi tạm thời
    Hệ thống của chúng tôi gặp phải vấn đề tạm thời ngăn chúng tôi xử lý sơ đồ trang web của bạn. Nói chung, khi bạn thấy lỗi này, bạn không cần phải gửi lại sơ đồ trang web của bạn. Google có thể cố gắng truy xuất lại sơ đồ trang web của bạn sau này. Nếu lỗi vẫn tồn tại sau vài giờ, hãy thử gửi lại sơ đồ trang web của bạn.

    Quá nhiều sơ đồ trang web trong tệp chỉ mục sơ đồ trang web
    Tệp chỉ mục sơ đồ trang web của bạn liệt kê hơn 50.000 sơ đồ trang web. Tách chỉ mục sơ đồ trang web của bạn thành nhiều tệp chỉ mục sơ đồ trang web và đảm bảo rằng mỗi danh sách có không quá 50.000 sơ đồ trang web.

    Quá nhiều URL trong sơ đồ trang web
    Sơ đồ trang web của bạn liệt kê hơn 50.000 URL. Tách sơ đồ trang web của bạn thành nhiều Sơ đồ trang web và đảm bảo rằng mỗi sơ đồ chứa không quá 50.000 URL. Bạn cũng có thể sử dụng tệp chỉ mục sơ đồ trang web để quản lý sơ đồ trang web của bạn.

    Định dạng không được hỗ trợ
    Sơ đồ trang web của bạn không có định dạng được hỗ trợ. Sơ đồ trang web phải ở định dạng XML và sử dụng tiêu đề chính xác.
    Các lỗi XML thường gặp:




      • Tất cả thuộc tính XML phải nằm trong dấu nháy đơn (') hoặc dấu ngoặc kép (") và cdấu ngoặc kép đó phải thẳng chứ không móc. Chương trình xử lý văn bản như Microsoft Word có thể chèn dấu ngoặc móc.
    Đường dẫn không khớp: Thiếu www
    Đường dẫn tới sơ đồ trang web của bạn không chứa tiền tố www (ví dụ, http://example.com/sitemap.xml), nhưng URL trong sơ đồ trang web của bạn lại có tiền tố đó (ví dụ, http://www.example.com/myfile.html).

    Nếu bạn muốn gửi sơ đồ trang web của bạn đến đường dẫn không có www, nhưng URL trong sơ đồ là www, hãy chọn www làm miền ưa thích cho trang web của bạn.

    Nếu không, sửa đổi sơ đồ trang web của bạn để xóa "www" khỏi tất cả các URL để khớp với vị trí sơ đồ trang web của bạn.

    Đường dẫn không khớp: Bao gồm www
    Đường dẫn tới sơ đồ trang web của bạn chứa tiền tố www (ví dụ: http://www.example.com/sitemap.xml), nhưng URL trong sơ đồ trang web của bạn lại không có tiền tố đó (ví dụ: http://example.com/myfile.xml).

    Nếu bạn muốn gửi sơ đồ trang web của bạn đến đường dẫn có www, nhưng URL trong sơ đồ không phải www, hãy chọn không phải www làm miền ưa thích cho trang web của bạn.

    Nếu không, hãy sửa đổi sơ đồ trang web của bạn để thêm "www" vào tất cả các URL để khớp với vị trí sơ đồ trang web của bạn.

    Vùng chứa tên sai
    Phần tử gốc của sơ đồ trang web của bạn không có vùng chứa tên chính xác, hoặc vùng chứa tên được khai báo sai hoặc có lỗi chính tả hay URL không chính xác.

    Đảm bảo rằng bạn đang sử dụng vùng chứa tên chính xác cho loại tệp của bạn. Ví dụ:


    Bắt đầu bằng khoảng trắng
    Sơ đồ trang web của bạn bắt đầu với khoảng trắng, chứ không phải khai báo vùng chứa tên. Tệp XML phải bắt đầu với khai báo XML trong đó xác định phiên bản XML được sử dụng.

    Lỗi này sẽ không ngăn Google xử lý sơ đồ trang web của bạn, nhưng bạn có thể muốn xóa khoảng trắng để các tệp tuân theo chuẩn XML và bạn không còn thấy lỗi này.

    Lỗi HTTP [mã cụ thể]
    Google đã gặp phải lỗi HTTP khi đang cố gắng tải xuống sơ đồ trang web của bạn. Thông báo này sẽ hiển thị mã trạng thái chúng tôi nhận được (ví dụ: 404). Đảm bảo rằng URL của sơ đồ trang web mà bạn chỉ định là đúng và sơ đồ trang web đó có ở vị trí bạn chỉ định. Sau đó, gửi lại sơ đồ trang web của bạn.

    Hình thu nhỏ quá lớn
    Hình thu nhỏ video được xác định trong sơ đồ trang web của bạn quá lớn. Xem trang Phòng thí nghiệm sơ đồ trang web video để biết thêm thông tin. Đổi kích thước hình thu nhỏ video của bạn sang 160x120px. Cập nhật sơ đồ trang web của bạn với thông tin mới rồi gửi lại. Thêm thông tin về việc thêm thông tin video vào sơ đồ trang web.

    Hình thu nhỏ quá nhỏ
    Hình thu nhỏ video được xác định trong sơ đồ trang web của bạn quá nhỏ. Đổi kích thước hình thu nhỏ video của bạn sang 160x120px. Cập nhật sơ đồ trang web của bạn nếu cần thiết.

    Vị trí video và vị trí trang phát giống nhau
    Trong một sơ đồ trang web video, URL nội dung video và URL trình phát không được giống nhau. Nếu bạn cung cấp cả <video:player_loc> và <video:content_loc>, các URL phải khác nhau.

    URL vị trí video dường như là URL trang phát
    Trong một sơ đồ trang web video, URL <video:content_loc> trỏ đến trang chứa trình phát.

    Googlebot bị chặn bởi robots.txt
    Google không thể truy cập sơ đồ trang web của bạn, hoặc không thể truy cập vào tất cả các nội dung được liệt kê trong sơ đồ trang web của bạn vì nó bị chặn bởi robots.txt. Xác minh bằng cách sử dụng trình kiểm tra robots.txt để xác nhận tệp nào đang chặn Googlebot và sửa đổi tệp robots.txt của bạn để cho phép Googlebot truy cập sơ đồ trang web.
     

Chia sẻ trang này