- Што такое XML Sitemap?
- Дзе жывуць XML Sitemaps?
- Якія URL - адрасы павінны быць уключаны ў XML Sitemap?
- Коды HTTP Status
- Noindexed і Disallowed Старонкі
- Некананічныя URL - адрас
- Ці павінны быць уключаны Кожны Clean URL 200 Статус?
- Карта сайта Абмежаванні і індэксны файлы
- Тыпы XML Sitemaps
- Дынамічныя і статычныя
- Прадстаўленне Інструменты для вэб - майстроў
- У Google Search Console
- У меню Інструменты для вэб - майстроў Bing
XML Sitemaps мае вырашальнае значэнне, каб дапамагчы пошукавым сістэмам сканаваць вэб-сайты, але я часта бачу кліент з крытычнымі памылкамі ў іх XML Sitemaps. Гэта праблема, таму што пошукавыя сістэмы могуць ігнараваць сайтмепы, калі яны неаднаразова сутыкаюцца з памылкамі URL пры сканаванні іх.
Што такое XML Sitemap?
XML Sitemap ўяўляе сабой XML-файл, які змяшчае структураваны спіс URL-адрасоў, які дапамагае пошукавым сістэмам сканавання вэб-сайтаў. Ён распрацаваны спецыяльна для пошукавых сістэм - ня людзі - і выступае ў якасці дадатку. У той час як пошукавыя робаты, як Googlebot будзе сканаваць сайты і пераходзіць па спасылках, каб знайсці старонкі, то XML карта сайта можа выступаць у якасці падстрахоўкі, каб дапамагчы Googlebot знайсці старонкі, якія не так лёгка атрымаць па абыходу сайта (як правіла, называюць востраў старонкі, калі няма спасылкі убудаваны ў іх).
Дзе жывуць XML Sitemaps?
XML карта сайта жыве ў каранёвай тэчцы, адразу пасля таго, як дамен, і часта варта назвах, такія як domain.com/sitemap.xml. Заява Карты сайта таксама павінна быць змешчана ў файле robots.txt, так што Google можа лёгка выявіць яго, калі ён скануе файл robots.txt.
Якія URL - адрасы павінны быць уключаны ў XML Sitemap?
URL-адрасы, уключаныя ў XML карты сайта павінны быць адрасы, якія прызначаны для сканавання, індэксуюцца і ранжыру ў выніках пошуку. URL-адрас павінен адпавядаць наступным канкрэтным крытэрам для таго, каб быць уключаны:
- Толькі 200 OK URL-адрасы: няма памылкі 404, 301-е і г.д.
- Спіс старонак без NoIndex тэга
- Спіс старонак без кананізаваныя ў іншым месцы
- Спіс старонак без заблакаваныя ў файле robots.txt
Коды HTTP Status
Карта сайт URL-адрас павінен вяртаць чыстыя 200 кодаў стану. Гэта азначае, што не 301 або 302, пераадрасоўвае памылкі 404, 410 памылкі ці іншым чынам. Google не будзе індэксаваць старонкі, якія вяртаюць 404 памылкі, і калі Googlebot робіць сутыкнуцца з Пераадрасаваннем 301, гэта, як правіла, наступныя за ім і знайсці URL прызначэння, то індэкс гэтага.
Калі ў вас ёсць памылкі 404, першае пытанне, чаму: быў URL разметкі старонкі змяніліся? Калі гэта так, разгледзім перанакіроўваць гэты URL шляхам размяшчэння новага URL. Вазьміце гэты новы URL-адрас і пераканайцеся, што ўключана ў карту сайта.
Калі ёсць 301-е ці 302s, ісці за імі ў URL прызначэння (які павінен быць 200) і замяніць перанакіраваны URL на карце сайта.
Noindexed і Disallowed Старонкі
Калі старонка мае NoIndex тэг, то ён відавочна не прызначаны для індэксавання, так што гэта спрэчнае пытанне, каб уключыць яго ў XML карты сайта. Аналагічным чынам, калі старонка заблакаваная з сканавання з дапамогай файла robots.txt, гэтыя адрасы не павінны быць уключаны таксама.
Калі ў вас ёсць noindexed або забароненыя старонкі ў вашым XML карты сайта, паўторна ацаніць, ці павінны яны быць заблякаваныя. Можа быць, у вас ёсць падробленыя правілы robots.txt або NoIndex тэгаў, якія павінны быць выдаленыя. ]
Некананічныя URL - адрас
Калі старонка ў карце сайта мае кананічны тэг, які паказвае на іншую старонку, а затым выдаліць гэты URL і замяніць яго кананізаваны адзін.
Ці павінны быць уключаны Кожны Clean URL 200 Статус?
Карацей кажучы, няма. Асабліва на вельмі вялікіх сайтах, гэта можа мець сэнс усталяваць прыярытэты найбольш важныя старонкі і ўключае ў XML Sitemap. Панізіць прыярытэт, менш важныя старонкі могуць быць апушчаны. Проста таму, што старонка не ўключана ў XML карты сайта не азначае, што ён не будзе сканаваць і індэксаваць.
Карта сайта Абмежаванні і індэксны файлы
XML карта сайта можа ўтрымліваць толькі 50000 URL або дасягаюць памеру файла 10Мб. Sitemaps, якія перавышаюць гэты мяжа можа атрымаць часткова праглядацца або цалкам ігнаруюцца. Калі сайт мае больш за 50000 URL-адрасоў, вам трэба стварыць некалькі сайтмепов.
Гэтыя дадатковыя Sitemaps могуць быць размешчаны з выкарыстаннем iндэкса Sitemap файл. Гэта ў асноўным карта сайта, які мае іншыя сайтмепов звязаныя ўнутры яго. Замест таго, у тым ліку некалькі сайтмепов ў файле robots.txt, толькі індэксны файл павінен быць уключаны.
Калі занадта шмат спасылак, каб змясціцца ў адну карце сайта, URL павінен быць старанна і метадычна структураваны ў іерархічным Sitemaps. Іншымі словамі, раздзелы сайта ці групы ўкладзеных тэчак у адной і той жа карты сайта, так што Google можа атрымаць лепшае разуменне таго, як URL-адрасы ўзаемазвязаны. гэта патрабуецца ці што? Няма, але гэта мае сэнс быць стратэгічным.
Тыпы XML Sitemaps
У дадатак да стварэння сайтмепов для старонак, Sitemaps можа (і павінен) быць створаны для тыпаў іншых сродкаў масавай інфармацыі, уключаючы выявы, відэа і г.д.
Дынамічныя і статычныя
У залежнасці ад CMS і як ён настроены, карта сайта можа быць дынамічным, гэта значыць ён будзе аўтаматычна абнаўляцца, каб ўключаць новыя URL. Калі ён правільна наладжаны, ён будзе выключыць усе вышэйзгаданыя URL-адрасы, якія не павінны быць уключаны. На жаль, дынамічныя Sitemaps не заўсёды дзейнічаюць такім чынам.
Альтэрнатывай з'яўляецца статычнай карты сайта, якія могуць быць лёгка створаны з дапамогай Якія крычаць жабы SEO павука. Статычныя Sitemaps прапануюць большы кантроль над тым, што ўключаны URL-адрас, але не абнаўляюцца аўтаматычна, каб уключыць новыя URL. У некаторых выпадках я рэкамендаваў кліент выкарыстоўваць статычныя сайтмепы калі дынамічная карта сайт не можа быць настроена для задавальнення карты сайта крытэраў. Калі гэта адбудзецца, я ўсталяваць напамін, каб забяспечыць абноўленую карту сайта, як правіла, штоквартальна, або часцей, калі новыя старонкі часта дадаюцца на сайт.
Прадстаўленне Інструменты для вэб - майстроў
Пасля таго, як XML-карта сайта быў створаны і загружаны, ён заўсёды павінен быць прадстаўлены Google Search Console і Інструменты для вэб-майстроў Bing забяспечыць сканеры доступ да яго (у дадатку да robots.txt дэкларацыі).
У Google Search Console
Перайдзіце на старонку Сканіраванне> Sitemaps і ў правым верхнім куце вы ўбачыце опцыю Add / Test Sitemap. Націсніце, што і вы можаце адправіць URL вашага файла Sitemap для сканавання.
У меню Інструменты для вэб - майстроў Bing
Ад галоўнай панэлі кіравання, перайдзіце да падзелу Sitemaps і націсніце кнопку «Адправіць Sitemap» ў правым ніжнім куце. Там вы можаце ўвесці URL вашага файла Sitemap.
Што такое XML Sitemap?
Дзе жывуць XML Sitemaps?
Якія URL - адрасы павінны быць уключаны ў XML Sitemap?
Што такое XML Sitemap?
Дзе жывуць XML Sitemaps?
Якія URL - адрасы павінны быць уключаны ў XML Sitemap?
Калі ў вас ёсць памылкі 404, першае пытанне, чаму: быў URL разметкі старонкі змяніліся?
Ці павінны быць уключаны Кожны Clean URL 200 Статус?
Гэта патрабуецца ці што?