- Што ўяўляе сабой файл часопіса?
- Доступ да лог-файлаў
- Што такое Log Analysis?
- Як зрабіць аналіз часопісаў
- Тэхнічны SEO Insights ў рэгістрацыйных дадзеных
- Bot Crawl Volume
- Памылкі кода адказу
- часовыя пераадрасоўвае
- Crawl Бюджэт адходаў
- Паўтараюцца URL Crawling
- Crawl Прыярытэт
- Апошні Crawl Дата
- Crawl Бюджэт
Гэта 10:00. Вы ведаеце, дзе вашыя часопісы?
Я ўяўляю гэта кіраўніцтва з каламбур на агульную заяву грамадскага абслугоўвання які працуе на паўночных ТБ трансляцыі навін у Злучаных Штатах, так як аналіз часопіса з'яўляецца тое, што надзвычай важна і заслугоўвае асвятлення ў друку.
Калі тэхнічная і на старонцы SEO бедная, то нічога іншага, што вы сапраўды будзе мець значэння. Тэхнічны SEO з'яўляецца ключавым, каб дапамагчы пошукавым сістэмам сканаваць, аналізаваць і індэксаваць сайты і тым самым ранжыраваць іх адпаведным чынам задоўга да пачатку якой-небудзь маркетынгавай працы.
Важна памятаць: Вашы файлы часопіса ўтрымліваюць толькі дадзеныя, якія 100% дакладным з пункту гледжання таго, як пошукавыя сістэмы сканавання вашага сайта. Дапамагаючы Google, каб рабіць сваю працу, вы заклалі аснову для будучай працы SEO і зрабіць вашу працу лягчэй. Аналіз часопіса з'яўляецца адным з аспектаў тэхнічнага SEO, і выпраўленне выяўленых праблем у часопісах дапаможа прывесці да павышэння рэйтынгу, больш трафіку і больш канверсіі і продажаў.
Вось толькі некалькі прычын, чаму:
- Занадта шмат памылак коды адказу могуць прывесці да Google, каб паменшыць яго поўзанне вашага сайта і, магчыма, нават ваш рэйтынг
- Вы хочаце, каб пераканацца, што пошукавыя сістэмы не паўзуць ўсё новыя і старыя, што вы хочаце, каб з'явіцца і ранг ў выніках пошуку (і больш нічога)
- Вельмі важна, каб усе URL перанакіравання будуць праходзіць уздоўж любога якое ўваходзіць «спасылкі соку»
Аднак, часопіс аналізу з'яўляецца тое, што, на жаль, абмяркоўваецца занадта рэдка ў SEO колах. Такім чынам, вось, я хацеў бы даць Mozzers уступнае кіраўніцтва для ўваходу аналітыкі, якія, я спадзяюся, дапаможа грамадству. Калі ў вас ёсць якія-небудзь пытанні, не саромейцеся задаваць у каментарах!
Што ўяўляе сабой файл часопіса?
Кампутарныя серверы, аперацыйныя сістэмы, сеткавыя прылады і кампутарныя прыкладання аўтаматычна генераваць то , што называецца запіс у часопісе кожны раз , калі яны выконваюць дзеянне. У SEO і лічбавай сувязі маркетынгу, адзін тып дзеянняў, калі старонка запытваюцца прыезджым ботам або чалавекам.
Запісы ў часопісе сервера спецыяльна запраграмаваныя быць выведзеныя ў Common Log Format з кансорцыума W3C , вось адзін прыклад з Вікіпедыі з суправаджаючымі маімі тлумачэннямі:
Заўвага: прочыркі паказаны як - у полі , калі гэтая інфармацыя недаступная.
Кожны раз, калі вы - ці Googlebot - наведайце старонку на вэб-сайце, лінія з гэтай інфармацыяй выводзіцца, запісваецца і захоўваецца на серверы.
Запісы часопіса генеруюцца ўвесь час і ў любым месцы ад некалькіх да тысяч могуць быць створаны кожны другі - у залежнасці ад узроўню дадзенага сервера, сеткі або актыўнасці прыкладання. Калекцыя запісаў часопіса называецца файл часопіса (ці часта ў слэнгу, «рэгістрацыйнага часопіса" ці "часопісы»), і гэта супрацьлегласць блога ў тым , што самая апошняя запіс часопіса знаходзіцца ў ніжняй частцы . Асобныя файлы часопісаў часта ўтрымліваюць каштоўнасць каляндарнага дня запісаў часопіса.
Доступ да лог-файлаў
Розныя тыпы сервераў крамы і кіраваць файламі часопісаў па-рознаму. Вось агульныя кіраўніцтва па пошуку і кіраванні дадзенымі часопіса на трох найбольш папулярных тыпаў сервераў:
Што такое Log Analysis?
Log аналіз (або аналітыка часопіса) з'яўляецца працэсам праходжання праз лог-файлы для дадзенай мэты. Некаторыя агульныя прычыны ўключаюць у сябе:
- Распрацоўка і забеспячэнне якасці (QA) - Стварэнне праграмы або прыкладання і праверкі праблемных памылак , каб пераканацца , што ён працуе правільна
- Ліквідацыю непаладак з сеткай - адказ на і выпраўленне памылак сістэмы ў сеткі
- Абслугоўванне кліентаў - Вызначэнне таго , што здарылася , калі кліент меў праблемы з тэхнічным прадуктам
- Пытанні бяспекі - Расследаванне выпадкаў узлому і іншых ўварванняў
- Пытанні адпаведнасці - Збор інфармацыі ў адказ на карпаратыўныя або дзяржаўныя палітыкі
- Тэхнічны SEO - Гэта мой каханы! Але пра гэта ніжэй.
Аналіз часопіса рэдка рэгулярна. Як правіла, людзі ідуць у лог-файлы толькі ў адказ на што-то - памылка, хак, позвай, памылкі або няспраўнасці. Гэта не тое, што хто-небудзь хоча зрабіць на пастаяннай аснове.
Чаму? Гэта скрыншот нашага зроку толькі вельмі невялікая частка арыгінальнага (неструктураваных) файла часопіса:
Нав. Калі вэб-сайт атрымлівае 10000 наведвальнікаў, кожны з якіх ідуць на дзесяць старонак у дзень, то сервер будзе ствараць файл часопіса кожны дзень, які будзе складацца з 100000 запісаў. Ніхто не мае часу, каб прайсці праз усё гэта ўручную.
Як зрабіць аналіз часопісаў
Ёсць тры асноўных спосабу зрабіць аналіз лог прасцей у SEO або любым іншым кантэксце:
- Зрабі сябе ў Excel
- Ўласныя праграмы, такія як Splunk або сумо-логіка
- Праграмнае забеспячэнне з адкрытым зыходным кодам ELK Stack
Цім Рэзнік ў Мос эсэ ад некалькіх гадоў таму правядзе вас праз працэс экспарт пакета файлаў часопіса ў Excel , Гэта (адносна) хуткі і просты спосаб зрабіць просты аналіз часопіса, але недахопам з'яўляецца тое, што адзін будзе бачыць толькі здымак ў часе, а не нейкія агульныя тэндэнцыі. Для таго, каб атрымаць лепшыя дадзеныя, важна выкарыстоўваць або прапрыетарныя інструменты, або ELK стэку.
Splunk і сумо-Logic з'яўляюцца ўласнымі інструментамі аналізу часопіса, якія ў асноўным выкарыстоўваюцца карпаратыўнымі кампаніямі. ELK Стэк з'яўляецца свабодным і адкрытым зыходным кодам партыі з трох платформаў (Elasticsearch, Logstash і Kibana), які належыць эластычны і выкарыстоўваюцца часцей малым бізнесам. (Раскрыццё інфармацыі: Мы ў Logz.io выкарыстоўваць ELK Stack кантраляваць ўласныя ўнутраныя сістэмы, а таксама за аснову нашага ўласнага праграмнага забеспячэння для кіравання часопісам.)
Для тых, хто зацікаўлены ў выкарыстанні гэтага працэсу, каб зрабіць тэхнічны аналіз SEO, маніторынг сістэмы або прадукцыйнасць прыкладанняў, або па любой іншай прычыне, наш генеральны дырэктар, Томер Леві напісаў кіраўніцтва па разгортванні ELK Stack ,
Тэхнічны SEO Insights ў рэгістрацыйных дадзеных
Тым не менш вы вырашылі адкрыць і зразумець вашыя дадзеныя часопіса, ёсць шмат важных пытанняў тэхнічнага SEO па рашэнні праблемы па меры неабходнасці. Я ўключыў скрыншоты нашай тэхнічнай прыборнай панэлі SEO з дадзенымі нашага ўласнага вэб-сайта, каб прадэманстраваць, што для вывучэння ў часопісах.
Bot Crawl Volume
Гэта важна ведаць колькасць запытаў за пэўны перыяд часу на Baidu, BingBot, GoogleBot, Yahoo, Yandex, «Іншыя» і «Усё» на працягу пэўнага перыяду часу. (Я вылучыў Google.) Калі, напрыклад, вы хочаце, каб знайсці ў выніках пошуку ў Расіі, але Яндэкс ня сканаваць ваш сайт, гэта праблема. (Вы хочаце пракансультавацца Яндэкс Вэбмайстар і гэтую артыкул на Search Engine Land.)
Памылкі кода адказу
Мос маюць вялікую грунтоўку на Значэння розных кодаў стану , У мяне ёсць папярэджанне налады сістэмы, якая кажа мне пра 4xx і 5xx ў памылках адразу, таму што тыя вельмі важныя.
часовыя пераадрасоўвае
Часовыя 302 пераадрасоўвае не праходзяць па «спасылачныя» знешніх спасылак са старога URL на новы. Амаль увесь час, яны павінны быць зменены на 301 рэдырэкт.
Crawl Бюджэт адходаў
Google прысвойвае бюджэт поўзаць на кожны вэб-сайт на аснове шматлікіх фактараў , Калі паўзці бюджэт, скажам, 100 старонак у дзень (або эквівалентнае колькасць дадзеных), то вы хочаце, каб пераканацца, што ўсе 100 рэчы, якія вы хочаце, каб з'явіцца ў выніках пошуку. Незалежна ад таго, што вы пішаце ў вашым robots.txt тэгі файлаў і мета-робаты , Вы ўсё роўна будзеце марнаваць свой бюджэт поўзаць на рэкламных мэтавых старонак, ўнутраныя скрыпты і многае іншае. Бярвёны скажуць вам - я выклаў два прыкладу сцэнара на аснове чырвонага колеру вышэй.
Калі вы выдаткуецца поўзаць, але ўсё яшчэ ёсць новы змест, якое павінна быць праіндэксаваныя з'яўляцца ў выніках пошуку, Google можа адмовіцца ад вашага сайта, перш чым знайсці яго.
Паўтараюцца URL Crawling
Даданне параметраў URL - звычайна выкарыстоўваюцца для адсочвання для мэт маркетынгу - часта прыводзіць у пошукавых сістэмах расточительствуя бюджэты абыходу шляхам сканавання рознай URL-адрасоў з аднолькавым зместам. Каб даведацца, як вырашыць гэтую праблему, я рэкамендую прачытаць рэсурсы на Google і Search Engine Land тут , тут , тут , і тут ,
Crawl Прыярытэт
Google можа быць ігнараванне (а не поўзаць або індэксацыі) важную старонку або профіль вашага сайта. Часопісы пакажа, што URL-адрасы і / або каталогі атрымліваюць найбольшае і найменшае ўвагу. Калі, напрыклад, вы апублікавалі электронную кнігу, якая спрабуе заняць месца для мэтавых пошукавых запытаў, але ён сядзіць у дырэкторыі, Google толькі наведвае адзін раз кожныя шэсць месяцаў, то вы не атрымаеце любы арганічны пошукавы трафік электроннай кнігі на тэрмін да шасці месяцаў.
Калі частка вашага сайта не паўзла вельмі часта - і яна абнаўляецца досыць часта, што гэта павінна быць - то вам, магчыма, спатрэбіцца праверыць ўнутранае сшыванне структуры і поўзаць прыярытэтныя налады ў вашым XML карты сайта ,
Апошні Crawl Дата
Вы загрузілі нешта, што вы спадзяецеся будзе індэксавацца хутка? Файлы часопіса раскажа вам, калі Google прасканаваў яго.
Crawl Бюджэт
Адна рэч, якую я асабіста хацеў бы праверыць і паглядзець у рэальным часе актыўнасць Googlebot на нашым сайце, таму што бюджэт поўзаць, што пошукавая сістэма прысвойвае сайт з'яўляецца грубым індыкатарам - вельмі грубы адзін - колькі гэта "любіць" ваш сайт. Google у ідэале не жадае марнаваць каштоўны час паўзе на дрэнны сайт. Вось, я бачыў, што Googlebot зрабіў 154 запытаў вэб-сайт нашага новага стартапа за папярэднія дваццаць чатыры гадзіны. Будзем спадзявацца, што гэты лік будзе ісці ўверх!
Як я спадзяюся, што вы можаце ўбачыць, аналіз часопіса з'яўляецца крытычна важным у тэхнічным SEO. Гэта адзінаццаць гадзін - вы ведаеце, дзе вашыя часопісы цяпер?
Выкарыстоўвайце Logz.io для маніторынгу вашых часопісаў сервера
нататка: Гэты артыкул першапачаткова з'явілася на Moz ,
Што ўяўляе сабой файл часопіса?00. Вы ведаеце, дзе вашыя часопісы?
Што ўяўляе сабой файл часопіса?
Чаму?
Гэта адзінаццаць гадзін - вы ведаеце, дзе вашыя часопісы цяпер?