- FAQ для Індэксацыі файлаў
- Як шукаць PDF файлы ў Google
- PDF-файлы могуць нават адлюстроўвацца ў Рэкамендаваных фрагментах
- Іншыя тыпы файлаў Indexable by Google
У нядаўняй Google Hangout Джон Мюлер пацвердзіў, што яны індэксуюць файлы PDF гэтак жа, як і на любой іншай вэб-старонцы . Джон Мюлер таксама зразумеў, чаму такі файл PDF не можа быць праіндэксаваны, нягледзячы на гэта.
У Google Hangout наступнае пытанне было зададзена ў той час 18:48 :
Пытанне: Я, здаецца, не магу атрымаць шмат файлаў, праіндэксаваных на маіх старонках. Ці варта дадаць змесціва на ўкладцы прадукту, і гэта ў абодвух месцах? Ці выклікае гэта паўтарэнне праблем і ідэі, чаму яны не будуць праіндэксаваць?
Джон Мюллер : Увогуле мы індэксуем PDF-файлы, як і іншыя звычайныя старонкі на сайце. Верагодна, што адбудзецца з PDF-файламі, гэта тое, што мы не так хутка абнаўляем іх, як звычайныя HTML-старонкі, таму што мы мяркуем, што файлы PDF застаюцца стабільнымі. Але гэта не падобна на вашу праблему. Што тычыцца індэксацыі файлаў PDF, калі мы ўбачым спасылкі на гэтыя старонкі, мы паспрабуем праіндэксаваць гэтыя старонкі, каб атрымаць іх у выніках пошуку.
Джон Мюллер : Так што калі нам не ўдалося праіндэксаваць гэтыя старонкі, альбо ў нас узніклі праблемы з пошукам спасылак на файлы PDF, якія могуць быць таму, што іх цяжка знайсці на сайце, альбо яны не знаходзяцца ў статыстычным HTML, альбо ў іх ёсць nofollow спасылку ці нешта падобнае. Ці, можа быць, проста мы кажам, што ў вас дастаткова змесціва, якое праіндэксавана з вашага сайта. Мы яшчэ не гатовыя дадаць значную партыю большага зместу. Такім чынам, мы не можам гарантаваць, што мы індэксуем усё змесціва на вэб-сайце, а гэта значыць, што для некаторых вэб-сайтаў, у некаторых сітуацыях, мы можам скараціць і сказаць, што мы ўжо праіндэксавалі шмат змесціва з гэтага сайта. Мы будзем працягваць сканаваць больш зместу з гэтага вэб-сайта, і калі мы знойдзем што-то сапраўды пераканаўчае, мы будзем улічваць яго і ў індэкс. Можа быць, гэтыя PDF-файлы - гэта змест, на які мы глядзелі, альбо змест, які мы не паспелі паглядзець з сайта.
Джон Мюллер : Калі ў гэтых PDF-файлах важна змесціва, якое вам трэба праіндэксаваць, то гэта можа быць непасрэдна на старонцы прадукту. Такім чынам, людзі не павінны загружаць PDF на самой справе, каб убачыць гэты змест. Так што, калі гэта важна, магчыма, змясціце яго непасрэдна на старонку. Калі ён з'яўляецца больш дапаможным зместам, напрыклад, даведачным матэрыялам, якімі людзі хочуць паглядзець, але не трэба ацэньваць іх асобна, то, магчыма, гэта проста проста звязаўшы са старонкамі вашага прадукту.
Вы можаце праглядзець адпаведную частку дыскусіі:
FAQ для Індэксацыі файлаў
Гэта не першы раз, калі ўзнікае пытанне пра індэксацыю PDF-файлаў. У Цэнтральны блог для вэб-майстроў яшчэ ў верасні 2011 года Google Gary Illyes адказаў на некалькі пытанняў аб індэксаванні PDF, якія мы прыведам ніжэй:
У цэлым, так, Google робіць сканіраванне PDF-файлаў, калі яны не абаронены або зашыфраваны паролем. Калі тэкст укладзены ў выглядзе малюнкаў, Google можа апрацоўваць гэтыя выявы, каб атрымаць тэкст. Агульнае правіла заключаецца ў тым, што калі вы можаце скапіяваць \ устаўляць тэкст з дакумента PDF, Google павінен мець магчымасць шукаць змесціва PDF і праіндэксаваць змесціва.
Выявы ў файлах PDF не індэксуюцца (па стане на 2011 год).
Спасылкі разглядаюцца гэтак жа, як спасылкі на вэб-старонках. Яны перадаюць PageRank і іншыя сігналы індэксацыі і будуць прытрымлівацца пры сканаванні. Немагчыма "nofollow" спасылкі ў файле PDF.
Вы павінны дадаць "X-Robots-Tag: noindex" у загалоўку HTTP, які выкарыстоўваецца для абслугоўвання файла. Калі яны ўжо праіндэксаваны, то рэалізаваны загаловак прымусіць іх выпасці з цягам часу. Акрамя таго, вы можаце выкарыстоўваць Інструмент для выдалення URL ,
PDF-файлы могуць ранжыраваць падобныя на вэб-старонкі.
Google выкарыстоўвае метададзеныя загалоўкі ў файле і якарны тэкст спасылак, якія паказваюць на файл PDF. Google рэкамендуе ўсталяваць абодва.
Як шукаць PDF файлы ў Google
Як шукаць PDF файлы ў Google
- Выкарыстоўвайце аператар тыпу для пошуку файлаў PDF
Калі вы хочаце шукаць PDF-файлы ў Google, вы можаце выкарыстаць аператар "filetype:".
Для пошуку ў файлах PDF для пошуку па пошце “SEO PDF” увядзіце наступнае:
- тып файла: PDF SEO PDF
- Затым націсніце "Пошук Google".
- На старонцы вынікаў пошуку паказана PDF ў верхняй частцы злева ад кожнага выніку
Вы можаце ўбачыць скрыншот вынікаў на скрыншоце.
PDF-файлы могуць нават адлюстроўвацца ў Рэкамендаваных фрагментах
17 студзеня 2019 г. Кевін Індыг паведаміў у Twitter што Google у цяперашні час выцягвае фрагменты з PDF-файлаў.
Я паспрабаваў гэты прыклад, і ён усё яшчэ працаваў па стане на 26 студзеня. Вы можаце ўбачыць скрыншот ніжэй:
Рэкамендаваны фрагмент з PDF-паказу ў Google. © Вэбмайстар
Вы можаце сказаць, што многія спецыялісты SEO зараз аптымізуюць PDF-файл для пошукавых сістэм.
Іншыя тыпы файлаў Indexable by Google
PDF-файлы - гэта толькі адзін з вялікай колькасці тыпаў файлаў, якія можна праіндэксаваць Google.
Google можа праіндэксаваць змест большасці тыпаў старонак і файлаў, у тым ліку Adobe Flash, дакументаў Microsoft, такіх як Excel і Docs, фармат тэксту, дакументы OpenOffice, PowerPoint і розныя мовы праграмавання.
Вы можаце знайсці поўны спіс індэксуюцца файлы тут ,
Ці варта дадаць змесціва на ўкладцы прадукту, і гэта ў абодвух месцах?Ці выклікае гэта паўтарэнне праблем і ідэі, чаму яны не будуць праіндэксаваць?