Латентно-семантичне індексування (latent semantic indexing, LSI) - це алгоритм пошукових систем для аналізу веб-сторінок, який враховує не тільки ключові слова / фрази на сторінці, а й присутність їх синонімів, а також слів, які пов'язані із запитом тематично. Алгоритм спрямований на те, щоб в топі видачі виявилися документи, що найповніше відповідають пошуковому запиту.
Походження терміна LSI
LSI є окремим випадком латентно-семантичного аналізу (latent semantic analysis, LSA) стосовно до пошукових систем. Це метод автоматизованого аналізу семантики (сенсу) текстів, який був запатентований в кінці 1980-х років. Він застосовується в тих областях, де потрібно автоматизована обробка великої кількості документів:
- класифікація;
- індексація;
- пошук.
Алгоритм визначає семантичну структуру тексту і знаходить неявні, латентні зв'язку між елементами документа. Для цього використовується база термінів, семантично (за змістом) пов'язаних зі словами з пошукового запиту. Тому система повертає документи не тільки з точним входженням запиту, але і близькі за змістом.
Завдяки алгоритму LSI пошукові системи навчилися розпізнавати помилки, розрізняти синоніми і омоніми, «засвоювати» неологізми. Латентно-семантичний аналіз застосовується, наприклад, в таких системах, як:
- системи розпізнавання мови;
- системи оптичного розпізнавання символів (OCR).
Принцип дії
При аналізі нового тексту LSI-робот порівнює його з наявною базою трастових сайтів з даної тематики, враховує кількість тематичних слів і синонімів, визначає семантичне ядро сторінки. Враховується і кількість відмов, закриття сторінки відразу після завантаження - стаття повинна зацікавити читача. Виходячи з цього, робот «вирішує», яке місце визначити тексту у видачі.
Таким чином, відсівається SEO-контент, напханий ключами, але не містить корисної інформації. А також тексти з нетематичними ключами. В результаті користувач отримує дійсно корисну статтю по темі, а не порожній SEO-текст для просування сайту.
LSI-копірайтинг
На початку 2010-х років в англомовному інтернеті з'явився термін LSI-копірайтинг, як протиставлення SEO-копірайтингу. Мається на увазі, що LSI-копірайтер пише корисні тексти, повністю розкривають тему, що відповідають на пошуковий запит, тобто цікаві для користувача. На противагу SEO-копірайтер, який конструює текст по заданій щільності ключових слів, водності, тошнотно, тобто цікаві для ПС. З'явилися сервіси та програми, які складають списки LSI-ключів для будь-якого запиту.
Насправді, LSI є еволюцію пошукової оптимізації, еволюцію SEO. На англомовних сайтах в ходу такі терміни, як органічне SEO, SEO-LSI, тобто контент, орієнтований більше на людину, ніж на пошукового робота. Завдяки алгоритмам латентно-семантичного індексування в топ видачі виходять статті експертного рівня.