Проблема SPA и AI-краулеров
Большинство AI-краулеров загружают страницы как простые HTTP-клиенты без выполнения JavaScript. Это включает GPTBot, ClaudeBot, PerplexityBot и большинство LLM-ретривальных систем. Если ваш сайт построен на React, Vue, Angular или другом SPA-фреймворке и рендерит контент исключительно на клиенте, краулер получит пустую страницу с несколькими script-тегами. Для таких сайтов индексация AI-системами фактически равна нулю — не потому что контент плохой, а потому что он невидим.
Что проверяет инструмент
Инструмент загружает страницу без выполнения JavaScript и анализирует четыре показателя. Количество слов: сколько читаемого текста доступно без JS — нормой считается не менее 100–200 слов для контентных страниц. Title и H1: присутствуют ли они в серверном HTML. Признаки SPA: наличие id="root", id="app", пустого <body>, модулей type="module" — характерные маркеры фреймворков без SSR. Соотношение текст/разметка: насколько насыщен HTML реальным текстом.
Server-Side Rendering как решение
Server-Side Rendering (SSR) и статическая генерация (SSG) решают проблему кардинально: сервер возвращает готовый HTML с контентом, который видят и краулеры, и пользователи до загрузки JS. Next.js, Nuxt.js, SvelteKit поддерживают SSR «из коробки». Для уже запущенных SPA можно использовать гибридный подход: Puppeteer или аналогичный инструмент рендерит страницы в HTML-снимки для краулеров. Даже базовая реализация SSR с title, H1 и первым абзацем текста значительно улучшает AI-индексацию.
Почему это критично для современного SEO
Недоступность контента без JS — один из наиболее часто игнорируемых технических факторов в AI-эпоху. Традиционные поисковые системы научились рендерить JS, пусть и с задержкой. AI-агенты для RAG-систем, AI-поиска и автоматических ответов — как правило, нет. Сайт с тысячами страниц, невидимых AI, теряет потенциальные цитирования в ChatGPT, Perplexity и аналогах. Регулярная проверка этого показателя особенно важна после обновлений фронтенда. Если контент доступен — рассмотрите добавление Markdown-версий страниц для ещё более чистой подачи контента AI-агентам.