Що таке сторінкові теги і журнальні файли для веб-аналізу

Сторінкові теги збирають дані за допомогою веб-браузера відвідувача і відправляють цю інформацію віддалених серверів збору даних. Користувач сервісу аналітики переглядає звіти з віддаленого сервера (рис. 2.1). Зазвичай ця інформація перехоплюється кодом JavaScript (званим тегами або веб-маяками), приміщенні на кожній сторінці сайту. Деякі компанії-розробники також додають кілька нестандартних тегів для збору додаткових даних. Цей метод називається збором даних на стороні клієнта і застосовується, в основному, в зовнішніх мережевих рішеннях постачальника (software as a service (програмне забезпечення як послуга) – SaaS).

Мал. 2.1. Схематичне представлення методології застосування тегів сторінок: сторінкові теги транслюють інформацію віддалених серверів збору даних, тим самим надаючи клієнтові сервісу аналітики можливість переглядати відповідні звіти

Журнальні файли містять дані, зібрані веб-сервером незалежно від браузера відвідувача. Веб-сервер записує всі свої операції в текстовий файл, який зазвичай є локальним, тобто знаходиться в тій же мережі або навіть на тому ж комп’ютері, що і веб-сервер. Користувач сервісу аналітики переглядає звіти з локального сервера, як показано на рис. 2.2. Цей метод, який називається збором даних на стороні сервера, фіксує всі запити до веб-сервера, включаючи сторінки, зображення і PDF-файли; найчастіше даний метод застосовується розробниками самостійного ліцензійного програмного забезпечення.

Раніше завдяки доступності журнальних файлів веб-сервера цей метод найчастіше використовувався для вивчення поведінки відвідувачів сайту. По суті, більшість постачальників послуг Інтернету (ISP) надають безкоштовний аналізатор лог-файли не разом з акаунтами веб-хостингу (до таких програмами-аналізаторів відносяться, наприклад, Analog, Webalizer і AWStats). Хоча, ймовірно, саме так відбувається перше знайомство з веб-аналітикою у більшості користувачів, ці безкоштовні інструменти занадто прості для вивчення поведінки відвідувачів, тому ми не будемо їх розглядати в даній статті.

Мал. 2.2. Схематичне представлення методології застосування журнальних файлів: веб-сервер записує всі свої операції в локальний текстовий файл, тим самим надаючи клієнтові сервісу аналітики можливість переглядати звіти з локального сервера

В останні роки більш популярним і фактично стандартним методом збору інформації про відвідувачів стали теги, що розміщуються на веб-сторінках. Реалізація методу сторінкових тегів не тільки простіше з технічної точки зору, але і пов’язана зі значно меншими вимогами до управління даними, оскільки дані збираються і обробляються зовнішніми SaaS-серверами (постачальника послуг), позбавляючи власника сайту від витрат і турбот з підтримки ліцензійного програмного забезпечення для збору, зберігання та архівування інформації про коктейлі для схуднення.

Потрібно відзначити, що обидва методи, якщо розглядати їх окремо, мають свої обмеження. Відмінності між ними наведені в таблиці нижче. Існує поширений міф про те, що з технічної точки зору метод із застосуванням сторінкових тегів перевершує інші методи, але, як показано в таблиці нижче, все залежить від того, які цілі ви переслідуєте. Але при поєднанні обох методів переваги одного компенсують недоліки іншого. Такий метод називається гібридним, і його пропонують деякі постачальники.

Порівняння методів застосування сторінкових тегів і журнальних файлів

метод переваги недоліки
сторінкові теги Дозволяють розмежувати проксі і кешируєтся сервери – забезпечується більш точне відстеження сеансу.
Відстеження подій на стороні клієнта – наприклад, JavaScript, Flash, Web 2.0 (Ajax).
Фіксування даних електронної торгівлі на стороні клієнта – доступ на стороні сервера буває проблематичним.
Збір та обробка даних про відвідувачів майже в реальному часі.
Дозволяє постачальнику проводити оновлення програми.
Дозволяє постачальнику зберігати і архівувати дані.
Потрібно більше змін в веб-сторінках. Щоб збирати дані, доводиться вносити зміни в сторінки веб-сайту (додавати теги).
Помилки налаштування ведуть до втрати даних. Помилки в тегах ведуть до втрати даних без можливості повернення і повторного аналізу.
Брандмауери можуть спотворити або обмежити теги.
Неможливість відстеження пропускної здатності або вчинені завантажень – теги вьшолняют при запиті сторінки або файлу, а не при завершенні завантаження.
Неможливість відстеження «павуків» пошукових систем – роботи ігнорують теги.
Програма аналізу журнальних файлів Автоматичний збір даних.
Ніякі зміни веб-сторінок не потрібні.
Легкість обробки даних про історію відвіданих сторінок.
Відсутність необхідності турбуватися про проблеми, пов’язані з брандмауером.
Можливість відстеження пропускної здатності і завершених завдань, а також розрізнення повністю і частково завершених завдань.
Виконання за замовчуванням відстеження «павуків» і роботів пошукових систем.
Виконання за замовчуванням відстеження відвідувачів, які використовують мобільні пристрої з доступом в Інтернет.
Похибки, викликані застосуванням проксі і кешируєтся серверів. Якщо сторінка кешируєтся, ніяка запис заношуваності в журнал веб-сервера.
Відсутність відстеження собьггій – наприклад, JavaScript, Flash, Web 2.0 (Ajax).
Необхідність виконання оновлень програми власними силами.
Необхідність збереження та архівування даних власними силами.
Роботи збільшують кількість відвідувань, і це збільшення може бути значним.

Як бачите, переваги одного методу збору даних компенсують недоліки іншого. Але, якщо не брати до уваги безкоштовні інструменти, поки що метод тегів сторінок SaaS знаходить найбільш широке застосування через простоти реалізації і низьких накладних витрат в плані IT і вартості підтримки.

Інші методи збору даних

Хоча в даний час аналіз журнальних файлів і постачання сторінок тегами – найбільш широко використовувані методи збору даних про відвідувачів веб-сайту, вони далеко не єдині. Пристрої збору мережевих даних (аналізатори пакетів) збирають дані про веб-трафіку з маршрутизаторів в апаратні «чорні ящики».

Ще один метод – використання програмного інтерфейсу додатків (API) веб-сервера або завантаження модуля (також званого програмним розширенням, хоча цей термін і зовсім коректний). Це програми, які розширюють можливості веб-сервера – наприклад, записують в журнал додаткові дані. Зазвичай потім зібрані дані в реальному часі направляються на сервер, що генерує звіти.

Ссылка на основную публикацию