Getting Lighthouse scores from HTTPArchive for sites in India.

Paul Kinlan
Available in: English (Original) Deutsch Español Français 日本語 मानक हिन्दी tiếng Việt தமிழ் bahasa Indonesia

Я собираюсь отправиться в короткую поездку в Индию, и я думал о долгосрочных отношениях с разработчиками для Chrome и Web в регионе. Как и в большинстве поездок, мне нравится делать немного исследований загодя, поэтому я могу лучше понять, как выглядит веб-сайт с точки зрения страны, в которой я посещаю.

За последние пару месяцев я следил за обновлениями HTTPArchive, и было замечательно видеть улучшения в отношении типов данных, которые он собирает и хранит в своем BigQuery. Одна конкретная информация, представляющая большой интерес для меня, - это данные Маяк, сгенерированные при каждом запуске HTTPArchive. С этими данными я был заинтересован, чтобы увидеть, могу ли я использовать его, чтобы получить снимок данных и получить представление на высоком уровне о том, как люди могут испытывать Интернет в стране.

Хорошей новостью является то, что анализировать данные маяка в HTTPArchive не так уж сложно.

Тем не менее, для моих нужд сложнее понять, что такое «верхний сайт» в любой стране, особенно когда я думаю о работе разработчиков, которые мы могли бы и должны делать.

Вот как я нарушил проблему. В каждой стране существует множество типов разработчиков, которые строят для Интернета, и лично я склоняю их к трем группам: те, чей текущий проект нацелен на местный рынок; Те, которые нацелены на внешний рынок (я строю для экспорта); и те, которые нацелены на глобальную аудиторию.

Когда я думаю об этих трех группах, практически невозможно выработать цель сайта и людей, стоящих за ним. Но есть несколько эвристик, которые вы можете использовать, по крайней мере, для того, чтобы вы могли рассуждать и понимать данные.

Для моего анализа я не думал, что могу получить список лучших сайтов, посещаемых пользователями в Индии, поэтому я сделал простое предположение, что домены «.in» скорее всего будут созданы для людей в Индии. Чувствительность и специфичность для вопроса о «индийских сайтах» не на 100%, если сосредоточиться на «.in domains» & mdash; пользователи во всем мире любят использовать опыт, который не просто заблокирован для TLD стран; но это кажется приличной мерой состояния индийских сайтов в качестве первого прохода.

Этот тип анализа оказывается довольно простым. Вы открываете BigQuery и находите последнюю таблицу, содержащую запуск данных Lighthouse [httparchive: маяк .2018_08_01_mobile] в этом случае и выполните следующий запрос.

SELECT
  url,
  JSON_EXTRACT(report, '$.categories.seo.score') AS [seo_score],
  JSON_EXTRACT(report, '$.categories.pwa.score') AS [pwa_score],
  JSON_EXTRACT(report, '$.categories.performance.score') AS [speed_score],
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS [accessibility_score]
FROM
  [httparchive:lighthouse.2018_08_01_mobile]
WHERE
  url LIKE '%.in/'

Вышеприведенный запрос фильтруется по доменам, заканчивающимся на «.in», и возвращает показатель Lighthouse для каждой категории тестов Lighthouse. Данные Lighthouse хранятся как объект JSON, который необходимо извлечь из требуемых компонентов с помощью синтаксиса XPath для JSON.

Количество результатов на самом деле довольно большое и не очень полезно для представления здесь, но я сделал их в гистограмме.

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 46 279 25
0,5 84 13992 6502 3973
0.7 3391 1400 2222 7585
0.8 1438 19 1147 2374
0.9 2762 9 1545 1069
1 7752 13 3189 434

Необходимо провести подробный анализ и анализ данных, чтобы точно понять, какие конкретные проблемы влияют на результаты, однако в некоторых случаях, например, с помощью показателя «PWA Score», я видел в прошлом достаточное количество баллов в прошлом, чтобы знать какие проблемы влияют на общий балл, и я вижу некоторые из проблем, которые впереди нас.

Следующий. Попытайтесь найти способ получить сайты, которые часто посещают индийские пользователи … Подсказка, это здесь

Paul Kinlan

Trying to make the web and developers better.

RSS Github Medium