Getting Lighthouse scores from HTTPArchive for sites in India.

Я собираюсь отправиться в короткую поездку в Индию, и я думал о долгосрочных отношениях с разработчиками для Chrome и Web в регионе. Как и в большинстве поездок, мне нравится делать немного исследований загодя, поэтому я могу лучше понять, как выглядит веб-сайт с точки зрения страны, в которой я посещаю.

За последние пару месяцев я следил за обновлениями HTTPArchive, и было замечательно видеть улучшения в отношении типов данных, которые он собирает и хранит в своем BigQuery. Одна конкретная информация, представляющая большой интерес для меня, - это данные Маяк, сгенерированные при каждом запуске HTTPArchive. С этими данными я был заинтересован, чтобы увидеть, могу ли я использовать его, чтобы получить снимок данных и получить представление на высоком уровне о том, как люди могут испытывать Интернет в стране.

Хорошей новостью является то, что анализировать данные маяка в HTTPArchive не так уж сложно.

Тем не менее, для моих нужд сложнее понять, что такое «верхний сайт» в любой стране, особенно когда я думаю о работе разработчиков, которые мы могли бы и должны делать.

Вот как я нарушил проблему. В каждой стране существует множество типов разработчиков, которые строят для Интернета, и лично я склоняю их к трем группам: те, чей текущий проект нацелен на местный рынок; Те, которые нацелены на внешний рынок (я строю для экспорта); и те, которые нацелены на глобальную аудиторию.

Когда я думаю об этих трех группах, практически невозможно выработать цель сайта и людей, стоящих за ним. Но есть несколько эвристик, которые вы можете использовать, по крайней мере, для того, чтобы вы могли рассуждать и понимать данные.

Для моего анализа я не думал, что могу получить список лучших сайтов, посещаемых пользователями в Индии, поэтому я сделал простое предположение, что домены «.in» скорее всего будут созданы для людей в Индии. Чувствительность и специфичность для вопроса о «индийских сайтах» не на 100%, если сосредоточиться на «.in domains» & mdash; пользователи во всем мире любят использовать опыт, который не просто заблокирован для TLD стран; но это кажется приличной мерой состояния индийских сайтов в качестве первого прохода.

Этот тип анализа оказывается довольно простым. Вы открываете BigQuery и находите последнюю таблицу, содержащую запуск данных Lighthouse [httparchive: маяк .2018_08_01_mobile] в этом случае и выполните следующий запрос.

SELECT
  url,
  JSON_EXTRACT(report, '$.categories.seo.score') AS [seo_score],
  JSON_EXTRACT(report, '$.categories.pwa.score') AS [pwa_score],
  JSON_EXTRACT(report, '$.categories.performance.score') AS [speed_score],
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS [accessibility_score]
FROM
  [httparchive:lighthouse.2018_08_01_mobile]
WHERE
  url LIKE '%.in/'

Вышеприведенный запрос фильтруется по доменам, заканчивающимся на «.in», и возвращает показатель Lighthouse для каждой категории тестов Lighthouse. Данные Lighthouse хранятся как объект JSON, который необходимо извлечь из требуемых компонентов с помощью синтаксиса XPath для JSON.

Количество результатов на самом деле довольно большое и не очень полезно для представления здесь, но я сделал их в гистограмме.

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 46 279 25
0,5 84 13992 6502 3973
0.7 3391 1400 2222 7585
0.8 1438 19 1147 2374
0.9 2762 9 1545 1069
1 7752 13 3189 434

Необходимо провести подробный анализ и анализ данных, чтобы точно понять, какие конкретные проблемы влияют на результаты, однако в некоторых случаях, например, с помощью показателя «PWA Score», я видел в прошлом достаточное количество баллов в прошлом, чтобы знать какие проблемы влияют на общий балл, и я вижу некоторые из проблем, которые впереди нас.

Следующий. Попытайтесь найти способ получить сайты, которые часто посещают индийские пользователи ... Подсказка, это [здесь](/ crux-topsites-and-lighthouse-scores-for-india /)

About Me: Paul Kinlan

I lead the Chrome Developer Relations team at Google.

We want people to have the best experience possible on the web without having to install a native app or produce content in a walled garden.

Our team tries to make it easier for developers to build on the web by supporting every Chrome release, creating great content to support developers on web.dev, contributing to MDN, helping to improve browser compatibility, and some of the best developer tools like Lighthouse, Workbox, Squoosh to name just a few.