Using HTTPArchive and Chrome UX report to get Lighthouse score for top visited sites in India.

Как я упоминал в своем [предыдущем посте](/ lighthouse-scores-for-in-domains /), я начинаю планировать работу разработчиков в Индии, и я хочу лучше понять, как пользователи в Индии сталкиваются с веб-сайтом , В этом посте у меня была очень простая эвристика для определения сайта в Индии, это домен «.in». Я знал, что это не лучший способ взглянуть на это, но сначала было хорошо.

То, что я действительно хотел, было способом понять сайты, которые посетили пользователи в Индии, а затем получить их оценки по популярности сайта.

К счастью, в Chrome UX report есть некоторые из этих данных. Отчет Chrome UX содержит серию таблиц в BigQuery, которые содержат список многих из главных истоков, которые посещают пользователи в Индии (таблица «chrome-ux-report.country_in.20180» & ndash; обратите внимание на «_in», который обозначает страна). В отчете Chrome UX имеется гораздо больше данных для каждого источника, например, агрегированная скорость сайта для реальных пользователей, но мне действительно нужны только URL-адреса.

Используя данные из отчета Chrome UX и объединив их с рейтинговой таблицей Alexa в HTTP-архиве вместе с ранее упомянутыми оценками маяка Arthurive, мы можем получить лучшее представление о том, что пользователи в Индии действительно видят.

SELECT
  url, rank,
  JSON_EXTRACT(report, '$.categories.seo.score') AS seo_score,
  JSON_EXTRACT(report, '$.categories.pwa.score') AS pwa_score,
  JSON_EXTRACT(report, '$.categories.performance.score') AS speed_score,
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS accessibility_score
FROM
  `httparchive.lighthouse.2018_08_01_mobile`
JOIN (
  SELECT
    DISTINCT origin,
    Alexa_rank AS rank
  FROM
    `httparchive.urls.20170315`
  JOIN
    `chrome-ux-report.country_in.201807`
  ON
    NET.REG_DOMAIN(origin) = Alexa_domain) AS crux
  ON
    url = CONCAT(origin, '/')
ORDER BY
  rank ASC, url ASC

Выполнение вышеуказанного запроса возвращает много данных, слишком много для Google Таблиц, поэтому я только проанализировал примерно 16 000 сайтов (до 7 тыс. В рейтинге Alexa). Ниже приведены данные, агрегированные без комментариев.

Top 7k

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 25 149 10
0,5 45 12253 7841 3925
0.7 1907 3609 2725 6498
0.8 1713 54 1188 2610
0.9 3016 30 1180 1788
1 9278 21 2283 1157
0 0 0 0

Alexa Top 100

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 0 3 2
0,5 0 2279 1231 519
0.7 87 703 484 1348
0.8 199 0 198 587
0.9 375 0 261 302
1 2316 0 694 219
0 0 0 0

Alexa Top 1000

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 1 19 2
0,5 16 5471 3517 1942
0.7 546 +1867 1272 2941
0.8 757 9 507 1212
0.9 1077 16 567 +719
1 4962 6 1241 550
0 0 0 0

Я думаю, что разработчики и бизнес-инструменты теперь могут в огромной степени влиять на нашу способность принимать обоснованные и принципиальные решения о том, как пользователи на самом деле ощущают опыт Интернета в глобальном масштабе. Для меня эти данные дают мне базовую линию, на которую я могу посмотреть, не повлияют ли наши стратегии на нашу жизнь на эволюцию экосистемы в долгосрочной перспективе.

About Me: Paul Kinlan

I lead the Chrome Developer Relations team at Google.

We want people to have the best experience possible on the web without having to install a native app or produce content in a walled garden.

Our team tries to make it easier for developers to build on the web by supporting every Chrome release, creating great content to support developers on web.dev, contributing to MDN, helping to improve browser compatibility, and some of the best developer tools like Lighthouse, Workbox, Squoosh to name just a few.