Using HTTPArchive and Chrome UX report to get Lighthouse score for top visited sites in India.

Paul Kinlan
Available in: English (Original) Deutsch Español Français 日本語 मानक हिन्दी tiếng Việt தமிழ் bahasa Indonesia

Как я упоминал в своем предыдущем посте, я начинаю планировать работу разработчиков в Индии, и я хочу лучше понять, как пользователи в Индии сталкиваются с веб-сайтом , В этом посте у меня была очень простая эвристика для определения сайта в Индии, это домен «.in». Я знал, что это не лучший способ взглянуть на это, но сначала было хорошо.

То, что я действительно хотел, было способом понять сайты, которые посетили пользователи в Индии, а затем получить их оценки по популярности сайта.

К счастью, в Chrome UX report есть некоторые из этих данных. Отчет Chrome UX содержит серию таблиц в BigQuery, которые содержат список многих из главных истоков, которые посещают пользователи в Индии (таблица «chrome-ux-report.country_in.20180» & ndash; обратите внимание на «_in», который обозначает страна). В отчете Chrome UX имеется гораздо больше данных для каждого источника, например, агрегированная скорость сайта для реальных пользователей, но мне действительно нужны только URL-адреса.

Используя данные из отчета Chrome UX и объединив их с рейтинговой таблицей Alexa в HTTP-архиве вместе с ранее упомянутыми оценками маяка Arthurive, мы можем получить лучшее представление о том, что пользователи в Индии действительно видят.

SELECT
  url, rank,
  JSON_EXTRACT(report, '$.categories.seo.score') AS seo_score,
  JSON_EXTRACT(report, '$.categories.pwa.score') AS pwa_score,
  JSON_EXTRACT(report, '$.categories.performance.score') AS speed_score,
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS accessibility_score
FROM
  `httparchive.lighthouse.2018_08_01_mobile`
JOIN (
  SELECT
    DISTINCT origin,
    Alexa_rank AS rank
  FROM
    `httparchive.urls.20170315`
  JOIN
    `chrome-ux-report.country_in.201807`
  ON
    NET.REG_DOMAIN(origin) = Alexa_domain) AS crux
  ON
    url = CONCAT(origin, '/')
ORDER BY
  rank ASC, url ASC

Выполнение вышеуказанного запроса возвращает много данных, слишком много для Google Таблиц, поэтому я только проанализировал примерно 16 000 сайтов (до 7 тыс. В рейтинге Alexa). Ниже приведены данные, агрегированные без комментариев.

Top 7k

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 25 149 10
0,5 45 12253 7841 3925
0.7 1907 3609 2725 6498
0.8 1713 54 1188 2610
0.9 3016 30 1180 1788
1 9278 21 2283 1157
0 0 0 0

Alexa Top 100

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 0 3 2
0,5 0 2279 1231 519
0.7 87 703 484 1348
0.8 199 0 198 587
0.9 375 0 261 302
1 2316 0 694 219
0 0 0 0

Alexa Top 1000

Диапазон оценки Оценка SEO Оценка PWA Оценка скорости Оценка A11Y
0 0 1 19 2
0,5 16 5471 3517 1942
0.7 546 +1867 1272 2941
0.8 757 9 507 1212
0.9 1077 16 567 +719
1 4962 6 1241 550
0 0 0 0

Я думаю, что разработчики и бизнес-инструменты теперь могут в огромной степени влиять на нашу способность принимать обоснованные и принципиальные решения о том, как пользователи на самом деле ощущают опыт Интернета в глобальном масштабе. Для меня эти данные дают мне базовую линию, на которую я могу посмотреть, не повлияют ли наши стратегии на нашу жизнь на эволюцию экосистемы в долгосрочной перспективе.

Paul Kinlan

Trying to make the web and developers better.

RSS Github Medium