Using HTTPArchive and Chrome UX report to get Lighthouse score for top visited sites in India.

Paul Kinlan
Available in: English (Original) Deutsch Español 日本語 मानक हिन्दी русский язык tiếng Việt தமிழ் bahasa Indonesia

Comme je l’ai mentionné dans mon post précédent, je commence à planifier plus de travail de relations avec les développeurs en Inde et je veux mieux comprendre comment les utilisateurs en Inde font l’expérience du Web. . Dans cet article, j’ai eu une heuristique très simple pour déterminer un site en Inde, est-ce un domaine «.in». Je savais que ce n’était pas la meilleure façon de voir les choses, mais c’était comme une bonne première.

Ce que je voulais vraiment, c’était un moyen de comprendre les sites visités par les utilisateurs en Inde, puis d’obtenir leur classement en fonction de la popularité du site.

Heureusement, le rapport Chrome UX contient certaines de ces données. Le rapport Chrome UX contient une série de tables dans BigQuery contenant une liste des principales origines visitées par les utilisateurs en Inde (la table est chrome-ux-report.country_in.20180 & mdash; notez le ‘_in’ qui indique le pays). Le rapport Chrome UX contient beaucoup plus de données pour chaque origine, par exemple la vitesse agrégée du site pour les utilisateurs réels, mais je n’avais besoin que des URL.

En utilisant les données du rapport Chrome UX et en les combinant avec le tableau de classement Alexa dans HTTP Archive avec les scores de phare HTTPArchive mentionnés précédemment, nous pouvons avoir une meilleure idée de ce que les utilisateurs en Inde voient réellement.

SELECT
  url, rank,
  JSON_EXTRACT(report, '$.categories.seo.score') AS seo_score,
  JSON_EXTRACT(report, '$.categories.pwa.score') AS pwa_score,
  JSON_EXTRACT(report, '$.categories.performance.score') AS speed_score,
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS accessibility_score
FROM
  `httparchive.lighthouse.2018_08_01_mobile`
JOIN (
  SELECT
    DISTINCT origin,
    Alexa_rank AS rank
  FROM
    `httparchive.urls.20170315`
  JOIN
    `chrome-ux-report.country_in.201807`
  ON
    NET.REG_DOMAIN(origin) = Alexa_domain) AS crux
  ON
    url = CONCAT(origin, '/')
ORDER BY
  rank ASC, url ASC

L’exécution de la requête ci-dessus renvoie beaucoup de données, trop pour Google Sheets. J’ai donc analysé à peu près les 16 000 premiers sites (jusqu’à environ 7 000 dans le classement Alexa). Vous trouverez ci-dessous les données agrégées sans commentaire.

Top 7k

Plage de score Score SEO Score PWA Score de vitesse Score A11Y
0 0 25 149 dix
0.5 45 12253 7841 3925
0.7 1907 3609 2725 6498
0,8 1713 54 1188 2610
0,9 3016 30 1180 1788
1 9278 21 2283 1157
0 0 0 0

Alexa Top 100

Plage de score Score SEO Score PWA Score de vitesse Score A11Y
0 0 0 3 2
0.5 0 2279 1231. 519
0.7 87 703 484 1348
0,8 199 0 198 587
0,9 375 0 261 302
1 2316 0 694 219
0 0 0 0

Alexa Top 1000

Plage de score Score SEO Score PWA Score de vitesse Score A11Y
0 0 1 19 2
0.5 16 5471 3517 1942
0.7 546 1867 1272 2941
0,8 757 9 507 1212
0,9 1077 16 567 719
1 4962 6 1241 550
0 0 0 0

Je pense que les outils que les développeurs et les entreprises ont désormais entre leurs mains peuvent faire une énorme différence dans notre capacité à prendre des décisions raisonnées et fondées sur des principes sur la manière dont les utilisateurs ressentent réellement l’expérience du Web à l’échelle mondiale. Pour moi, ces données me donnent une base sur laquelle je peux me pencher pour voir si nos stratégies pour notre travail dévélé influencent l’écosystème à long terme.

Paul Kinlan

Trying to make the web and developers better.

RSS Github Medium