Using HTTPArchive and Chrome UX report to get Lighthouse score for top visited sites in India.

Paul Kinlan
Available in: English (Original) Deutsch Français 日本語 मानक हिन्दी русский язык tiếng Việt தமிழ் bahasa Indonesia

Como mencioné en mi publicación anterior, estoy empezando a planear más trabajo de Relaciones con Desarrolladores en India y quiero obtener una mejor comprensión de cómo los usuarios en India experimentan la web. . En esa publicación tenía una heurística muy simple para determinar un sitio en la India, ¿es un dominio ‘.in’. Sabía que esta no era la mejor manera de verlo, pero me pareció una buena idea.

Lo que realmente quería era una forma de entender los sitios que visitan los usuarios en India y luego obtener sus puntajes clasificados por popularidad del sitio.

Afortunadamente, el informe de Chrome UX contiene algunos de esos datos. El Informe de UX de Chrome tiene una serie de tablas en BigQuery que contienen una lista de muchos de los principales orígenes que visitan los usuarios de India (la tabla es chrome-ux-report.country_in.20180 & mdash; tenga en cuenta el ‘_in’ que denota el país). El informe de Chrome UX tiene muchos más datos para cada origen, como la velocidad agregada del sitio para usuarios reales, pero realmente solo necesitaba las URL.

Usando los datos del informe de Chrome UX y combinándolos con la tabla de clasificación de Alexa en HTTP Archive junto con los puntajes del faro de HTTPArchive mencionados anteriormente, podemos obtener una mejor idea de lo que realmente ven los usuarios en India.

SELECT
  url, rank,
  JSON_EXTRACT(report, '$.categories.seo.score') AS seo_score,
  JSON_EXTRACT(report, '$.categories.pwa.score') AS pwa_score,
  JSON_EXTRACT(report, '$.categories.performance.score') AS speed_score,
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS accessibility_score
FROM
  `httparchive.lighthouse.2018_08_01_mobile`
JOIN (
  SELECT
    DISTINCT origin,
    Alexa_rank AS rank
  FROM
    `httparchive.urls.20170315`
  JOIN
    `chrome-ux-report.country_in.201807`
  ON
    NET.REG_DOMAIN(origin) = Alexa_domain) AS crux
  ON
    url = CONCAT(origin, '/')
ORDER BY
  rank ASC, url ASC

La ejecución de la consulta anterior devuelve una gran cantidad de datos, demasiado para Hojas de cálculo de Google, por lo que solo analicé aproximadamente los mejores 16,000 sitios (hasta aproximadamente 7k en los rankings de Alexa). A continuación están los datos agregados sin comentarios.

Top 7k

Rango de puntuación Puntuación de SEO Puntaje de PWA Puntuación de velocidad Puntuación A11Y
0 0 25 149 10
0.5 45 12253 7841 3925
0.7 1907 3609 2725 6498
0.8 1713 54 1188 2610
0.9 3016 30 1180 1788
1 9278 21 2283 1157
0 0 0 0

Alexa Top 100

Rango de puntuación Puntuación de SEO Puntaje de PWA Puntuación de velocidad Puntuación A11Y
0 0 0 3 2
0.5 0 2279 1231 519
0.7 87 703 484 1348
0.8 199 0 198 587
0.9 375 0 261 302
1 2316 0 694 219
0 0 0 0

Alexa Top 1000

Rango de puntuación Puntuación de SEO Puntaje de PWA Puntuación de velocidad Puntuación A11Y
0 0 1 19 2
0.5 dieciséis 5471 3517 1942
0.7 546 1867 1272 2941
0.8 757 9 507 1212
0.9 1077 dieciséis 567 719
1 4962 6 1241 550
0 0 0 0

Creo que las herramientas que los desarrolladores y las empresas ahora tienen en sus manos pueden marcar una gran diferencia en nuestra capacidad para tomar decisiones razonadas y basadas en principios sobre cómo los usuarios realmente sienten la experiencia de la web a nivel mundial. Para mí, estos datos me dan una línea de base que puedo ver para ver si nuestras estrategias para nuestro trabajo de devolución influyen en el ecosistema a largo plazo.

Paul Kinlan

Trying to make the web and developers better.

RSS Github Medium