Using HTTPArchive and Chrome UX report to get Lighthouse score for top visited sites in India.

Paul Kinlan
Available in: English (Original) Español Français 日本語 मानक हिन्दी русский язык tiếng Việt தமிழ் bahasa Indonesia

Wie ich in meinem vorherigen Beitrag erwähnt habe, fange ich an, mehr Developer Relations in Indien zu planen, und ich möchte ein besseres Verständnis dafür bekommen, wie Benutzer in Indien das Web erleben . In diesem Post hatte ich eine sehr einfache Heuristik, um eine Site in Indien zu bestimmen, ist es eine ‘.in’ Domain. Ich wusste, dass dies nicht der beste Weg war, um es anzuschauen, aber es fühlte sich wie ein guter erster Schritt an.

Was ich wirklich wollte, war eine Möglichkeit, die Websites zu verstehen, die Nutzer in Indien besuchen, und dann ihre Bewertungen nach Beliebtheit der Website zu sortieren.

Glücklicherweise enthält der Chrome UX-Bericht einige dieser Daten. Der Chrome UX Report enthält eine Reihe von Tabellen in BigQuery, die eine Liste mit vielen der Top-Ursprünge enthalten, die Nutzer in Indien besuchen (die Tabelle ist “chrome-ux-report.country_in.20180” & mdash; beachten Sie das “_in”, das angibt das Land). Der Chrome UX-Bericht enthält viel mehr Daten für jeden Ursprung, z. B. die aggregierte Geschwindigkeit der Website für tatsächliche Nutzer, aber ich benötigte wirklich nur die URLs.

Mit den Daten aus dem Chrome UX-Bericht und der Kombination mit der Alexa-Rangliste in HTTP Archive zusammen mit den zuvor erwähnten HTTPArchive-Leuchtturm-Werten können wir ein besseres Bild davon gewinnen, was Nutzer in Indien tatsächlich sehen.

SELECT
  url, rank,
  JSON_EXTRACT(report, '$.categories.seo.score') AS seo_score,
  JSON_EXTRACT(report, '$.categories.pwa.score') AS pwa_score,
  JSON_EXTRACT(report, '$.categories.performance.score') AS speed_score,
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS accessibility_score
FROM
  `httparchive.lighthouse.2018_08_01_mobile`
JOIN (
  SELECT
    DISTINCT origin,
    Alexa_rank AS rank
  FROM
    `httparchive.urls.20170315`
  JOIN
    `chrome-ux-report.country_in.201807`
  ON
    NET.REG_DOMAIN(origin) = Alexa_domain) AS crux
  ON
    url = CONCAT(origin, '/')
ORDER BY
  rank ASC, url ASC

Wenn Sie die obige Abfrage ausführen, werden viele Daten zurückgegeben, die für Google Tabellen zu hoch sind. Daher habe ich nur die Top 16.000 Websites (bis zu etwa 7.000 in den Alexa-Rankings) analysiert. Im Folgenden sind die Daten ohne Kommentar zusammengefasst.

Top 7k

Score-Bereich SEO Ergebnis PWA-Ergebnis Geschwindigkeitswert A11Y Ergebnis
0 0 25 149 10
0.5 45 12253 7841 3925
0.7 1907 3609 2725 6498
0.8 1713 54 1188 2610
0.9 3016 30 1180 1788
1 9278 21 2283 1157
0 0 0 0

Alexa Top 100

Score-Bereich SEO Ergebnis PWA-Ergebnis Geschwindigkeitswert A11Y Ergebnis
0 0 0 3 2
0.5 0 2279 1231 519
0.7 87 703 484 1348
0.8 199 0 198 587
0.9 375 0 261 302
1 2316 0 694 219
0 0 0 0

Alexa Top 1000

Score-Bereich SEO Ergebnis PWA-Ergebnis Geschwindigkeitswert A11Y Ergebnis
0 0 1 19 2
0.5 16 5471 3517 1942
0.7 546 1867 1272 2941
0.8 757 9 507 1212
0.9 1077 16 567 719
1 4962 6 1241 550
0 0 0 0

Ich denke, die Tools, die Entwickler und Unternehmen jetzt in ihren Händen haben, können einen großen Unterschied für unsere Fähigkeit ausmachen, fundierte und prinzipielle Entscheidungen darüber zu treffen, wie Nutzer das Weberlebnis weltweit erleben. Diese Daten geben mir die Basis, auf die ich schauen kann, um zu sehen, ob unsere Strategien für unsere Devrel-Arbeit das Ökosystem langfristig beeinflussen.

Paul Kinlan

Trying to make the web and developers better.

RSS Github Medium