Using HTTPArchive and Chrome UX report to get Lighthouse score for top visited sites in India.

Paul Kinlan
Available in: English (Original) Deutsch Español Français 日本語 मानक हिन्दी русский язык tiếng Việt தமிழ்

Seperti yang saya sebutkan di [posting sebelumnya] saya (/ skor-mercusuar-untuk-di-domain /), saya mulai merencanakan lebih banyak pekerjaan Hubungan Pengembang di India dan saya ingin mendapatkan pemahaman yang lebih baik tentang bagaimana pengguna di India mengalami web . Dalam posting itu saya memiliki heuristik yang sangat sederhana untuk menentukan situs di India, apakah itu domain ‘.in’. Saya tahu bahwa ini bukan cara terbaik untuk melihatnya, tetapi rasanya seperti awal yang baik.

Yang benar-benar saya inginkan adalah cara untuk memahami situs-situs yang dikunjungi pengguna di India dan kemudian mendapatkan peringkat mereka berdasarkan popularitas situs tersebut.

Untungnya laporan Chrome UX memiliki beberapa data tersebut. Laporan UX Chrome memiliki serangkaian tabel di BigQuery yang berisi daftar banyak asal teratas yang dikunjungi pengguna di India (tabelnya adalah chrome-ux-report.country_in.20180 & mdash; catat ‘_in’ yang menandakan negara). Laporan UX Chrome memiliki lebih banyak data untuk setiap asal seperti kecepatan gabungan situs untuk pengguna sebenarnya, tetapi saya benar-benar hanya membutuhkan URL.

Menggunakan data dari laporan Chrome UX, dan menggabungkannya dengan tabel peringkat Alexa di Arsip HTTP bersama dengan skor mercusuar HTTPArchive yang disebutkan sebelumnya, kita bisa mendapatkan gambaran yang lebih baik tentang apa yang sebenarnya dilihat pengguna di India.

SELECT
  url, rank,
  JSON_EXTRACT(report, '$.categories.seo.score') AS seo_score,
  JSON_EXTRACT(report, '$.categories.pwa.score') AS pwa_score,
  JSON_EXTRACT(report, '$.categories.performance.score') AS speed_score,
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS accessibility_score
FROM
  `httparchive.lighthouse.2018_08_01_mobile`
JOIN (
  SELECT
    DISTINCT origin,
    Alexa_rank AS rank
  FROM
    `httparchive.urls.20170315`
  JOIN
    `chrome-ux-report.country_in.201807`
  ON
    NET.REG_DOMAIN(origin) = Alexa_domain) AS crux
  ON
    url = CONCAT(origin, '/')
ORDER BY
  rank ASC, url ASC

Menjalankan kueri di atas menghasilkan banyak data, terlalu banyak untuk Google Spreadsheet, jadi saya hanya menganalisis sekitar 16.000 situs teratas (hingga sekitar 7k di Peringkat Alexa). Di bawah ini adalah data yang dikumpulkan tanpa komentar.

7k Teratas

Rentang Skor Skor SEO Skor PWA Skor Kecepatan Skor A11Y
0 0 25 149 10
0,5 45 12253 7841 3925
0,7 1907 3609 2725 6498
0,8 1713 54 1188 2610
0,9 3016 30 1180 1788
1 9278 21 2283 1157
0 0 0 0

Alexa Top 100

Rentang Skor Skor SEO Skor PWA Skor Kecepatan Skor A11Y
0 0 0 3 2
0,5 0 2279 1231 519
0,7 87 703 484 1348
0,8 199 0 198 587
0,9 375 0 261 302
1 2316 0 694 219
0 0 0 0

Alexa Top 1000

Rentang Skor Skor SEO Skor PWA Skor Kecepatan Skor A11Y
0 0 1 19 2
0,5 16 5471 3517 1942
0,7 546 1867 1272 2941
0,8 757 9 507 1212
0,9 1077 16 567 719
1 4962 6 1241 550
0 0 0 0

Saya pikir alat pengembang dan bisnis sekarang ada di tangan mereka dapat membuat perbedaan besar pada kemampuan kami untuk membuat keputusan yang beralasan dan berprinsip tentang bagaimana pengguna benar-benar merasakan pengalaman web secara global. Bagi saya, data ini memberi saya garis dasar yang dapat saya lihat untuk melihat apakah strategi kami untuk pekerjaan devuler kami mempengaruhi ekosistem dalam jangka panjang.

Paul Kinlan

Trying to make the web and developers better.

RSS Github Medium