Using HTTPArchive and Chrome UX report to get Lighthouse score for top visited sites in India.

Paul Kinlan
Available in: English (Original) Deutsch Español Français 日本語 русский язык tiếng Việt தமிழ் bahasa Indonesia

जैसा कि मैंने अपने पिछले पोस्ट में उल्लेख किया है, मैं भारत में अधिक डेवलपर संबंधों की योजना बनाने की योजना बना रहा हूं और मैं बेहतर समझना चाहता हूं कि भारत में उपयोगकर्ता वेब का अनुभव कैसे करते हैं । उस पोस्ट में भारत में एक साइट निर्धारित करने के लिए मेरे पास एक बहुत ही सरल ह्युरिस्टिक था, क्या यह ‘.in’ डोमेन है। मुझे पता था कि यह देखने का सबसे अच्छा तरीका नहीं था, लेकिन यह पहले अच्छा चल रहा था।

जो मैं वास्तव में चाहता था वह उन साइटों को समझने का एक तरीका था जो भारत में उपयोगकर्ता जाते हैं और फिर साइट के लोकप्रियता के आधार पर अपना स्कोर प्राप्त करते हैं।

सौभाग्य से क्रोम यूएक्स रिपोर्ट में कुछ डेटा है। क्रोम यूएक्स रिपोर्ट में बिगक्वायर में टेबल की एक श्रृंखला है जिसमें भारत के उपयोगकर्ताओं की शीर्ष उत्पत्ति की एक सूची शामिल है (तालिका ‘क्रोम-ux-report.country_in.20180` है & mdash;’ _in ‘को नोट करें जो दर्शाती है देश)। क्रोम यूएक्स रिपोर्ट में वास्तविक उत्पत्ति के लिए साइट की समेकित गति जैसे प्रत्येक मूल के लिए बहुत अधिक डेटा है, लेकिन मुझे वास्तव में केवल यूआरएल की आवश्यकता है।

क्रोम यूएक्स रिपोर्ट से डेटा का उपयोग करना, और पहले से उल्लिखित HTTPArchive लाइटहाउस स्कोर के साथ HTTP पुरालेख में एलेक्सा रैंकिंग तालिका के साथ संयोजन करना हम वास्तव में भारत में उपयोगकर्ताओं के बारे में एक बेहतर तस्वीर प्राप्त कर सकते हैं।

SELECT
  url, rank,
  JSON_EXTRACT(report, '$.categories.seo.score') AS seo_score,
  JSON_EXTRACT(report, '$.categories.pwa.score') AS pwa_score,
  JSON_EXTRACT(report, '$.categories.performance.score') AS speed_score,
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS accessibility_score
FROM
  `httparchive.lighthouse.2018_08_01_mobile`
JOIN (
  SELECT
    DISTINCT origin,
    Alexa_rank AS rank
  FROM
    `httparchive.urls.20170315`
  JOIN
    `chrome-ux-report.country_in.201807`
  ON
    NET.REG_DOMAIN(origin) = Alexa_domain) AS crux
  ON
    url = CONCAT(origin, '/')
ORDER BY
  rank ASC, url ASC

उपर्युक्त क्वेरी चलाने से Google शीट्स के लिए बहुत अधिक डेटा लौटाता है, इसलिए मैंने केवल शीर्ष 16,000 साइटों का विश्लेषण किया (एलेक्सा रैंकिंग में लगभग 7k तक)। नीचे टिप्पणी के बिना समेकित डेटा है।

शीर्ष 7k

स्कोर रेंज एसईओ स्कोर पीडब्ल्यूए स्कोर स्पीड स्कोर ए 11 वाई स्कोर
0 0 25 149 10
0.5 45 12,253 7841 3925
0.7 1907 3609 2725 6498
0.8 1713 54 1188 2610
0.9 3016 30 1180 1788
1 9278 21 2283 1157
0 0 0 0

एलेक्सा टॉप 100

स्कोर रेंज एसईओ स्कोर पीडब्ल्यूए स्कोर स्पीड स्कोर ए 11 वाई स्कोर
0 0 0 3 2
0.5 0 2279 1231 519
0.7 87 703 484 1348
0.8 199 0 198 587
0.9 375 0 261 302
1 2316 0 694 219
0 0 0 0

एलेक्सा शीर्ष 1000

स्कोर रेंज एसईओ स्कोर पीडब्ल्यूए स्कोर स्पीड स्कोर ए 11 वाई स्कोर
0 0 1 19 2
0.5 16 5471 3517 1942
0.7 546 1867 1272 2941
0.8 757 9 507 1212
0.9 1077 16 567 719
1 4962 6 1241 550
0 0 0 0

मुझे लगता है कि उपकरण डेवलपर्स और व्यवसायों के पास अब उनके हाथों में तर्कसंगत और सिद्धांतबद्ध निर्णय लेने की हमारी क्षमता में एक बड़ा अंतर हो सकता है कि उपयोगकर्ता वास्तव में वेब के अनुभव को कैसे महसूस करते हैं। मेरे लिए, यह डेटा मुझे आधार रेखा देता है कि मैं यह देखने के लिए देख सकता हूं कि हमारे देवता कार्य के लिए हमारी रणनीतियां लंबी अवधि में पारिस्थितिकी तंत्र को प्रभावित करती हैं या नहीं।

Paul Kinlan

Trying to make the web and developers better.

RSS Github Medium