Getting Lighthouse scores from HTTPArchive for sites in India.

मैं भारत की छोटी यात्रा पर जा रहा हूं, और मैं क्षेत्र में क्रोम और वेब के लिए लंबे समय तक डेवलपर संबंधों के बारे में सोच रहा हूं। अधिकांश यात्राओं के साथ-साथ मैं समय से पहले थोड़ा सा शोध करना चाहता हूं, इसलिए मैं उस देश के परिप्रेक्ष्य से वेब जैसा दिखता हूं, इसकी बेहतर समझ प्राप्त कर सकता हूं।

मैं पिछले कुछ महीनों में HTTPArchive के अपडेट का एक समूह का अनुसरण कर रहा हूं और यह उस डेटा के प्रकारों में सुधार देखने के लिए आश्चर्यजनक रहा है जो इसे एकत्र करता है और स्टोर करता है BigQuery तालिकाएं। मेरे लिए भारी रुचि रखने वाली जानकारी का एक विशिष्ट टुकड़ा है लाइटहाउस HTTPArchive के प्रत्येक भाग पर उत्पन्न डेटा। इस डेटा के साथ मैं यह देखने के लिए उत्सुक था कि क्या मैं डेटा का स्नैपशॉट प्राप्त करने के लिए इसका उपयोग कर सकता हूं और लोगों को देश में वेब का अनुभव करने का उच्च स्तर की समझ प्राप्त कर सकता हूं।

अच्छी खबर यह है कि HTTPArchive में लाइटहाउस डेटा का विश्लेषण करना बहुत मुश्किल नहीं है।

हालांकि मेरी जरूरतों के लिए, कठिन हिस्सा यह है कि किसी दिए गए देश में 'शीर्ष साइट' क्या है, विशेष रूप से जब मैं डेवलपर संबंधों के बारे में सोच रहा हूं, तो हम काम कर सकते हैं और कर सकते हैं।

यहां बताया गया है कि मैंने समस्या को कैसे तोड़ दिया। प्रत्येक देश में कई प्रकार के डेवलपर होते हैं जो वेब के लिए निर्माण करते हैं और व्यक्तिगत रूप से मैं उन्हें 3 समूहों में बाल्टी डालता हूं: जिनकी वर्तमान परियोजना स्थानीय बाजार को लक्षित करती है; जो विदेशी बाजार को लक्षित करते हैं (मैं निर्यात के लिए निर्माण); और जो वैश्विक दर्शकों को लक्षित करते हैं।

जब मैं उपर्युक्त तीन समूहों के बारे में सोचता हूं, तो साइट के इरादे और इसके पीछे के लोगों को काम करना लगभग असंभव है। लेकिन कुछ ह्यूरिस्टिक्स हैं जिनका उपयोग आप कम से कम डेटा को समझने और समझने में आपकी सहायता करने के लिए कर सकते हैं।

मेरे विश्लेषण के लिए मुझे नहीं लगता था कि मैं भारत में उपयोगकर्ताओं द्वारा देखी गई शीर्ष साइटों की एक सूची प्राप्त कर सकता हूं, इसलिए मैंने एक साधारण धारणा की है कि भारत में लोगों के लिए'in 'डोमेन बनने की संभावना है। 'इंडियन साइट्स' के सवाल के लिए संवेदनशीलता और विशिष्टता '.in डोमेन' पर ध्यान केंद्रित करके 100% नहीं है & mdash; दुनिया भर के उपयोगकर्ता ऐसे अनुभवों का उपयोग करना पसंद करते हैं जो सिर्फ टीएलडी और एमडीएएस देशों को बंद नहीं कर रहे हैं; लेकिन यह पहली बार के रूप में भारतीय साइटों की स्थिति के सभ्य उपाय की तरह लगता है।

इस प्रकार का विश्लेषण बहुत आसान साबित होता है। आप [BigQuery] खोलें (https://github.com/HTTPArchive/legacy.httparchive.org/blob/master/docs/bigquery-gettingstarted.md) और लाइटहाउस डेटा चलाने वाले नवीनतम तालिका को ढूंढें [httparchive: लाइटहाउस .2018_08_01_mobile] इस मामले में और निम्न क्वेरी चलाएं।

SELECT
  url,
  JSON_EXTRACT(report, '$.categories.seo.score') AS [seo_score],
  JSON_EXTRACT(report, '$.categories.pwa.score') AS [pwa_score],
  JSON_EXTRACT(report, '$.categories.performance.score') AS [speed_score],
  JSON_EXTRACT(report, '$.categories.accessibility.score') AS [accessibility_score]
FROM
  [httparchive:lighthouse.2018_08_01_mobile]
WHERE
  url LIKE '%.in/'

उपर्युक्त क्वेरी '.in' में समाप्त होने वाले डोमेन पर फ़िल्टर की जाती है, और यह प्रत्येक लाइटहाउस परीक्षण श्रेणियों के लिए लाइटहाउस स्कोर देता है। लाइटहाउस डेटा को JSON ऑब्जेक्ट के रूप में संग्रहीत किया जाता है, जिसे आपको XPON के लिए सिंटैक्स जैसे XPath के माध्यम से आवश्यक घटकों को निकालना होता है।

परिणामों की संख्या वास्तव में बहुत बड़ी है और यहां उपस्थित होने के लिए बहुत अधिक उपयोग नहीं है, लेकिन मैंने इन्हें हिस्टोग्राम में डाला है।

स्कोर रेंज एसईओ स्कोर पीडब्ल्यूए स्कोर स्पीड स्कोर ए 11 वाई स्कोर
0 0 46 279 25
0.5 84 13,992 6502 3973
0.7 3391 1400 2222 7585
0.8 1438 19 1147 2374
0.9 2762 9 1545 1069
1 7752 13 3189 434

आंकड़ों के आगे ड्रिल-डाउन और विश्लेषण की आवश्यकता है, यह समझने के लिए कि कौन से विशिष्ट मुद्दे स्कोर को प्रभावित कर रहे हैं, हालांकि कुछ मामलों में 'पीडब्लूए स्कोर' के साथ मैंने अतीत में साइट स्कोर को पर्याप्त रूप से देखा है कौन से मुद्दे समग्र स्कोर को प्रभावित करते हैं और मैं अब हमारे सामने कुछ चुनौतियों को देख सकता हूं।

अगला। कोशिश करें और उन साइटों को प्राप्त करने का तरीका ढूंढें जो भारतीय उपयोगकर्ताओं को अक्सर प्राप्त करते हैं .... संकेत, यह [यहां](/ क्रूक्स-टॉपसाइट्स-एंड-लाइटहाउस-स्कोर-फॉर-इंडिया /)

About Me: Paul Kinlan

I lead the Chrome Developer Relations team at Google.

We want people to have the best experience possible on the web without having to install a native app or produce content in a walled garden.

Our team tries to make it easier for developers to build on the web by supporting every Chrome release, creating great content to support developers on web.dev, contributing to MDN, helping to improve browser compatibility, and some of the best developer tools like Lighthouse, Workbox, Squoosh to name just a few.