Object Detection and Augmentation

நான் மிகவும் நிறைய [Shape Detection API](https://paul.kinlan.me/face-detection/ https://paul.kinlan.me/barcode-detection/ https://paul.kinlan.me/detecting-text-in-an-image/) உடன் விளையாடுகிறேன். அது எனக்கு மிகவும் பிடிக்கும், உதாரணமாக ஒரு மிக எளிய QRCode detector நான் ஒரு நீண்ட காலத்திற்கு முன்னர் JS QRCode detector ஐ எழுதியது, ஆனால் new BarcodeDetector() API ஐ அது கிடைக்கும் எனில் பயன்படுத்துகிறது.

Face Detection , Barcode Detection மற்றும் Text Detection : வடிவம் கண்டறிதல் ஏபிஐ பிற திறன்களைப் பயன்படுத்தி இங்கே நான் கட்டப்பட்ட சில டெமோவின் சிலவற்றை நீங்கள் காணலாம்.

நான் வார இறுதிகளில் Jeeliz தடுமாறினபோது நான் ஆச்சரியமாக இருந்தது, நான் Jeeliz செயல்திறன் நம்பமுடியாத அளவிற்கு ஈர்க்கப்பட்டார் - நான் ஒரு Pixel3 எக்ஸ்எல் பயன்படுத்தி வழங்கப்பட்டது, ஆனால் முகங்கள் கண்டறிதல் FaceDetector ஏபிஐ என்ன சாத்தியம் விட கணிசமாக விரைவாக தோன்றியது.

Checkout some of their demos .

இது எனக்கு நிறைய நினைவிருக்கிறது. ஆப்ஜெக்டிவ் டிடக்சன் (இது போன்றவை) என்ற கருவியாகும், இது Chrome இன் வடிவம் கண்டறிதல் ஏபிஐ (இது Chrome இல் உள்ளது, இது Chrome இல் உள்ள எல்லா பிளாட்ஃபார்ம்களிலும் மாறாது, இது இணையம் குறிப்பாக கேமரா அணுகல், WebGL மற்றும் WASM இல் பரவலாக கிடைக்கிறது ) எளிதில் பணக்கார அனுபவங்களை உருவாக்க மற்றும் அனைத்து தளங்களில் முழுவதும் ஒரு நிலையான அனுபவம் பில்லியன் கணக்கான அடைய.

இது சுவாரஸ்யமான (மற்றும் உண்மையில் இந்த இடுகையில் காட்ட வேண்டும் என்ன) அங்கு பெருக்குதல் மற்றும் நீங்கள் இப்போது மேடையில் வரும் என்று middleware நூலகங்கள் வேண்டும், நாம் பயனர் செய்த சிறந்த பயன்பாடுகள் நிறுவ இல்லாமல் வேடிக்கை snapchat- எஸ்க்யூ முகத்தை வடிகட்டி பயன்பாடுகளை உருவாக்க முடியும் பயனர்களின் சாதனத்திலிருந்து தரவுகளை அதிக அளவில் அறுவடை செய்வதால் (கணினியில் அடிப்படை அணுகல் இல்லை என்பதால்).

வேடிக்கையான செய்முறைகள் வெளியே, பயனர் மிகவும் விரைவாகவும் எளிமையாகவும் மிகவும் மேம்பட்ட பயன்பாடு-வழக்குகளை தீர்க்க முடியும், இது போன்ற:

பயனர் இருந்து கேமரா அல்லது புகைப்படம் நேரடியாக * உரை தேர்வு

  • கேமராவில் இருந்து மொழிகளின் நேரடி மொழிபெயர்ப்பு
  • இன்லைன் QRCode கண்டறிதல் எனவே மக்கள் WeChat அனைத்து நேரம் திறக்க இல்லை :)
  • வாகனத்திலிருந்து எடுக்கப்பட்ட வலைத்தள URL கள் அல்லது முகவரி
  • கிரெடிட் கார்டு கண்டறிதல் மற்றும் எண் பிரித்தெடுத்தல் (பயனர்கள் விரைவாக உங்கள் தளத்தில் கையொப்பமிடலாம்)
  • உங்கள் கடையின் வலை பயன்பாட்டில் காட்சி தயாரிப்பு தேடல். உங்கள் கடைகளில் வலை பயன்பாட்டில் மேலும் தயாரிப்பு விவரங்கள் * பார்கோடு பார்வை.
  • மக்கள் முகங்களின் மீது சுயவிவர புகைப்படங்களின் விரைவான பயிர்ச்செய்கை.
  • எளிய A11Y அம்சங்கள் ஒரு பயனரால் படங்களைக் காணும் உரையை கேட்க அனுமதிக்கின்றன.

நான் இந்த பயன்படுத்த வழக்குகளில் பற்றி நினைத்து 5 நிமிடங்கள் கழித்தார் - நான் இன்னும் நிறைய தெரியும் - ஆனால் நாம் கேமரா பயன்படுத்தி நிறைய தளங்கள் அல்லது வலை பயன்பாடுகள் பார்க்க வேண்டாம் என்று என்னை ஹிட், அதற்கு பதிலாக நாம் கேட்டு தளங்கள் நிறைய பார்க்க பயனர்கள் ஒரு பயன்பாட்டை பதிவிறக்க, மற்றும் நான் அதை செய்ய வேண்டும் என்று நான் நினைக்கவில்லை.

** புதுப்பிப்பு ** எங்கள் அணியில் தாமஸ் ஸ்டீனர் எங்கள் நட்பு ShapeDetection ஏபிஐ பிடிக்கவில்லை என்று தெரிகிறது என்று எங்கள் அணி அரட்டை குறிப்பிடப்பட்டுள்ளது. நான் இந்த ஏபிஐ எங்களுக்கு அந்தந்த கணினிகளின் சொந்த ஷிப்பிங் செயலாக்கங்கள் அணுகல் என்பதை நான் உண்மையில் நேசிக்கிறேன், நான் The Lumpy Web எழுதியது The Lumpy Web , வலை உருவாக்குநர்கள் மேடையில் நிலைத்தன்மையும் மற்றும் முடியும் என்று வடிவம் கண்டறிதல் API சுருக்கமாக:

  1. API மட்டுமே Chrome இல் உள்ளது
  2. Chrome இல் உள்ள ஏபிஐ ஒவ்வொரு தளங்களிலும் மிகவும் வித்தியாசமாக உள்ளது, ஏனெனில் அவற்றின் அடிப்படை செயலாக்கங்கள் வேறுபட்டவை. அண்ட்ராய்டு மட்டும் வாய் மற்றும் கண்கள் போன்ற இடங்களுக்கு புள்ளிகள் உள்ளன, அங்கு MacOS உள்ளது கோடிட்டுக்காட்டுகிறது. அண்ட்ராய்டில் TextDetector கண்டுபிடிக்கப்பட்ட உரையை வழங்குகிறது, அங்கு MacOS இல் 'Text Presence' குறிகாட்டியை மீண்டும் கொடுக்கிறது ... இது Surma காணப்படும் அனைத்து பிழைகள் குறிப்பிட தேவையில்லை.

விநியோகத்திற்கான தளமாக வலைப்பக்கமாக வலைசெய்வது இதுபோன்ற அனுபவங்களுக்கு மிகவும் புத்துணர்வை அளிப்பதாக இருக்கிறது, ஆனால் அதைச் செய்ய எங்களுக்கு அது மறுபரிசீலனை செய்யும் என்று நான் கருதுகிறேன், ஆனால் மேலே கூறப்பட்டுள்ள இரண்டு குழுக்களும் ஒவ்வொரு அம்சத்தையும் நடைமுறைப்படுத்த நீண்ட கால அவகாசத்தை கேள்வி கேட்க என்னை வழிநடத்துகிறது வலைத்தள மேடையில், நாம் WebGL, WASM மற்றும் எதிர்கால வலை ஜி.பீ. போன்ற இன்று மேடையில் அம்சங்களை பயன்படுத்தி அனுப்பப்படும் ஒரு தொகுப்பு நல்ல தீர்வுகள் செயல்படுத்த முடியும் போது.

எப்படியும், நான் இணையத்தில் இதை செய்ய முடியும் என்ற உண்மையை நான் நேசிக்கிறேன், மேலும் அவர்களுடன் தளங்களைக் கொண்டு வருவதைப் பார்க்கிறேன்.

About Me: Paul Kinlan

I lead the Chrome Developer Relations team at Google.

We want people to have the best experience possible on the web without having to install a native app or produce content in a walled garden.

Our team tries to make it easier for developers to build on the web by supporting every Chrome release, creating great content to support developers on web.dev, contributing to MDN, helping to improve browser compatibility, and some of the best developer tools like Lighthouse, Workbox, Squoosh to name just a few.