मशीन लर्निंग के साथ लेखों की खोजबीन

अपनी रिपोर्टिंग में मशीन लर्निंग का किस प्रकार उपयोग करें

विवेचनाओं के लिए मशीन लर्निंग : एक केस-अध्ययन

2010 में, वैश्विक बाज़ार में ऐंबर का मूल्य बढ़ना प्रारम्भ हो गया था। उच्च मांग के कारण आने वाले वर्षों में उत्तरी-पश्चिमी यूक्रेन के ऐंबर-सम्पन्न क्षेत्रों ने विदेशी और स्थानीय दिलचस्पी को आकर्षित किया और गैरकानूनी “ऐंबर मांग", नया “वाइल्ड वेस्ट", के रंगमंच बन गए थे।
सैंकड़ों हेक्टेयर के जंगल और कृषि भूमि एक निर्जीव उपग्रह के परिदृश्य में बदल दिये गए थे, और 2014 से 2016 के बीच से आरंभ होकर बाद वाले वर्षों में अत्यंत गहन खनन गतिविधि की गई थी।

Leprosy of the Land (भूमि का कोढ़), Texty द्वारा एक विवेचना

In 2018 में, यूक्रेन डैटा जर्नलिज़्म एजेंसी Texty ने Leprosy of the Land एक विवेचना प्रकाशित की थी जिसमें उसने सम्पूर्ण यूक्रेन में गैरकानूनी ऐंबर खनन मामलों की जांच के लिए मशीन लर्निंग तकनीकों का प्रयोग किया था।
प्रथम, एक एल्गोरिद्म ने सेटलाइट चित्रों के खंडों को दृष्टिगत रूप से एक जैसे उपखंडों में विभाजित किया। अत: यदि किसी चित्र में आधा हरा जंगल और आधा गंदा क्षेत्र है, तो यह उस चित्र को उन दो उपखंडों में विभाजित कर देगा।
एक अन्य एल्गोरिद्म ने खोजा कि कौनसे उपखंड ऐंबर खनन के उन मौजूद उदाहरणों से मेल खाते हैं जिनमें धरती में फुंसी जैसे छिद्रों के विशिष्ट पैटर्न हैं।
अंतत:, यह सुनिश्चित करने कि ऐंबर खनन जैसी दिखने वाली आकृतियाँ वास्तव में वन-कटाई जैसी कुछ अन्य तो नहीं है, पत्रकारों ने मिले एल्गोरिद्म के उदाहरणों की जांच की।

गैरकानूनी ऐंबर खनन के उदाहरण खोजना

इस पाठ्यक्रम में, हम Texty द्वारा एल्गोरिद्म को शिक्षित करने हेतु की गई उन कार्यविधियों पर ध्यान करेंगे जिनके प्रयोग से पहले कई सेटलाइट चित्रों में किसी अन्य एल्गोरिद्म द्वारा उपखंडों में विभाजित किए गए गैरकानूनी ऐंबर खनन दृश्य के उदाहरणों की पहचान की जा सके।
जैसा की प्रथम पाठ में वर्णित है, इसका अर्थ है कि हम पर्यवेक्षण लर्निंग का प्रयोग करेंगे। आप सीख पायेंगे कि कोई एल्गोरिद्म, इसके द्वारा पहले कभी न देखे गए चित्रों में समान पैटर्न की पहचान करने वाले पूर्व में लेबल किये गए पैटर्न से, कैसे सीख सकता है।
आप यह भी सीखेंगे कि आप कैसे अपने स्वयं के लेखों के लिए कार्यविधि को दोहरा सकते हैं : आपकी आवश्यकता के उदाहरणों की खोजने से लेकर, खोजे जाने वाले तत्व को पहचानने हेतु मशीन लर्निंग मॉडल को शिक्षित करने, और फिर मॉडल का परीक्षण और विश्लेषण करने तक, ताकि यह सुनिश्चित किया जा सके कि यह विश्वसनीय परिणाम प्रस्तुत करें।

क्या इस समस्या के लिए ML उचित संसाधन है?

परन्तु Texty द्वारा खोजी जा रही जानकारी को खोजने के लिए मशीन लर्निंग उचित संसाधन क्यों था?
पारम्परिक प्रोग्रामिंग में आपको कम्प्युटर द्वारा अनुसरण किए जाने वाले उत्तरोत्तर निर्देशों का वर्णन करना होगा। यद्यपि यह कार्यविधि कई प्रकार की समस्याओं का निवारण करने का कार्य करती है, यह गैरकानूनी ऐंबर खनन के अत्याधिक सेटलाइट चित्रों को पहचान करने में असमर्थ है। ऐसे कई दिखाऊ तत्व हैं जिन पर कम्प्युटर को यह विचार करना होगा कि सॉफ्टवेयर को गैरकानूनी ऐंबर खनन के वास्तविक उदाहरणों और उस जैसे दिखने वाले तत्वों में अंतर करना सिखाने वाले नियमों के सैट बनाना असंभव है।
सौभाग्यवश, इस समस्या को सुलझाने में मशीन लर्निंग सिस्टम अत्यंत सक्षम हैं।

कार्यविधि पर ध्यान केन्द्रित करें

ध्यान रखें कि आप इस पाठ्यक्रम - गैरकानूनी ऐंबर खनन को कैसे खोजें - से जो सीखेंगे, वह केवल एक उदाहरण है। उसी कार्यविधि का अनुसरण करते हुए मशीन लर्निंग से पत्रकारिता से संबन्धित कई भिन्न कार्य किये जा सकते हैं और चित्रों के साथ-साथ विभिन्न प्रकार की सामग्रियों के विश्लेषण के लिए भी प्रयोग किया जा सकता है। पाठ्यक्रम के अन्त में हम कुछ अन्य प्रयोग किये गए मामलों की समीक्षा करेंगे। इस अभ्यास को करने के दौरान विशिष्ट केस अध्ययन के स्थान पर कार्यविधि पर ध्यान केन्द्रित करना याद रखें।
अब, वास्तविक अभ्यास प्रारम्भ करने से पूर्व, हमें अगले पाठों में सीखे जाने वाले संसाधन को जानने और व्यवस्थित करने हेतु कुछ मिनट समर्पित करने होंगे। Google Cloud AutoML Vision।

-
What are Web Stories?
लेसनHow the easy-to-use vertical video format is changing the face of digital storytelling and driving the connection between content makers and their fans. -
Google Trends: See what’s trending across Google Search, Google News and YouTube.
लेसनFind stories and terms people are paying attention to. -
Introduction to AI for News Business Teams
लेसनLearn about Google's approach to AI and how our products can support news business teams.