वेबैक मशीन: क्रोम एक्सटेंशन और वैकल्पिक इंटरनेट संग्रह साइटें

इंटरनेट(Internet) अब लगभग दो दशकों से अधिक समय से है। लेकिन बहुत सारे संसाधन पिछले वर्षों में इंटरनेट को पूरी तरह से सावधानीपूर्वक संग्रहित कर रहे हैं। (Internet)सबसे लोकप्रिय सेवाओं में से एक है जो आपको वर्ल्ड वाइड वेब(World Wide Web) के पिछले वर्षों को ब्राउज़ करने देती है, वेबैक मशीन(WayBack Machine) है । इस तथ्य के अलावा कि इसने 445 बिलियन से अधिक वेब पेजों को संग्रहीत किया है, अजीब बात यह है कि इसने कभी भी उन वेबसाइटों की सूची प्रकाशित नहीं की है जो इसे संग्रहीत करती हैं या एल्गोरिदम का उपयोग करती हैं जो यह निर्धारित करती हैं कि क्या और कब कैप्चर करना है।

वेबैक मशीन

वेबैक मशीन

संस्थानों के शोध के लिए इंटरनेट(Internet) एक परिपक्व उम्र तक पहुंचने के साथ , ये अभिलेखागार अब पहले से कहीं अधिक महत्वपूर्ण हैं। वेबैक मशीन(Wayback Machine) पर संग्रहीत 445 बिलियन वेब पेजों के बावजूद , निश्चित रूप से बहुत सारे ढीले सिरे हैं। उदाहरण के लिए, बीबीसी का आर्काइव 1996 में शुरू हुआ था, लेकिन ठीक से संरेखित छवियां 2012 के बाद ही दिखाई देने लगीं। और जिस वेबसाइट पर वेबैक मशीन(Wayback Machine) सभी संग्रहीत वेब पेज पोस्ट करती है, वह थोड़े अलग तरीके से काम करती है। यह एलेक्सा(Alexa) द्वारा रैंक किए गए 70 प्रमुख देशों में शीर्ष 1 मिलियन वेबसाइटों से केवल वेब पेज पोस्ट करता है ।

“The WayBack Machine is used by hundreds of thousands of people every day, presenting snapshots, back in time, from more than 1.5 billion websites,” says Mark Graham, director of the Wayback Machine.

त्रुटि पृष्ठों का समाधान(SOLUTION TO ERROR PAGES)

वेबैक मशीन(Wayback Machine) की एक अन्य विशेषता यह है कि  क्रोम(Chrome) प्लगइन आपकी पसंदीदा साइटों को ब्राउज़ करते समय 404 या किसी अन्य वेब पेज त्रुटि के सामने आने पर पहचान लेता है। इसके बाद यह जांचने और देखने के लिए आगे बढ़ता है कि उस साइट का संग्रहीत संस्करण है या नहीं। तो, क्या कोई वेब पेज है जिसे इंटरनेट(Internet) से संदिग्ध रूप से हटा दिया गया है या साइट अभी भी काम करना जारी रखने के लिए बहुत सड़ा हुआ है, वेबैक(Wayback) के पास आपके लिए जांच करने के लिए संग्रह है। सरल शब्दों में, यह लिंक रोट के खतरे से लड़ने का एक तरीका है।

सरकारी रिकॉर्ड(GOVERNMENT RECORDS)

हालाँकि, इस नए उत्पाद के लिए इंटरनेट आर्काइव(Internet Archive) की बहुत अच्छी महत्वाकांक्षा है। रिपोर्टों के अनुसार, ओबामा प्रशासन के तहत लगभग 83% सूचना दस्तावेज, और (Obama)सर्वोच्च न्यायालय(Supreme Court) के सभी रिकॉर्ड का 49% इंटरनेट(Internet) से गायब हैं । और यही वह समस्या है जिसे वेबैक मशीन(Wayback Machine) हल करना चाह रही है। कुख्यात लिंक सड़ांध एक बढ़ती हुई चिंता है, और महत्वपूर्ण डेटा के विशाल ढेर को संरक्षित करने के लिए ऑनलाइन अभिलेखागार महत्वपूर्ण हैं।

दिलचस्प अनुभव(INTERESTING EXPERIENCES)

एंटरप्रेन्योर मैगज़ीन(Entrepreneur Magazine) के साथ एक साक्षात्कार में , निदेशक मार्क ग्राहम(Mark Graham) ने सेवा के उपयोगकर्ताओं से एक दिलचस्प अनुभव साझा किया।

“On July 17, 2014, Igor (Strelkov) Girkin, a Ukrainian separatist leader, claimed responsibility online for the downing of what he thought was a Ukrainian military transport plane near the rebel-held Ukrainian city of Donetsk. When reports that Malaysian Airlines Flight MH17, with 295 passengers, had been shot down in the same area, his post was removed. But not before it had been preserved several times by the Wayback Machine, where it is available today.”

खासियत और भविष्य(USP AND THE FUTURE)

वेबैक मशीन(Wayback Machine) की सबसे बड़ी विशेषता यह है कि जिस तरह से साइट सूचना और स्नैपशॉट के लिए इन सभी अरबों और खरबों वेब पेजों को क्रॉल करती है। आधे ट्रिलियन से अधिक वेब कैप्चर की उनकी सूची एक निरंतर क्रॉलिंग प्रक्रिया का परिणाम नहीं है, बल्कि लाखों अलग-अलग क्रॉल हैं, जिन्हें हजारों लोगों द्वारा वर्षों से परिभाषित किया गया है। कंपनी का लक्ष्य संपूर्ण इंटरनेट(Internet) के अंतिम डेटाबेस का निर्माण करना है जो स्थायी रूप से उन सभी के लिए उपलब्ध है जो पहुंच के लिए उत्सुक हैं।

इस प्रकार आप इंटरनेट पर संग्रहीत या कैश्ड वेब पेजों(view Archived or Cached web pages on the Internet) को देखने के लिए वेबैक मशीन(WayBack Machine) का उपयोग कर सकते हैं और साथ ही वेब पेज को इंटरनेट पर पहली बार प्रदर्शित होने के प्रमाण के रूप में सहेज सकते हैं ।

वेबैक मशीन क्रोम एक्सटेंशन

वेबैक मशीन(WayBack Machine) ने एक उत्कृष्ट ब्राउज़र एक्सटेंशन जारी किया है जो कष्टप्रद 404 पृष्ठों को कम कर सकता है। यह एक्सटेंशन त्रुटि कोड 404, 408, 410, 451, 500, 502, 503, 504, 509, 520, 521, 523, 524, 525, और 526 का पता लगाएगा और संग्रहीत संस्करण प्रदर्शित करने की पेशकश करेगा। आप इसे यहां(here) डाउनलोड कर सकते हैं ।(here.)

वेबैक मशीन विकल्प

यदि आप वेबैक मशीन(Wayback Machine) के विकल्पों की तलाश कर रहे हैं, तो आर्काइव(archive.is) .is और स्क्रीनशॉट्स.कॉम देखें।



About the author

मैं एक सॉफ्टवेयर इंजीनियर हूं जिसे क्रोम और गेमिंग एप्लिकेशन दोनों में अनुभव है। मैं पिछले 4 वर्षों से Google क्रोम ब्राउज़र के समाधान पर काम कर रहा हूं और कई अलग-अलग प्लेटफार्मों के लिए गेम पर भी काम किया है। मेरा कौशल सॉफ्टवेयर परियोजनाओं की डिजाइनिंग, परीक्षण और प्रबंधन में निहित है। एक सॉफ्टवेयर इंजीनियर के रूप में अपने काम के अलावा, मुझे गोपनीयता, उपयोगकर्ता खातों और पारिवारिक सुरक्षा के मुद्दों का भी अनुभव है।



Related posts