5 नि:शुल्क ऑनलाइन ओसीआर सेवाएं परीक्षण और समीक्षित

एक पीडीएफ(PDF) दस्तावेज़ या एक छवि है जिसे आप टेक्स्ट में बदलना चाहते हैं? हाल ही में, किसी ने मुझे मेल में एक दस्तावेज़ भेजा है जिसे मुझे संपादित करने और सुधार के साथ वापस भेजने की आवश्यकता है। वह व्यक्ति डिजिटल कॉपी नहीं ढूंढ सका, इसलिए मुझे उस सारे टेक्स्ट को डिजिटल फॉर्मेट में लाने का काम सौंपा गया।

कोई रास्ता नहीं था कि मैं सब कुछ वापस टाइप करने में घंटों खर्च करने जा रहा था, इसलिए मैंने दस्तावेज़ की एक अच्छी उच्च गुणवत्ता वाली तस्वीर ली और फिर ऑनलाइन ओसीआर(OCR) सेवाओं के एक समूह के माध्यम से अपना रास्ता जला दिया, यह देखने के लिए कि कौन सा मुझे सबसे अच्छा देगा परिणाम।

इस लेख में, मैं ओसीआर(OCR) के लिए अपनी कुछ पसंदीदा साइटों के बारे में बात करूंगा जो निःशुल्क हैं। यह ध्यान देने योग्य है कि इनमें से अधिकांश साइटें एक बुनियादी मुफ्त सेवा प्रदान करती हैं और फिर यदि आप बड़ी छवियों, बहु-पृष्ठ पीडीएफ(PDF) दस्तावेज़ों, विभिन्न इनपुट भाषाओं आदि जैसी अतिरिक्त सुविधाएँ चाहते हैं, तो उनके पास भुगतान विकल्प हैं ।

पहले से यह जान लेना भी अच्छा है कि इनमें से अधिकतर सेवाएं आपके मूल दस्तावेज़ के स्वरूपण से मेल नहीं खा सकेंगी। ये मुख्य रूप से टेक्स्ट निकालने के लिए हैं और बस इतना ही। यदि आपको एक विशिष्ट लेआउट या प्रारूप में होने के लिए सब कुछ चाहिए, तो आपको OCR(OCR) से सभी पाठ प्राप्त करने के बाद मैन्युअल रूप से ऐसा करना होगा ।

इसके अलावा, टेक्स्ट प्राप्त करने के सर्वोत्तम परिणाम 200 से 400 डीपीआई(DPI) रिज़ॉल्यूशन वाले दस्तावेज़ों से आएंगे। यदि आपकी DPI छवि कम है, तो परिणाम उतने अच्छे नहीं होंगे।

अंत में, ऐसी बहुत सी साइटें थीं जिनका मैंने परीक्षण किया था जो अभी काम नहीं कर रही थीं। यदि आप गूगल फ्री ऑनलाइन ओसीआर(OCR) करते हैं, तो आपको साइटों का एक समूह दिखाई देगा, लेकिन शीर्ष 10 परिणामों में से कई साइटों ने रूपांतरण पूरा भी नहीं किया। कुछ समय समाप्त हो जाएगा, अन्य त्रुटियां देंगे और कुछ बस "रूपांतरित" पृष्ठ पर फंस गए हैं, इसलिए मैंने उन साइटों का उल्लेख करने की भी जहमत नहीं उठाई।

प्रत्येक साइट के लिए, मैंने यह देखने के लिए दो दस्तावेज़ों का परीक्षण किया कि आउटपुट कितना अच्छा होगा। अपने परीक्षणों के लिए, मैंने बस अपने iPhone 5S का उपयोग दोनों दस्तावेजों की एक तस्वीर लेने के लिए किया और फिर उन्हें रूपांतरण के लिए सीधे वेबसाइटों पर अपलोड कर दिया।

यदि आप यह देखना चाहते हैं कि मेरे परीक्षण के लिए उपयोग की जाने वाली छवियां कैसी दिखती हैं, तो मैंने उन्हें यहां संलग्न किया है: टेस्ट 1 और(Test1 ) टेस्ट 2(Test2) । ध्यान दें कि ये फोन से ली गई छवियों के पूर्ण रिज़ॉल्यूशन संस्करण नहीं हैं। मैंने साइटों पर अपलोड करते समय पूर्ण रिज़ॉल्यूशन छवि का उपयोग किया।

ऑनलाइनओसीआर

OnlineOCR.net एक साफ और सरल साइट है जिसने मेरे परीक्षण में बहुत अच्छे परिणाम दिए हैं। मुख्य बात जो मुझे इसके बारे में पसंद है, वह यह है कि इसमें हर जगह ढेर सारे विज्ञापन नहीं होते हैं, जो आमतौर पर इस प्रकार की आला सेवा साइटों के मामले में होता है।

मुफ्त ऑनलाइन ओसीआर

शुरू करने के लिए, अपनी फ़ाइल चुनें और उसके अपलोड होने तक प्रतीक्षा करें। इस साइट के लिए अधिकतम अपलोड आकार 100 एमबी है। यदि आप एक मुफ़्त खाते के लिए पंजीकरण करते हैं, तो आपको कुछ अतिरिक्त सुविधाएँ मिलती हैं जैसे बड़ा अपलोड आकार, बहु-पृष्ठ PDF(PDFs) , विभिन्न इनपुट भाषाएँ, प्रति घंटे अधिक रूपांतरण, आदि।

इसके बाद, अपनी इनपुट भाषा चुनें और फिर आउटपुट स्वरूप चुनें। आप वर्ड(Word) , एक्सेल(Excel) , या प्लेन टेक्स्ट(Plain Text) में से चुन सकते हैं । कन्वर्ट बटन पर (Convert)क्लिक(Click) करें और आप एक डाउनलोड लिंक के साथ एक बॉक्स में नीचे प्रदर्शित टेक्स्ट देखेंगे।

ओसीआर आउटपुट

यदि आप केवल टेक्स्ट चाहते हैं, तो बस इसे बॉक्स से कॉपी और पेस्ट करें। हालाँकि, मेरा सुझाव है कि आप Word दस्तावेज़ डाउनलोड करें क्योंकि यह मूल दस्तावेज़ के लेआउट को बनाए रखने का आश्चर्यजनक रूप से बढ़िया काम करता है।

उदाहरण के लिए, जब मैंने अपने दूसरे परीक्षण के लिए Word दस्तावेज़ खोला, तो मुझे यह जानकर आश्चर्य हुआ कि दस्तावेज़ में छवि की तरह ही तीन स्तंभों वाली एक तालिका शामिल थी।

ऑनलाइन ओसीआर आउटपुट

सभी साइटों में से, यह अब तक का सबसे अच्छा था। यदि आपको बहुत सारे रूपांतरण करने की आवश्यकता है तो यह पूरी तरह से पंजीकरण के लायक है।

पूर्णता के लिए, मैं प्रत्येक सेवा द्वारा बनाई गई आउटपुट फाइलों से भी लिंक करने जा रहा हूं ताकि आप अपने लिए परिणाम देख सकें। यहाँ OnlineOCR के परिणाम दिए गए हैं : Test1 Doc और Test2 Doc ।

ध्यान दें कि इन Word(Word) दस्तावेज़ों को अपने कंप्यूटर पर खोलते समय , आपको Word में एक संदेश मिलेगा कि यह इंटरनेट(Internet) से है और संपादन अक्षम कर दिया गया है। यह पूरी तरह से ठीक है क्योंकि Word इंटरनेट(Internet) से दस्तावेज़ों पर भरोसा नहीं करता है और यदि आप केवल दस्तावेज़ देखना चाहते हैं तो आपको संपादन सक्षम करने की आवश्यकता नहीं है।

i2OCR

एक अन्य साइट जिसने बहुत अच्छे परिणाम दिए वह थी i2OCR । प्रक्रिया बहुत समान है: अपनी भाषा, फ़ाइल चुनें और फिर टेक्स्ट निकालें(Extract Text) दबाएं ।

i2ocr

आपको यहां एक या दो मिनट इंतजार करना होगा क्योंकि इस साइट में थोड़ा अधिक समय लगता है। साथ ही, चरण 2(Step 2) में , सुनिश्चित करें कि आपकी छवि पूर्वावलोकन में दाईं ओर दिखाई दे रही है, अन्यथा आपको आउटपुट के रूप में अस्पष्टता का एक गुच्छा मिलेगा। किसी कारण से, मेरे iPhone की छवियां मेरे कंप्यूटर पर पोर्ट्रेट मोड में दिखाई दे रही थीं, लेकिन जब मैंने इस साइट पर अपलोड किया तो परिदृश्य।

i2ocr आउटपुट

मुझे फोटो एडिटिंग ऐप में इमेज को मैन्युअल रूप से खोलना था, इसे 90 डिग्री घुमाना था, फिर इसे वापस पोर्ट्रेट में घुमाना था और फिर इसे सेव करना था। एक बार(Once) पूरा हो जाने पर, नीचे स्क्रॉल करें और यह आपको एक डाउनलोड बटन के साथ टेक्स्ट का पूर्वावलोकन दिखाएगा।

इस साइट ने पहले परीक्षण के लिए आउटपुट के साथ बहुत अच्छा प्रदर्शन किया, लेकिन दूसरे परीक्षण के साथ इतना अच्छा नहीं किया जिसमें कॉलम लेआउट था। यहां i2OCR के परिणाम दिए गए हैं: Test1 Doc और Test2 Doc ।

फ्रीओसीआर

Free-OCR.com आपकी इमेज लेगा और उन्हें प्लेन टेक्स्ट में बदल देगा। इसमें Word(Word) स्वरूप में निर्यात करने का विकल्प नहीं है । अपनी फ़ाइल चुनें, एक भाषा चुनें और फिर स्टार्ट(Start) पर क्लिक करें ।

साइट तेज है और आपको आउटपुट काफी जल्दी मिल जाएगा। अपने कंप्यूटर पर टेक्स्ट फ़ाइल डाउनलोड करने के लिए बस लिंक पर क्लिक करें।(Just)

फ़्रीओक्र

जैसा कि नीचे उल्लेखित न्यूओसीआर के साथ है, यह साइट दस्तावेज़ में सभी टी को कैपिटल करती है। (NewOCR)मुझे नहीं पता कि यह ऐसा क्यों करेगा, लेकिन किसी अजीब कारण से इस साइट और न्यूओसीआर(NewOCR) दोनों ने ऐसा किया। इसे बदलना कोई बड़ी बात नहीं है, लेकिन यह एक थकाऊ प्रक्रिया है जिसे आपको वास्तव में नहीं करना चाहिए।

यहां FreeOCR के परिणाम दिए गए हैं: Test1 Doc और Test2 Doc ।

एबीबीवाई फाइनरीडर ऑनलाइन

फ़ाइनरीडर ऑनलाइन(FineReader Online) का उपयोग करने के लिए , आपको एक खाते के लिए पंजीकरण करना होगा, जो आपको ओसीआर(OCR) के लिए 10 पृष्ठों तक का 15-दिन का निःशुल्क परीक्षण निःशुल्क प्रदान करता है। यदि आपको केवल कुछ पृष्ठों के लिए वन-टाइम ओसीआर(OCR) करने की आवश्यकता है, तो आप इस सेवा का उपयोग कर सकते हैं। सुनिश्चित करें(Make) कि आप पंजीकरण के बाद पुष्टिकरण ईमेल में सत्यापित लिंक पर क्लिक करें।

फाइनरीडर ऑनलाइन

शीर्ष पर पहचानें(Recognize) पर क्लिक करें और फिर अपनी फ़ाइल का चयन करने के लिए अपलोड पर क्लिक करें। (Upload)अपनी भाषा, आउटपुट स्वरूप चुनें और फिर सबसे नीचे पहचानें(Recognize) पर क्लिक करें। इस साइट का इंटरफ़ेस साफ है और कोई विज्ञापन भी नहीं है।

मेरे परीक्षणों में, यह साइट पहले परीक्षण दस्तावेज़ से पाठ को हथियाने में सक्षम थी, लेकिन जब मैंने वर्ड डॉक खोला, तो यह बिल्कुल विशाल था, इसलिए मैंने इसे फिर से करना और (Word)सादा पाठ(Plain Text) को आउटपुट स्वरूप के रूप में चुनना समाप्त कर दिया ।

कॉलम के साथ दूसरे टेस्ट के लिए, वर्ड(Word) डॉक्यूमेंट खाली था और मुझे टेक्स्ट भी नहीं मिला। सुनिश्चित नहीं है कि वहां क्या हुआ, लेकिन ऐसा लगता है कि यह साधारण पैराग्राफ के अलावा कुछ भी संभालने में सक्षम नहीं है। यहां FineReader के परिणाम दिए गए हैं: Test1 Doc और Test2 Doc ।

न्यूओसीआर

अगली साइट, NewOCR.com , ठीक थी, लेकिन लगभग पहली साइट जितनी अच्छी नहीं थी। सबसे पहले, इसमें विज्ञापन हैं, लेकिन शुक्र है कि एक टन नहीं। आप सबसे पहले अपनी फाइल को सेलेक्ट करें और फिर प्रीव्यू(Preview) बटन पर क्लिक करें।

तस्विर अपलोड करना

फिर आप छवि को घुमा सकते हैं और उस क्षेत्र को समायोजित कर सकते हैं जहाँ आप पाठ के लिए स्कैन करना चाहते हैं। यह काफी हद तक वैसा ही है जैसे संलग्न स्कैनर वाले कंप्यूटर पर स्कैनिंग प्रक्रिया कैसे काम करती है।

ओसीआर छवि

यदि दस्तावेज़ में कई कॉलम हैं, तो आप पेज लेआउट विश्लेषण( Page layout analysis) बटन की जांच कर सकते हैं और यह टेक्स्ट को कॉलम में विभाजित करने का प्रयास करेगा। ओसीआर बटन पर (OCR)क्लिक(Click) करें , इसके पूरा होने के लिए कुछ सेकंड प्रतीक्षा करें और फिर पेज रीफ्रेश होने पर नीचे स्क्रॉल करें।

पहले परीक्षण में, यह सभी पाठ सही ढंग से मिला, लेकिन किसी कारण से दस्तावेज़ में प्रत्येक टी को कैपिटल किया गया! पता नहीं वह ऐसा क्यों करेगा, लेकिन उसने किया। पृष्ठ विश्लेषण सक्षम के साथ दूसरे परीक्षण में, इसे अधिकांश पाठ मिला, लेकिन लेआउट पूरी तरह से बंद था।

यहाँ NewOCR के परिणाम हैं: Test1 Doc  और Test2 Doc ।

निष्कर्ष

जैसा कि आप देख सकते हैं, दुर्भाग्य से अधिकांश समय मुफ्त वास्तव में आपको बहुत अच्छे परिणाम नहीं देता है। उल्लिखित पहली साइट अब तक की सबसे अच्छी है क्योंकि इसने न केवल सभी पाठों को पहचानने का एक बड़ा काम किया, बल्कि यह मूल दस्तावेज़ के प्रारूप को बनाए रखने में भी कामयाब रही।

यदि आपको केवल टेक्स्ट की आवश्यकता है, हालांकि, ऊपर दी गई अधिकांश वेबसाइटें आपके लिए ऐसा करने में सक्षम होनी चाहिए। यदि आपके कोई प्रश्न हैं, तो बेझिझक टिप्पणी करें। आनंद लेना!



About the author

हैलो संभावित नियोक्ता! मैं क्षेत्र में 7 वर्षों से अधिक के अनुभव के साथ एक अत्यधिक अनुभवी सॉफ्टवेयर इंजीनियर हूं। मुझे पता है कि विंडोज 7 अनुप्रयोगों को कैसे डिजाइन और विकसित करना है और मेरी प्रोफाइल पर कूल वेबसाइट्स की सिफारिशों की एक विस्तृत श्रृंखला है। मेरे कौशल और अनुभव मुझे किसी भी कंपनी के लिए एक उत्कृष्ट परियोजना प्रबंधन कौशल, प्रोग्रामिंग ज्ञान और वेब विकास अनुभव के साथ एक प्रतिभाशाली व्यक्ति की तलाश में एक उत्कृष्ट मैच प्रदान करते हैं।



Related posts