पाठको पहिचान। नि: शुल्क कार्यक्रम - एनालॉग FINEREADER

चाँडो वा पछि, सबै जो प्राय: अफिस कार्यक्रमहरूसँग काम गर्ने एउटा साधारण कार्यको सामना गर्छन् - पुस्तक, पत्रिका, अखबार, सरसफाइ पत्रहरू स्क्यान गर्नुहोस् र त्यसपछि यी चित्रहरूलाई पाठ ढाँचामा अनुवाद गर्नुहोस्, उदाहरणका लागि, एक Word कागजातमा।

यो गर्न तपाईंलाई स्क्यानर र पाठ मान्यताको लागि एक विशेष कार्यक्रम चाहिन्छ। यो लेख FineReader को मुक्त analogue छलफल गर्नेछ -Cuneiform (बारे फाइनरिडरको बारेमा मान्यता - यो लेख हेर्नुहोस्)।

सुरू गरौं ...

सामग्री

1. CuneiForm प्रोग्राम को विशेषताहरु, विशेषताहरु
2. पाठ पहिचानको एक उदाहरण
3. ब्याच पाठ पहिचान
4. निष्कर्ष

1. CuneiForm प्रोग्राम को विशेषताहरु, विशेषताहरु

Cuneiform

तपाईं विकासकर्ताको साइटबाट डाउनलोड गर्न सक्नुहुन्छ: //cognitiveforms.com/

खुला स्रोत पाठ मान्यता सफ्टवेयर। यसको अतिरिक्त, यो विन्डोजको सबै संस्करणहरूमा कार्य गर्दछ: XP, Vista, 7, 8, जुन मनपर्छ। साथै, कार्यक्रमको पुरा रूसी अनुवाद थप गर्नुहोस्!

प्रो:

- संसारको 20 भन्दा धेरै लोकप्रिय भाषाहरूमा पाठ पहिचान (अंग्रेजी र रुसी आफैले यस नम्बरमा समावेश गरेको छ);

- विभिन्न मुद्रित फन्टहरूको लागि ठूलो समर्थन;

- शब्दकोश पहिचान गरिएको पाठ जाँच गर्नुहोस्;

- धेरै तरिकामा कामका परिणामहरू बचत गर्न क्षमता;

- दस्तावेज को संरचना को बनाए राखयो;

- उत्कृष्ट समर्थन र मान्यता तालिकाहरू।

Cons:

- धेरै ठूला कागजातहरू र फाइलहरू समर्थन गर्दैन (400 डीपीआई भन्दा बढी);

- केहि प्रकारको स्क्यानरहरू सीधै समर्थन गर्दैन (ठीक छ, यो डराउँदैन, एक विशेष स्क्यानर स्क्यानर ड्राइवरहरूसँग समावेश छ);

- डिजाइन चमक गर्दैन (तर यो आवश्यक छ यदि प्रोग्रामलाई पूर्णतया समस्या समाधान गर्दछ)।

2. पाठ पहिचानको एक उदाहरण

हामी मान्दछौं कि तपाईंले पहिले नै मान्यताको लागि आवश्यक चित्रहरू प्राप्त गर्नुभएको छ (त्यहाँ स्क्यान गरिएको स्क्यान, वा इन्टरनेटमा pdf / djvu ढाँचामा किताब डाउनलोड गर्नुभयो र तिनीहरूबाट आवश्यक तस्बिरहरू - यो लेख कसरी हेर्नुहोस् - यो लेख हेर्नुहोस्)।

1) आवश्यक छविलाई CFormForm कार्यक्रममा खोल्नुहोस् (फाइल / खुला वा "Cntrl + O")।

2) पहिचान सुरू गर्न - तपाईंले पहिलेको फरक क्षेत्रहरू चयन गर्नु पर्दछ: पाठ, चित्रहरू, तालिकाहरू, आदि। क्युनिफोर्ड कार्यक्रममा, यसले मात्र मैन्युअल रूपमा मात्र गर्न सक्छ, तर यो पनि स्वचालित रूपमा! यो गर्नका लागि, "मार्कअप" बटनमा सञ्झ्यालको शीर्ष फलकमा क्लिक गर्नुहोस्।

3) 10-15 सेकेन्ड पछि। कार्यक्रमले स्वचालित रूपमा सबै रङका सबै क्षेत्रमा हाइलाइट गर्नेछ। उदाहरणको लागि, एक पाठ क्षेत्र नीलोमा हाइलाइट गरिएको छ। वैसे, उनले सबै क्षेत्रहरुलाई सही र चाँडै हाइलाइट गरे। ईमानदारीपूर्वक, मैले उनको यस्तो द्रुत र सही प्रतिक्रियाको अपेक्षा गरेन ...

4) स्वचालित मार्कअपमाथि भरोसा नगर्नेहरूका लागि, तपाईं म्यानुअल एक प्रयोग गर्न सक्नुहुनेछ। यसको लागि त्यहाँ एक उपकरणपट्टी हो (तल चित्र हेर्नुहोस्), जसको लागि तपाईं चयन गर्न सक्नुहुन्छ: पाठ, तालिका, चित्र। सार्नुहोस्, बढि छवि / वृद्धि घटाउनुहोस्, किनाराहरू ट्रिम गर्नुहोस्। सामान्यमा, एक राम्रो सेट।

5) सबै क्षेत्रहरू चिन्ह लगाइएको छ भने, तपाईं अगाडि बढ्न सक्नुहुनेछ मान्यता। यो गर्नका लागि, तलको चित्रको रूपमा जस्तै एउटै नामको बटनमा क्लिक गर्नुहोस्।

6) सामान्यतया 10-20 सेकेन्डमा। तपाईंले मान्यता प्राप्त पाठको साथ Microsoft Word मा एक दस्तावेज देख्नुहुनेछ। रोचक के छ, यो उदाहरणको लागि पाठमा, निस्सन्देह त्यहाँ गल्तीहरू थिए, तर तिनीहरूमध्ये धेरै कम छन्! विशेष गरी, मूल सामग्री कस्तो थियो - विचार गर्नुहोस्।

गति र गुणस्तर FineReader सँग एकदम तुलनात्मक छ!

3. ब्याच पाठ पहिचान

कार्यक्रमको यो प्रकार्यले काम गर्न सक्ने बेला आउन सक्दछ जब तपाईंलाई कुनै पनि तस्बिर पहिचान गर्न आवश्यक छैन, तर धेरै पटक एक पटक। ब्याच पहिचान सुरु गर्न शर्टकट सामान्यतया सुरु मेनुमा लुकेको छ।

1) कार्यक्रम खोल्न पछि, तपाईंलाई नयाँ प्याकेज सिर्जना गर्न आवश्यक छ, वा पहिले सुरक्षित गरिएको एक खोल्नुहोस्। हाम्रो उदाहरणमा - नयाँ सिर्जना गर्नुहोस्।

2) अर्को चरणमा हामी यो एउटा नाम दिन्छौं, अधिमानतः यस्तो छ कि छ महिना पछि हामी सम्झनेछौं कि यसमा भण्डारण छ।

3) अर्को, दस्तावेज भाषा चयन गर्नुहोस् (रूसी-अंग्रेजी), तपाईंको स्क्यान गरिएको सामग्रीमा तस्विरहरू र तालिकाहरू छन् भनेर संकेत गर्नुहोस्।

4) अब तपाईँले फोल्डर निर्दिष्ट गर्न आवश्यक छ जसमा पहिचानको लागि फाइलहरू अवस्थित छन्। वैसे, रोचक के छ कि कार्यक्रम आफैले सबै चित्रहरु र अन्य ग्राफिक फाईलहरु लाई पहिचान गर्न सक्छन् र उनको परियोजना मा जोडें। तपाइँलाई अतिरिक्त हटाउन पनि आवश्यक छ।

5) अर्को चरण महत्त्वपूर्ण छैन - मान्यता पछि स्रोत फाइलहरूसँग के गर्ने छान्नुहोस्। म चेकबक्स चयन गर्न सिफारिस गर्दछु "केहि छैन"।

6) यो केवल ढाँचा चयन गर्न को लागी बनी छ जसमा मान्यता प्राप्त कागजात बचत हुनेछ। त्यहाँ धेरै विकल्पहरू छन्:

- rtf - शब्द दस्तावेजबाट फाईल सबै लोकप्रिय कार्यालयहरू (नि: शुल्क सहित, कार्यक्रमहरूको लागि लिंक) द्वारा खोलिएको छ;

- txt - पाठ ढाँचा, तपाईंले मात्र पाठ, चित्रहरू र तालिकाहरू यसलाई सुरक्षित गर्न सक्नुहुनेछ;

- htm - हाइपरटेक्स्ट पेज, सुविधाजनक छ यदि तपाइँ साइट को लागी फाईलहरु को स्कैन र पहिचान गर्नुहोस। उहाँ र हाम्रो उदाहरणमा छनौट गर्नुहोस्।

7) "समाप्त" बटन क्लिक गर्नु भएपछि, तपाईंको प्रोजेक्टको प्रसोधन सुरु हुनेछ।

8) कार्यक्रम धेरै छिटो काम गर्दछ। मान्यता पछि, तपाईंले htm फाइलहरूसँग ट्याब देख्नुहुनेछ। यदि तपाइँ यस्तो फाइलमा क्लिक गर्नुहुन्छ भने, ब्राउजर तपाईले नतिजा कहाँ देख्न सक्नुहुन्छ। वैसे, प्याकेज यसका साथ थप कामको लागि सुरक्षित गर्न सकिन्छ।

9) तपाईं देख्न सक्नुहुन्छ परिणामहरू काम धेरै प्रभावकारी छ। यो कार्यक्रमले सजिलै तस्बीरलाई मान्यता दिएको छ, र सजिलैसँग पाठको पहिचान गरी पहिचान गर्यो। जबकि कार्यक्रम निःशुल्क छ, यो सामान्यतया सुपर हो!

4. निष्कर्ष

यदि तपाई प्राय: कागजातहरू स्कैन र पहिचान गर्नुहुन्न, त्यसपछि फाइनर पाठक खरीद गर्न सम्भव छैन। CuneiForm सजिलै सबै भन्दा अधिक कार्यहरू स्यान्डल गर्दछ।

अर्कोतर्फ, उनीसँग पनि हानि छ।

पहिलो, परिणाम सम्पादन र जाँचको लागि त्यहाँ धेरै कम उपकरणहरू छन्। दोस्रो, जब तपाईं धेरै तस्विरहरू चिन्न चाहनुहुन्छ भने फिनर पाठकमा दायाँतिर स्तम्भमा परियोजनामा थप सबै कुराहरू तुरुन्तै हेर्न थप सुविधाजनक छ: छिट्टै अनावश्यक हटाउनुहोस्, सम्पादन गर्नुहोस्, आदि। र तेस्रो, बिल्कुल खराब गुणका कागजातहरूमा, क्युनीफार्मले मान्यता गुमाउँछ: तपाईंले दस्तावेजलाई ध्यान दिनु पर्छ - सही गल्तीहरू, विराम चिह्नहरू, उद्धरणहरू, आदि राख्नुहोस्।

त्यो सबै छ। के तपाईं कुनै अन्य सभ्य मुक्त पाठ मान्यता सफ्टवेयर थाहा पाउनुहुन्छ?