אונטערשייד צווישן ווערסיעס פון "רוי:אפטישע אותיות דערקענונג"

פון המכלול
קפיצה לניווט קפיצה לחיפוש
ק (החלפת טקסט – "פֿ" ב־"פ")
(אוועקגענומען 'בעבודה')
 
(15 מיטלסטע ווערסיעס פון 7 באַניצער נישט געוויזן.)
שורה 1: שורה 1:
{{דעסקריפציע|מעכאַנישער פראָצעס דורך וועלכן אַ קאָמפיוטער פאַרוואַנדלט אַ בילד צו טעקסט וואָס אַ קאָמפיוטער קען פאַרשטיין}}
{{יתום}}
{{יתום}}


'''אָפּטישע אותיות־דערקענונג''' ({{שפראך-en|optical character recognition}} ;[[ראשי תיבות]]: אא"ד) איז אַ מעכאַנישער פראָצעס דורך וועלכן אַ [[קאָמפיוטער]] פאַרוואַנדלט אַ [[בילד]] פון [[טעקסט]] צו טעקסט וואָס אַ קאָמפיוטער קען פאַרשטאַנען.  
[[טעקע:Hocr-editor-1.png|קליין|בילד מיט טעקסט אין [[לשון קודש]] געליינט דורך א קאָמפיוטער ניצנדיג אפטישע אותיות דערקענונג. ווי מען זעט אינעם בילד, זענען דא אסאך גרייזן, ווייל דער קאמפיוטער קען עס נישט געהעריג ליינען וויבאלד דער בילד איז נישט גענוג קלאר.]]
'''אָפּטישע אותיות־דערקענונג''' ({{שפראך-en|optical character recognition}} ;[[ראשי תיבות]]: אא"ד) איז אַן [[עלעקטראניק|עלעקטראנישער]] אדער [[מאשין|מעכאַנישער]] פראָצעס דורך וועלכן אַ [[קאמפיוטער|קאָמפיוטער]] פאַרוואַנדלט אַ [[בילד]] פון [[טעקסט]] וואס איז [[דרוקעריי|געדרוקט]] אדער געשריבן דורך דער האנט אדער דורך א [[שרייבמאשין]], צו טעקסט וואָס אַ קאָמפיוטער קען פאַרשטיין.


מע ניצט אא"ד כּדי זוכן גרינג דורך דרוקזאַכן למשל. פאָרעמען און אַנדערע [[דאקומענט|דאָקומענטן]] זענען אָפט געליינט דורך קאָמפיוטערס ניצנדיק אא"ד.
מען ניצט אא"ד כּדי צו גרינגערהייט דורכזוכן דרוקזאַכן למשל.


אא"ד איז וויכטיק פאַר מאָדערנע ייִדיש אויפן [[וועב]], ווײַל הײַנט זענען פאַראַן אַ סך ייִדישע אַלטע ביכער. דער [[יידישער ביכער-צענטער|ייִדישער ביכער־צענטער]] [[סקאנדירן|סקאַנדירט]] אַ סך פון זיי, און מען באַניצט אא"ד כּדי [[דיגיטאליזירן|דיגיטאַליזירן]] זיי.
פאָרעמען און אַנדערע [[פאפיר]]ענע [[דאקומענט|דאָקומענטן]] (למשל א [[פאס]] אדער דער אדרעס געשריבען אויף א [[קאנווערט]]{{הערה|{{לינק|אדרעס=https://www.explainthatstuff.com/how-ocr-works.html|קעפל=Optical character recognition (OCR)|שפראך=en}}}}) ווערן אָפט געליינט דורך קאָמפיוטערס ניצנדיג אא"ד. דער אא"ד סאפטווער פארגלייכט די [[פארעם|פארעמען]] פון די [[בוכשטאב]]ן מיט אנדערע בילדער פון די זעלבע בוכשטאבן, און אזוי שאפט עס א "[[טעקסט פייל]]" וואס מען קען ליינען, רעדאגירן, אדער [[זוכמאשין|אויפזיכן]], מיט א [[קאמפיוטער פראגראם]]. עס ווערט אויך געניצט אז א קאמפיוטער זאל קענען ליינען א [[PDF]]{{הערה|{{לינק|אדרעס=https://www.researchgate.net/publication/310645810_OCR_as_a_Service_An_Experimental_Evaluation_of_Google_Docs_OCR_Tesseract_ABBYY_FineReader_and_Transym|קעפל=OCR as a Service: An Experimental Evaluation of Google Docs OCR, Tesseract, ABBYY FineReader, and Transym|שפראך=en}}}} אדער בוכשטאבן וועלכע געפינען זיך אויף א [[פאטאגראף]], למשל אויף א [[שילד]] וואס געפינט זיך אויף א [[געביידע]] אינעם פאטאגראף.
 
==היסטאריע==
{{להשלים}}
דאס ערשטע [[פאטענט]] פאר מעכאַנישער אא"ד טעכנאלאגיע איז פונעם יאר 1929{{הערה|{{לינק|אדרעס=https://web.archive.org/web/20090816210246/http://ocrwizard.com/ocr-software/how-ocr-software-works.html|קעפל=How OCR Software Works|שפראך=en}}}}.
 
==רעפערענצן==
{{רעפערענצן}}


[[קאַטעגאָריע:קאמפיוטעריי]]
[[קאַטעגאָריע:קאמפיוטעריי]]
[[קאַטעגאָריע:ווייכווארג]]
[[קאַטעגאָריע:סאפטווער]]
[[קאַטעגאָריע:אויף יידיש]]
{{קרד/ויקי/יידיש}}
[[he:זיהוי תווים אופטי]]

יעצטיגע רעוויזיע זינט 22:16, 5 מערץ 2024

 

בילד מיט טעקסט אין לשון קודש געליינט דורך א קאָמפיוטער ניצנדיג אפטישע אותיות דערקענונג. ווי מען זעט אינעם בילד, זענען דא אסאך גרייזן, ווייל דער קאמפיוטער קען עס נישט געהעריג ליינען וויבאלד דער בילד איז נישט גענוג קלאר.

אָפּטישע אותיות־דערקענונג (ענגליש: optical character recognition ;ראשי תיבות: אא"ד) איז אַן עלעקטראנישער אדער מעכאַנישער פראָצעס דורך וועלכן אַ קאָמפיוטער פאַרוואַנדלט אַ בילד פון טעקסט וואס איז געדרוקט אדער געשריבן דורך דער האנט אדער דורך א שרייבמאשין, צו טעקסט וואָס אַ קאָמפיוטער קען פאַרשטיין.

מען ניצט אא"ד כּדי צו גרינגערהייט דורכזוכן דרוקזאַכן למשל.

פאָרעמען און אַנדערע פאפירענע דאָקומענטן (למשל א פאס אדער דער אדרעס געשריבען אויף א קאנווערט[1]) ווערן אָפט געליינט דורך קאָמפיוטערס ניצנדיג אא"ד. דער אא"ד סאפטווער פארגלייכט די פארעמען פון די בוכשטאבן מיט אנדערע בילדער פון די זעלבע בוכשטאבן, און אזוי שאפט עס א "טעקסט פייל" וואס מען קען ליינען, רעדאגירן, אדער אויפזיכן, מיט א קאמפיוטער פראגראם. עס ווערט אויך געניצט אז א קאמפיוטער זאל קענען ליינען א PDF[2] אדער בוכשטאבן וועלכע געפינען זיך אויף א פאטאגראף, למשל אויף א שילד וואס געפינט זיך אויף א געביידע אינעם פאטאגראף.

היסטאריע

דאס ערשטע פאטענט פאר מעכאַנישער אא"ד טעכנאלאגיע איז פונעם יאר 1929[3].

רעפערענצן

דאס איז נישט קיין המכלול ארטיקל, בלויז עפעס וואס ליגט דא ביז עס וועט ערזעצט ווערן מיט בעסערס. שרייבט עס איבער!