Recunoașterea textului și extragerea datelor unui orar școlar prezentat în format PDF (IV)
Pentru situația concretă în care este provocat, Tesseract „judecă” (angajând rețeaua de neuroni cu care este înzestrat) pe baza unor exemple de recunoaștere corectă pe care a fost „antrenat” în prealabil — exemple din care s-au sintetizat anumite caracteristici de limbă și de scriere, organizate din timp în anumite "baze de date" (fișiere "*.traineddata").
Recunoașterea textului și extragerea datelor unui orar școlar prezentat în format PDF (III)
Redenumirea fișierelor, după clasa al cărei orar este conținut. Eliminarea unor zone de pixeli inutile; programul interactiv display, comanda mogrify, etc. din ImageMagick.
Recunoașterea textului și extragerea datelor unui orar școlar prezentat în format PDF (II)
transformări între diverse formate de fișier, pentru a folosi Tesseract
Recunoașterea textului și extragerea datelor unui orar școlar prezentat în format PDF (I)
Cum extragi datele de pe un orar scris „de mână”?
Între numerele reale și numerele-mașină
Întreprindem aici o sinteză ideatică, lejeră și incompletă, vizând rosturile (oricând, se poate pleca de la [2] pentru referințe istorice precise și pentru diverse aspecte legate de aritmetica în „virgulă flotantă”). Precizăm totuși că ne-am apucat de aceasta nu de dragul artei, ci în contextul lucrului din [1], întâmpinând anumite dileme asupra corectitudinii rezultatelor obținute în diverse limbaje, operând cu numere foarte mari.
vezi Cărţile mele (de programare)