Tekstien ja kuvien optimointi OCR-ohjelmille

Avoin
Tämä aihe sisältää 1 vastaus, 2 kirjoittajaa, ja siihen kirjoitti viimeksi maijavari maijavari 5 vuotta, 8 kuukautta sitten.
Tekijä
PRX
Osallistuja (Participant)

Mm. aikakauslehdistä skannattaville tekstintunnistusohjelmilla käsiteltäville sivuille on hyvä saada tekstin tausta mahdollisimman valkoiseksi ja toisaalta itse teksti mahdollisimman mustaksi, eli pyritään kirjainten hyvään kontrastiin riittävällä terävyydellä tunnistuksen optimoimiseksi. Toisaalta samat säädöt vaikuttavat myös sivulla oleviin kuviin, ts. niitä pitäisi käsitellä erillisinä etteivät kuvat liiaksi kärsi optimoidun tekstin takia.

Takavuosina käytettiin Scan Tailor -ohjelmaa, mutta sen kehitys on tainnut jäätyä tekijöiden innon laannuttua. Onko muita tekstin esikäsittelyohjelmia ja täytyykö kuvat käsitellä esim. GIMP-kuvankäsittelyohjelmalla erikseen, vai löytyykö sovelluksia jotka huomioivat molemmat?

maijavari
maijavari
Osallistuja (Participant)

    Hei,

    Ei ole tullut kokeiltua, mutta Githubissa näkyy olevan linkki suht tuoreeseen Scan Tailoriin, viime vuoden lopulta:
    https://github.com/4lex4/scantailor-advanced/releases

    Mahtaako olla sen parempi kuin vanha, en tiedä, mutta ei kai siitä muuta harmia ole kuin kokeilun vaiva. Ainakin sen pitäisi yhdistää Scan Tailorin Featured- ja Enhanced-versioiden ominaisuudet.

    Maija

    Alueelle ‘OHJELMAT’ ei voi kirjoittaa uusia aiheita eikä vastauksia olemassaoleviin aiheisiin.