OCR (Optical character recognition) optimizacija

Odgovori
caddy
Prispevkov: 418
Pridružen: 03 Mar 2014, 12:55

OCR (Optical character recognition) optimizacija

Odgovor Napisal/-a caddy » 11 Jul 2016, 14:04

Na kakšen način lahko izboljšam prepoznavanje pisave v SOLIDWORKS Inspection z uporabo funkcije OCR?
omarinkovic
Site Admin
Prispevkov: 141
Pridružen: 08 Maj 2014, 12:34

Re: OCR (Optical character recognition) optimizacija

Odgovor Napisal/-a omarinkovic » 11 Jul 2016, 14:08

SOLIDWORKS Inspection nam z funkcijo OCR olajša zajem podatkov podatkov risb (PDF ali TIFF format). Pogoja za čim boljše prepoznavanje simbolov različnih pisav je da imamo sliko visoke resolucije in standarnde pisave kot je naprimer Century Gothic.

V primeru da imamo pisavo katera ni dodana v knjižnico pisav v SOLIDWORKS Inspection (Options->Imaging/OCR->OCR Dictionary Font) pa lahko sami ustvarimo knjižnico pisav in jih dodamo pod "OCR Custom Dictionary".

Naprimer imamo risbo, ki ima pisavo Simplex.
slika1.jpg
Ko uvozimo in želimo zajeti naprimer opombo na risbi z uporabo samo standardnih pisav imamo naslednji rezultat
slika2.jpg
V tem primeru lahko z funkcijo OCR Editor naučimo program kateri simbol pisave kaj pomeni.
Če poznamo poznamo tip pisave si lahko vse črke, številke in znake shranimo v PDF in nato uporabimo PDF v OCR Editor.
slika3.jpg
OCR Editor lahko zaženemo pod Options->Imaging/OCR->OCR Dictionary Font->OCR Custom Dictionary
slika4.jpg
Ko se nam prikaže okno OCR Editor dodamo PDF z željenimi simboli pod Add Drawing.
slika5.jpg
Za zajem simbolov uporabimo funkcijo Extract in zajamemo vsak simbol posebaj. Nato pa v Extraction oknu na levi strani pod Value vpišemo željeno vrednost simbola.
Za vse zajete simbole v dokumentu pa se v spodnjem delu okna ustvari tabela Box Characteristic kjer lahko vidimo seznam vseh zajetih simbolov in pozicij na listu.
slika6.jpg
Ko imamo zajete simbole knjižnico shranimo z Save ikono in shranimo v privzeto mapo SOLIDWORKS Inspection, ki se običajno nahaja na naslednji lokaciji "C:\ProgramData\SolidWorks\SOLIDWORKS Inspection 2016 Standalone\TrainableOCR"
slika7.jpg
V nastavitvah SOLIDWORKS Inspection pod Options->Imaging/OCR->OCR Dictionary Font->OCR Custom Dictionary sedaj dodamo Traineddata datoteko pisave in to pisavo uporabimo za zajemanje podatkov na risbi.
slika8.jpg
Sedaj lahko brez večjih popravkov zajamemo opombe in dimenzije v SOLIDWORKS Inspection tudi če ni uporabljena standardna pisava.
slika9.jpg
Odgovori