LexDev
0x0000
SYS_STATUS: //INITIALIZING KERNEL...
000%
Wróć do bloga

Jak zamienić skan umowy na przeszukiwalny PDF

Kolejny stos załączników dostarczony od klienta w postaci zdjęć lub luźnych skanów? Zmiana na wersję tekstową dzięki technologii OCR to absolutna podstawa.

Zdarza Ci się otrzymać od klienta bardzo ważny, archiwalny egzemplarz umowy w postaci nieczytelnego obrazu albo starego skanowanego pliku ze zżółkłym tłem wykonanym przez aparat komórkowy? Spisywanie tego, a następnie żmudne poszukiwanie klauzul to najmniej przyjemna część procedowania dowodowego. Prawnicy muszą bezwzględnie sięgnąć po broń XXI wieku ułatwiającą takie analizy - OCR skan dokumentu (Optical Character Recognition / optyczne rozpoznawanie znaków).

Dzięki zastosowaniu wysoce zaawansowanych sieci neuronowych, systemy OCR potrafią przeanalizować płaski obraz rastrowy jako pismo blokowe, zdejmując z niego tekst maszynowy. Zwykłe zdjęcie kartki staje się ułożonym, elektronicznym zasobem, po którym można mknąć prostym skrótem Ctrl+F lub zaznaczać ustępy w celu kopiowania.

Dlaczego darmowy OCR często nie działa dobrze?
Darmowe opcje potrafią zawodzić, kiedy w grę wchodzą:
- Polskie znaki i skomplikowana szeryfowa czcionka maszynopisów, często utożsamiająca (ł) z (l) itd.
- Skoszone bądź słabo oświetlone fragmenty umów.
- Tajemnica prywatności – co staje się najważniejsze, a bezduszne wysyłanie istotnej firmowej umowy zagranicznym serwerom przyprawia o zawał każdego Inspektora Danych Osobowych.

Jeżeli wykonujesz procedurę, jaką jest OCR skan dokumentu, pamiętaj, aby stawiać wyłącznie na wyspecjalizowane serwisy zbudowane przy pomocy nowoczesnych mechanizmów dedykowanych prawu, nie niszcząc oryginalnych grafik stanowiących podpis, pieczęcie notarialne i parafki stron, ponieważ one wszystkie stanowią bezsporny materiał uwarunkowujący poprawność dokumentu.

Zautomatyzuj to z LexDev
Work in Progress

Masz dość ręcznego przepisywania papierowych załączników klienta? Skorzystaj z funkcjonalności Narzędzie PDF by w pełni konwertować je do edytowalnego tekstu.