Linux,,, papierloze bureau: of de bestrijding van rommel of het bos te redden, al sinds de eerste elektronische registratie - en vele gebruikers een droom, wat mogelijk is.Maar het is nog steeds de ongrijpbare, in een klein deel van een plan, want wat je man, je kan het gewoon niet de controle van de acties van anderen, vandaag nog steeds veel ondernemingen, stuur je de rekeningen en de ontvangst.Kan je tenminste niet door de kast, maar je moet zoeken, - documenten in pdf -, de volledige tekst.Maak de scanner en weekend.,,, je kunt blijkbaar alleen scannen alles om het redden van het document als TIFF of jpeg bestand.Linux USB - scanner solide steun (of zelfs de Printer /fax /scanapparatuur en platen van machines of andere bijlage) als gevolg van gezonde projecten.Ook is er geen gebrek aan kwaliteit scan aanvragen, zoals an, xsane, of gewoon scannen.Maar je verloor je de beelden alleen zoeken om de inhoud van de documenten in de tekst, weet je nog, je kan niet alleen een document in het gebruik van de instrumenten van de regering van nationale eenheid te zoeken, maar om te zoeken naar de hele reeks documenten.,,,' OCR is waar.OCR gescande documenten en het imago van de eigenlijke tekst lettertype, en dat is precies wat we'. Later.Maar niet elke commando scan OCR programma voor een #. Documenten die het beste met 39; worden gecombineerd in één document, en ik hoop dat een stap in de goede richting.Het doel van de' gscan2pdf, een lichtgewicht grafische gebruikersinterface toepassing heeft een ingebouwde reden de scanner interface, OCR motor, geschreven tekst en het gebruik van OCRed pdf - bestanden die scan als een versterking van de capaciteit van de leesbaarheid achtergrond.,, gemonteerd, branden, je kan profiteren van de nieuwe gscan2pdf een van' projecten; websites, met inbegrip van archieven en teer toeren.Als je een van de uitkeringen op basis van het project (met inbegrip van 'ubuntu'), moet het door het pakket manager (is het misschien de moeite waard in de distributie en andere tafel).Als je de bron van de installatie, moet je een bibliotheek, perl, imagemagick, en de andere een gemeenschappelijk pakket.Misschien heb je alleen de afhankelijkheid van de installatie is: gocr de tesseract OCR motor, ter ondersteuning van het pakket, unpaper spijkerschrift, alsmede van de bibliotheek en de vorm van het beeld,.Unpaper is een scan na de verwerker, schoonmaken en OCR betere prestaties, alsmede een beeld van formaat, zoals behoud van PDF, tekst en beeld.,, als je om gscan2pdf, de meeste grote raam is door een preview panel twee etikettering: "beeld" en "output"). Links is; een postzegel ruit, kun je ook een scan de pagina 's voor je tussen de mensen.De procedure is eenvoudig: klik op een icoon van de werkbalk, drijvende - raam open.Als je toevallig een scanner in verband met het kiezen van de juiste een van de drop - apparatuur.Zeven voor de controle en de optie, je kunt ophouden, maar wanneer krijg je "; -" knop op de bodem van de pagina 's, en gscan2pdf scan, ocr, naar pagina' s in de lijst van de postzegel browser, Scan. Raam open staat, dus als je correct. Je kunt geen interface verdwijnen Of je pagina 's na de andere pagina' s.Integendeel, als je veel pagina 's scan aanvragen als xsane, je moeten schorsen en behoud van elk te blijven. En, de meeste energie kost je' in de loop van de scanner verkregen correct."Model" - etiket van de scanner is gebleken; de functie van de hardware - steunen, maar in mijn ervaring, en met de' T - selectie van de standaardwaarde van start is bijzonder nuttig.Bijvoorbeeld, de scan resolutie kan worden vastgesteld voor 200 of meer, en je kan er zeker van zijn dat het bijna een kleur of een beeld vormen.Wat is de helderheid, de definitie van verschillende kleuren, en correctie van opties voor de verbetering van de resultaten van je is een twijfelgeval. Je kan het mooie beeld door aanpassing van de instellingen, maar tenzij je documenten en' een nieuwe scan moet het originele dossier van de kwaliteit van de juridische redenen, het ware doel is te komen tot een betere resultaten (OCR in de juridische situatie, je moet redden van de oorspronkelijke in ieder geval...).,, heb ik moeite " preview " etikettering van apparatuur, en "facultatief"; rekening zodat je een film en de transparantie van de functie van de scanner, dit is niet het geval, dan hebben we' in de hier beschreven, maar het kan ook dat je als je een keuze van de externe documentinvoer.Maar goed, de kwaliteit van de resultaten als het gaat om een scan, en de keuze van de passende OCR motor.,,, je keuze van de OCR motor " na verwerking ";" deel van de pagina 's optie "etikettering.Aanbeveling motor, ik vond de tesseract krijgt de beste resultaten, maar het is het waard om de exploitatie van een paar monsters is zeker: ik' dat weet ik zeker, verschillende soorten documenten kunnen verschillende tarieven voor de betere OCR algoritme."Het beeld" optie biedt je een unpaper kenmerken, zoals de kleur van massief blok uit te filteren, waarbij de grens, en automatisch een vertekend beeld.Het kan een dramatisch effect hebben op de test, maar ik unpaper alleen in de juiste bepaalde afwijking, buiten het in de war, geen goed gebruik van te veel in de marge.Het beste advies: er moet sprake zijn van een vaste hand, als je dichtbij de scanner.,, paarden en' een kopie, OCR altijd niet perfect is, kan je het openen van een ingebouwd in elke pagina 39 enredacteur van de "output");;; de etikettering.Als je' gelukkig inhoud van het redden van de werkbalk " " of de menu 's dossier.Dit is een vorm van dialoog tussen de documenten in plaats van de normale dwerg "dossier"; de ramen, is het begin van de chaos.Maar je kan je redden van het vliegtuig beeld (SCAN TIFF, Papoea - Nieuw - Guinea, enz.), de produktie van enige vorm van de tekst en beeld op het behoud van de gescande pdf - en alsmede.Red je ook je werk als een "; gscan2pdf herstel na de zitting ".,, alsmede, voor degenen die niet vertrouwd zijn met het is een open vorm van speciale scannen bestanden.Het behoud van de onafhankelijkheid van de tekst en de achtergrond van de beelden en kan het bereiken van een hoog - laag niveau, van goede kwaliteit, omdat een slimme codering.- is een bredere steun voor de toepassing van de regeling, maar het is de beste keuze.Het vreemde is, zal de uitvoer van gscan2pdf scan als voetnoot formaat, maar doen het imago als een TIFF - nee, met inbegrip van de tekst lijkt OCR.Ik ook niet' weet niet en' dingen kan zeggen, gscan2pdf en' de beste functie; opslag van documenten, en je kan het gebruiken om meer blz. -.Als de scan pagina 's, "blz. Optie", de etikettering is een functie van digitale per continue scan als de volgende pagina' s samengestelde document.Met een etiket op de pagina 's, en je kan worden aangemerkt als een.Deze kenmerken maken de gscan2pdf schrijft veel pagina 's in pdf - bestanden, zoals dat kan worden aangetoond dat de lezer, zoeken en de pagina' s van het net een dure computer gebruikt output.,, scanners, pas op, gscan2pdf zijn eigenaardigheden.Een vriend van mij zei onlangs dat hij niet van hoge kwaliteit produceren gescande beelden van toepassing, dat op elk van de visuele geneigd blz, als een parallellogram.Helaas is deze fout is het meest waarschijnlijk is een gezond verstand gebruiken, omdat de kwestie van de verschillende aan de achterkant van de familie van verschillende scanner, moeilijk te vinden, moet je gaan. En de behandeling die niet volledig op de hoogte van de OCR.Het is een onvolmaakte wetenschap, en jij, zal door elke pagina 's tekst de juiste erkenning voor fouten.Gscan2pdf geen ingebouwde spellingscontrole, dit is een weg zijn om anderen te helpen.Ja, het kan een spellingscontrole is goed (zoals op de eigen fouten gecorrigeerd wanneer OCR), maar de waarheid is, zou leiden tot verschillende tekens vervangen door een groep dan menselijke fouten doen wanneer het typen, dus op basis van ispell automatische spellingchecker, herschreven of andere open source - motor van meer dan assistent verergeren.Het zal merken dat veel fouten, maar zal niet helpen, omdat het afkomstig is van de verkeerde mensen visuele gelijkenis, niet getypt of spelling zit in de problemen. En zal je papieren naarOCR en 39 andere keuze; ED digitale documenten, ook.An, bijvoorbeeld, maakt je naast de scan uitvoeren ocr, maar het ontbreken van automatische produktie en pdf - functies, zodat de gscan2pdf zo gemakkelijk te gebruiken.De scan.
Weekend - projecten: het creëren van een papierloos kantoor
Previous:- stop in
Next Page:Hoe