brug antiword at udvinde tekst fra. doc filer

, jeg ved, hvad du tænker: "hvorfor ikke bare bruge openoffice at få teksten, har du brug for?"der er en god grund.hvis du nogensinde har brugt et tekstbehandlingssystem at få rå tekst fra en anden, du ved, at formatering ofte er efterladt.for enden af vejen bogstaver osv. kan være at skære - og indsætning af en tekst fra en kilde til yderligere et problem (især, når man går fra en. doc fil en html ende). dette har givet mig mange spørgsmål, når jeg har skrevet artikler - at blive smurt ind i, sige, ghacks.jeg har set formatering strenge efterlod kun er nødt til at gå tilbage og sletter dem. når udvinder tekst med et redskab, som antiword, du ikke har et problem.og selv om antiword er en command-line eneste værktøj, er det ikke svært at installere eller anvendelse.med dette redskab, du kan enten ekstrakt teksten til omgående at standard output (terminal vindue), eller de kan tage den til en tekst.begge metoder er enkle, både er effektiv. antiword, installation, montering af antiword kan gøres på to måder: kommandolinjen eller gui.hvis du ønsker at bruge vejledningen fyre op i din add /fjerne software nytteværdi, gør for at finde en antiword, udvælge de resultater, og klik finder anvendelse.vil du også ønsker at installere catdoc, som så kan være monteret med den samme metode. hvis du er delvis at kommandolinjen du kan åbne en konsol og udstede en kommando svarer til:,, sudo passende få installere antiword catdoc, yum installere antiword catdoc, en af dem er sikker på, at de ansøgninger om din maskine. nu, hvor er det redskab, der anvendes?,, grundlæggende brug, den grundlæggende struktur af antiword kommando er: antiword [muligheder] fil. doc, når kommandoen over anvendes, vil du se teksten fra. doc fil skriftrulle i konsol vindue.det er ikke mange muligheder, men er nyttige: - en [papersize] produktion i adobe pdf - format.du er nødt til at præcisere papersize for dokumentet.gyldig papersizes: a3 a4 a5, b4 og b5,, udøvende, blad, juridiske, brev, note, quarto, erklæring eller ugeblad. - f produktion i form af formaterede tekst.dette vil trykke, modige, modige tekst * *, kursiv som /kursiv /, og underlinedtext som _underlined_. - jeg dette definerer de image.0 = use lejlighedsvist ghostscript udvidelser.1 = ingen billeder.2 = efterskrift niveau 2.3 = efterskrift niveau 3. - m, som unicode for kortlægning fil at bruge.du kan finde en liste over tilgængelige kortlægning af filer, /bar /andel /antiword,., så at se teksten fra file.doc, du ville udstede kommandoen:, antiword - f fil. doc, der hurtigt ville rulle indholdet af sagsakterne i konsol vindue.ikke til megen hjælp, hvis du har brug for til at kopiere og forbi sidste smule - - eller du kan maksimere konsol til se hele teksten.i stedet kan du kat teksten til en fil, som så:, antiword - f file.doc > fil. txt, denne tekst kan nu ses med kommandoen:,, mindre fil. txt, pdf - format, lad os sige, at du ønsker at eksportere teksten fra. doc dokument til en. pdf - dokument.tro det eller ej, det er enkelt.for det får du brug for den mulighed, - p, sammen med den tilknyttede papir størrelse.så lad os sige, at vi ønsker at eksportere det dokument, i et brev af pdf - dokument.for at gøre dette spørgsmål kommandoen:, antiword - p brev file.doc > fil. pdf, du vil løbe ind i kortlægning spørgsmål her.hvis du vil højst sandsynligt vil du nødt til at fortælle antiword at anvende 8859 - 1 kortlægning med kommandoen:,, antiword 8859 - 1 - m - p file.doc > fil. doc,,, file.doc, sag vil være en læselig pdf - dokument, du kan nu bruge.,, sidste tanker, dette er helt klart kun "skelettet" af antiword.med denne kommando - og andre du rigtig kreative og oprette automatiske udvinding manuskripter og meget mere.hvis du gør det meget indsætning i formater, der ikke kan tåle transport returnes eller for enden af vejen, er, antiword er den perfekte løsning for dig.



Previous:
Next Page: