apache - poi ord - tekst, udvinding

, i dette kapitel forklares, hvordan til at udtrække en enkel tekst data fra et word - dokument med kaffe.hvis du vil have til at udvinde metadata fra word - dokument, gøre brug af apache tika.,. docx filer, vi bruger den klasse org.apache.poi.xwpf.extractor.xpffwordextractor at ekstrakter og vender simple data fra et nyt dossier.på samme måde, som vi har forskellige metoder til at udvinde positioner, fodnoter, tabel data osv. fra et ord fil. følgende kode viser, hvordan til at udtrække en enkel tekst fra et ord fil:, import java.io.fileinputstream; import org.apache.poi.xwpf.extractor.xwpfwordextractor; import org.apache.poi.xwpf.usermodel.xwpfdocument; offentlige klasse wordextractor {offentlige statisk tomrum vigtigste (string [] args) gør undtagelse (xwpfdocument docx = nye xwpfdocument (nye fileinputstream ("create_paragraph. docx"); //anvendelse af xwpfwordextractor klasse xwpfwordextractor vi = nye xwpfwordextractor (docx) system. println (vi. gettext())), medmindre ovennævnte kode, som wordextractor. java., udarbejde og gennemføre det fra - hurtig som følger: $javac wordextractor.java $java wordextractor, skaber det følgende output: på tutorialspoint.com stræber vi hårdt for at give kvalitet tutorials for selvlæring formål inden for akademikere, informationsteknologi, forvaltning og programmeringssprog.,



Previous:
Next Page: