tika udvinding af ms - kontor filer

, er angivet nedenfor, er programmet til at udvinde indhold og metadata fra microsoft office dokument., import java.io.file; import java.io.fileinputstream; import java.io.ioexception; import org.apache.tika.exception.tikaexception; import org.apache.tika.metadata.metadata; import org.apache.tika.parser.parsecontext; import org.apache.tika.parser.microsoft.ooxml.ooxmlparser; import org.apache.tika.sax.bodycontenthandler; import org.xml.sax.saxexception; offentlige klasse msexcelparse {offentlige statisk tomrum vigtigste (sidste snor -] args) kaster ioexception, tikaexception (//påvisning af filen type bodycontenthandler kontaktperson = nye bodycontenthandler(); metadata metadata = nye metadata(); fileinputstream inputstream = nye fileinputstream (ny database ("example_msexcel. xlsx"); parsecontext pcontext = nye parsecontext(); //ooxml parser ooxmlparser msofficeparser = nye ooxmlparser (); msofficeparser. analysere (inputstream, kontaktperson, metadata, pcontext) system. println ("indholdet af dokumentet:" + kontaktperson. tostring()) system. println ("metadata af dokumentet:"); snor [] metadatanames = metadata. names(); (string navn: metadatanames) (system. println (navn + ":" + metadata. kom (navn)}}}, medmindre ovennævnte kode som, msexelparse - og udarbejde det fra kommandoen omgående ved hjælp af følgende kommandoer:, javac msexcelparse.java java msexcelparse under givet er det billede af example_msexcel.xlsx fil, da excel - fil har følgende egenskaber:,, efter udførelsen af ovennævnte program, du vil få følgende output.,, output:,, indholdet af dokumentet: sheet1 navn alder betegnelse løn - 50 manager 50.000 raheem 40 souschef 40000 robert 30 superviser 30000 sita - 25 - 25000 sameer 25 afsnit bestemmer 20.000 metadata af dokumentet: meta: oprettelsesdato: 2006-09-16t00:00:00z dcterms: modificerede: 2014-09-28t15:18:41z meta: redde dato: 2014-09-28t15:18:41z anvendelse navn: microsoft excel - udvidet egenskaber: virksomhed: dcterms: oprettet: 2006-09-16t00:00:00z senest ændret: 2014-09-28t15:18:41z anvendelse version: 15.0300 dato:2014-09-28t15:18:41z udgiver: modificerede: 2014-09-28t15:18:41z oprettelsesdato: 2006-09-16t00:00:00z udvidet egenskaber: appversion: 15.0300 beskyttede: falske dc: udgiver: udvidet egenskaber: anvendelse: microsoft excel - content type: anvendelse /vnd.openxmlformats-officedocument.spreadsheetml.sheet sidste redde dato: 2014-09-28t15:18:41z,

Passing Excel
Excel Properties



Previous:
Next Page: