tika - udvinding af xml - dokument

, er angivet nedenfor, er programmet til at udvinde indhold og metadata fra en xml - dokument, import java.io.file; import java.io.fileinputstream; import java.io.ioexception; import org.apache.tika.exception.tikaexception; import org.apache.tika.metadata.metadata; import org.apache.tika.parser.parsecontext; import org.apache.tika.parser.xml.xmlparser; import org.apache.tika.sax.bodycontenthandler; import org.xml.sax.saxexception; offentlige klasse xmlparse {offentlige statisk tomrum vigtigste (sidste snor [] args) kaster ioexception, saxexception, tikaexception (//påvisning af filen type bodycontenthandler kontaktperson = nye bodycontenthandler(); metadata metadata = nye metadata(); fileinputstream inputstream= nye fileinputstream (ny database ("pom. xml -"); parsecontext pcontext = nye parsecontext(); //xml - parser xmlparser xmlparser = nye xmlparser(); xmlparser. analysere (inputstream, kontaktperson, metadata, pcontext) system. println ("indholdet af dokumentet:" + kontaktperson. tostring()); system. println ("metadata af dokumentet:"); snor [] metadatanames = metadata. names(); (string navn: metadatanames) (system. println (navn + ":" + metadata. kom (navn)}}}, medmindre ovennævnte kode, som xmlparse -, og udarbejde det fra kommandoen omgående ved hjælp af følgende kommandoer:, javac xmlparse.java java xmlparse under givet er det billede af pom.xml, har dette dokument.e følgende egenskaber:,, efter udførelsen af ovennævnte program, du vil få følgende output.,, output:,, indholdet af det dokument, org.apache.tika: 4.0.0 tika 1,6 org.apache.tika tika centrale 1,6 org.apache.tika tika parsers 1.6 src - selv de stik af 3.1 1,7 1,7 metadata af dokumentet: content type: anvendelse /xml -,

XML Document
XML Document1



Previous:
Next Page: