tika - udvinding af odf

, er angivet nedenfor, er programmet til at udvinde indhold og metadata fra åbne kontor document format (odf)., import java.io.file; import java.io.fileinputstream; import java.io.ioexception; import org.apache.tika.exception.tikaexception; import org.apache.tika.metadata.metadata; import org.apache.tika.parser.parsecontext; import org.apache.tika.parser.odf.opendocumentparser; import org.apache.tika.sax.bodycontenthandler; import org.xml.sax.saxexception; offentlige klasse opendocumentparse {offentlige statisk tomrum vigtigste (sidste snor [] args) kaster ioexception, saxexception, tikaexception (//påvisning af filen type bodycontenthandler kontaktperson = nye bodycontenthandler(); metadata metadata = nye metadata(); fileinputstream inputstream = nye fileinputstream (ny database ("example_open_document_presentation. odp"); parsecontext pcontext = nye parsecontext(); //åbent dokument parser opendocumentparser openofficeparser = nye opendocumentparser (); openofficeparser. analysere (inputstream, kontaktperson, metadata, pcontext) system. println ("indholdet af dokumentet:" + kontaktperson. tostring()) system. println ("metadata af dokumentet:"); snor [] metadatanames = metadata. names(); (string navn: metadatanames) (system. println (navn + ":" + metadata. kom (navn)}}}, medmindre ovennævnte kode så, opendocumentparse - og udarbejde det i kommando omgående ved hjælp af.e efter ordre:, javac opendocumentparse.java java opendocumentparse under givet er det billede af example_open_document_presentation. odp:,, dette dokument har følgende egenskaber:,, efter udførelsen af ovennævnte program, du vil få følgende output.,, output:,, indholdet af dokumentet: apache tika apache tika er en ramme for content type påvisning og indhold, ekstraktion, som blev designet af apache software - fonden.det opdager og ekstrakter metadata og struktureret tekst indhold fra forskellige typer af dokumenter, som f.eks. regneark, tekst - dokumenter, billeder eller pdfs herunder lyd eller billede inputformater til vis grad.metadata for dokument: redigering cyklusser: 4 meta: oprettelsesdato: 2009-04-16t11:32: 32.86 dcterms: modificerede: 2014-09-28t07:46: 13.03 meta: redde dato: 2014-09-28t07:46: 13.03 senest ændret: 2014-09-28t07:46: 13.03 dcterms: oprettet: 2009-04-16t11:32: 32.86 dato: 2014-09-28t07:46: 13.03 modificerede: 2014-09-28t07:46: 13.03 nbobject: 36 redigerede tid: pt32m6s oprettelsesdato: 2009-04-16t11:32: 32.86 objekt tæller: 36 meta: formål: 36 - generator: openoffice /4.1.0 $win32 openoffice. org_project /410m18 $build-9764 content type: anvendelse /vnd.oasis.opendocument.presentation sidste redde dato: 2014-09-28t07:46: 13.03.

Presentation
Example2



Previous:
Next Page: