staan, zijn de volgende procedures van Microsoft Office document afkomstig van gegevens en metagegevens, de invoer van java.io.file; de invoer van java.io.fileinputstream; de invoer org.apache.tika.exception.tikaexception; org.apache.tika.metadata.metadata, invoer, invoer org.apache.tika.parser.parsecontext; de invoer van org.apache.tika.parser.microsoft.ooxml.ooxmlparser; de invoer van org.apache.tika.sax.bodycontenthandler; de invoer van org.xml.sax.saxexception; de cursus (publiek msexcelparse statische leegte belangrijkste ([...] dringt erop gegooid ioexception serie) inspectie van documenten, tikaexception {aard ///////bodycontenthandler processor = nieuwe bodycontenthandler (); - = nieuwe metagegevens (f);Ileinputstream Port = nieuwe fileinputstream (nieuwe documenten ("example_msexcel. Xlsx"); parsecontext pContext = nieuwe parsecontext (); ///////ooxml parser ooxmlparser msofficeparser = nieuwe ooxmlparser (); msofficeparser. Analytische (Port, de verwerking, de metagegevens, PCONTEXT); het systeem. Uit de leegte fac (". De inhoud van het document:" en de procedures voor de behandeling van ()); het systeem. Tostring.. leegte fac ("- documenten:"); akkoord [] = - metadatanames. Names (); voor (naam: metadatanames) {systeem. Leegte fac (naam + ":" + metagegevens. (naam));}}}, red. Code, msexelparse. Java, en het opstellen van het bevel tot het volgende commando van Java, msexcelparse.java msexcelpa opgenomen:Natuurlijk, de hieronder gegeven is example_msexcel.xlsx dossier foto, bepaald in het dossier met de volgende kenmerken: de uitvoering van de programma 's, boven, en je krijgt de volgende produktie, de produktie van:,,, de inhoud van het document: naam en leeftijd van het sheet1 salaris lamu 50 manager 50000 la - 40 40000 30000 assistent manager... Robert 30 25 bevoegde personeel de 25 vergoedingen 20000 25000 - documenten: element: het creëren van een datum: 2006-09-16t00:00:00z dcterms: gewijzigd: 2014-09-28t15:18:41z element: behoud van de datum van toepassing van Microsoft Excel: naam: uitbreiding van 2014-09-28t15:18:41z eigenschappen: onderneming: dcterms: de datum van de laatste wijziging: het creëren van Een 2006-09-16t00:00:00z: 2014-09-28t15:18:41z toepassing versie: 15.0300:2014-09-28t15:18:41z uitgever: wijziging van de datum van de uitbreiding: 2014-09-28t15:18:41z creëren: 2006-09-16t00:00:00z eigenschap: appversion:15.0300 bescherming: valse dc: Uitgever: uitbreiding van de toepassing van de eigenschap: Microsoft Excel type inhoud: behoud van de datum van toepassing van de laatste 2014-09-28t15:18:41z /vnd.openxmlformats-officedocument.spreadsheetml.sheet:,
MS Office - documenten afkomstig van
Previous:Tika winning ODF
Next Page:Uit de tekst van documenten