lucene - analyse

, som vi har set i det foregående kapitel, lucene - indeksering proces, lucene anvendelser, indexwriter, der analyserer de, dokument (er) ved hjælp af, analyzer, og så skaber /åbne /edit fortegnelser, som kræves.i dette kapitel vil vi drøfte forskellige typer analyzer genstande og andre relevante genstande, der anvendes ved analyse.forståelse, analyse og hvordan analysatorer arbejde vil give dig store indsigt i, hvordan lucene fortegnelser og dokumenter. efter en liste over ting, som vi kan diskutere. senior - klasse & beskrivelse 1token, symbolsk repræsenterer tekst eller et ord i et dokument med relevante oplysninger om dets metadata (position, begynder at udligne, ende opvejet, symbolsk art og dens holdning tilvækst). 2tokenstream, tokenstream er en produktion af analyse, og det omfatter en række poletter.det er et abstrakt klasse, 3analyzer, det er abstrakt basisklasse for hver type analysator., 4whitespaceanalyzer, denne analyzer spilts teksten i et dokument på basis af whitespace., 5simpleanalyzer, denne analyzer spilts teksten i et dokument på ikke - brev tegn, og så små., 6stopanalyzer, - bygge - og anlægsarbejder svarende til simpleanalyzer og fjerne den fælles ord som "en", en "," "osv. 7standardanalyzer, dette er den mest sofisticated analysator og er i stand til at håndtere navne og e - mail - adresse osv. det lowercases hvert tegn og fjerner fælles ord og tegnsætning, hvis nogen.,,



Previous:
Next Page: