Introduksjon til Apache Lucene Og Solr

Lucene og Solr er state of the art søketeknologi tilgjengelig gratis som åpen kildekode fra The Apache Software Foundation. Lucene er den underliggende søke bibliotek og Solr er en plattform bygget på toppen av Lucene som gjør det enkelt å bygge Lucene-baserte applikasjoner. Begge er fullverdig og har gode resultater, relevans ranking og skalerbarhet. Disse teknologiene er brukt i dag av tusenvis av organisasjoner og makt betydelig søkeapplikasjoner på AOL, Comcast Interactive Media, IBM, Netflix, Linkedin og MySpace.

velge en søkemotor

I det siste tiåret en enkelt søkemotorteknologi har noen ganger vært den dominerende valget for bedrifter som er interessert i å produsere sin egen søkefunksjon for et nettsted, produkt eller intern eller ekstranett bruk. Ingen produktet kan dekke alle behov. Men en enkelt teknologi ble anerkjent som standard valg, og brukerne kan lettest startet søket evaluering ved å spørre om det var grunner til ikke å bruke det. I dag, jeg tror Apache Lucene og Solr er standard fulltekstsøk teknologi for organisasjoner

Bygg din søkeapplikasjon med Lucene /Solr

Bygge god fulltekstsøk er en krevende oppgave, og å ha beste teknologien er bare en del av løsningen. Søkemotorer som Lucene /Solr har gode standardinnstillinger og verktøy for å gjøre programmene ikke bare jobbe, men for å være effektive. Men de beste søke programmer krever forståelse både data og brukere informasjon må samles og indeksert fra filsystemer, databaser eller nettsteder og normalisert for søk. For eksempel kan ett sett med dokumenter viser til et dokument navn som tittel, en annen til det som en posisjon; et søk etter "rev" bør nok finne elementer med "rever" i det også. Potensielle brukernes kompetanse og kjennskap til data må også vurderes i design, og bruk av synonymer kan være nødvendig (f.eks hjerteinfarkt = hjerteinfarkt). Relevans vurdering vil vanligvis kreve tuning basert på hva brukerne faktisk gjør for å forbedre en innledende program effektivitet. Mer avanserte funksjoner som "automatisk tilbakemelding 'kan være nyttig (og, på den annen side, kan mange ofte forsøkt innsats på å forbedre søket bli ignorert til fordel for dagens beste praksis).

En stor søkeapplikasjonen slik som Google er bare delvis en suksess av rå teknologi. Det gjenspeiler også en ekspert forståelse av data og brukere av det aktuelle programmet. Med mer enn nok gode svar på et søk på Internett og enda flere dårlige svar, vil en popularitet vektet ranking sile ut de dårlige data og finne mer enn nok gode data for Googles vanlige brukere. Men noen særlig søkeapplikasjon kan ha svært forskjellige data og brukere. Dårlige data vanligvis ikke overstiger gode data for de fleste søkeapplikasjoner, og finne de beste resultatene kan være viktigere enn å finne gode nok resultater. Sikkerhet og personvern kravene til en typisk applikasjon kan også være svært forskjellig fra de av en offentlig Internett-tjeneste (eller de av en etterretningsbyrå). Kunsten godt søk er å være i stand til å forvandle god generisk teknologi til en god spesifikke applikasjoner.

De ferdigheter for å bygge en god søkeapplikasjon kommer hovedsakelig fra å ha bygget andre seg, men for de fleste brukere, og bygge et søk Søknaden er en sjelden forekomst Av den grunn kan det være nyttig å oppsøke ekspert og erfarne ressurser til å bistå med søknad design, utvikling og /eller distribusjon, akkurat som det kan være verdifullt å sikre dyktige støtteressurser for løpende vedlikehold. Kommersielle selskaper som Lucid Imagination er basert på åpen kildekode, men kan gi en slik formell støtte og hjelp for folk som bruker disse open source verktøy. Anmeldelser



Previous:
Next Page: