Enterprise search
120 likes | 272 Vues
Enterprise search. Toteutustekniikka. Mikko Uusitalo Tampereen ammattikorkeakoulu. Sisältö. Enterprise search Google Search Appliance Ylläpito Integrointi Ongelmia ja ratkaisuja. Enterprise search. Yksi hakupalvelu yhdistää useat tietolähteet Yhtenäinen hakukokemus
Enterprise search
E N D
Presentation Transcript
Enterprise search Toteutustekniikka Mikko Uusitalo Tampereen ammattikorkeakoulu
Sisältö Enterprise search Google Search Appliance Ylläpito Integrointi Ongelmia ja ratkaisuja
Enterprise search • Yksi hakupalvelu yhdistää useat tietolähteet • Yhtenäinen hakukokemus • Ei ole rajoittunut pelkästään julkisiin www-sivuihin • Esimerkiksi henkilöhaku LDAP-hakemistosta mahdollinen • Pääsynhallinta • Näytetään vain ne dokumentit, joihin käyttäjällä on käyttöoikeus • Haun tarkennus ja rajaus (dynaaminen navigointi) • Epäoleelliset hakutulokset suodattuvat pois käyttäjän valintojen mukaan
Google Search Appliance (GSA) • Oma Google-hakupalvelin • Googlen hakuosaaminen käytettävissä • Crawling, Indexing, Serving, Administration • Lisenssi määrittää, montako dokumenttia indeksiin mahtuu • Yksi URL = yksi dokumentti, vaikka sivu olisi sama. Uuden järjestelmän indeksointia kannattaa seurata, ettei lisenssi tule vahingossa täyteen esimerkiksi HTTP GET -parametrien takia.
Google Search Appliance (GSA) • Googlen tuki nopeaa ja asiantuntevaa • Koodimuutos ohjelmistobugin korjaamiseksi saatiin kymmenessä tunnissa • Tuki ottaa laitteeseen yhteyden SSH:llatukipyyntöjä selvittääkseen • ApuaostettavissaSolitaOy:ltä, ainoa Enterprise Search -partneriSuomessa
Crawl • Yksinkertaisimmillaan jonkin järjestelmän ”crawlaus” aloitetaan kertomalla sen osoite GSA:lle • Muiden kuin www-sivujen läpikäyntiin käytetään connector-lisäosia • Saatavilla ilmaiseksi, ostettavissa ja koodattavissa (Java) • Pääsynhallinta vaatii muutoksia kohdejärjestelmään ja/tai järjestelmään kirjautumisen opettamista GSA:lle • Määritellään miten GSA pääsee kohdejärjestelmään • Määritellään käyttäjän käyttöoikeuksien tarkistus • Helppo huomioida uuden järjestelmän toteutusvaiheessa
Index • Dokumentteja voidaan myös viedä indeksiin XML-syötteenä • Dokumentit joihin ei ole viittauksia muualla • GSA:n ei tarvitse päästä kohdejärjestelmään • Indeksoitavat dokumentit jaetaan kokoelmiin (collection), jolloin esimerkiksi intranetin ja julkisen www-sivuston hakusisältö voidaan erottaa toisistaan • Kattavastitilatietoajalokejalaitteentoiminnasta
Serving Integrointikannattaatoteuttaayhteistyössäindeksoitavanjärjestelmäntoimittajankanssa Hakulause lähetetään GSA:lleHTTP GET -pyyntönä, johon saadaan haluttaessa vastaus myös XML:nä Haku- ja tulossivun ulkoasua voi muokata XSLT-tyylitiedostolla
Serving • Käyttäjän käyttöoikeuksien tarkistukseen useita vaihtoehtoja • Perus HTTP-kirjautuminen • Cookiecracking • Kerberos • SAML • X.509-käyttäjävarmenne • Connector
Ongelmia ja ratkaisuja • GSA:n sisäänrakennettu LDAP connector kaatui, koska se ei saanut LDAP-palvelimelta dataa riittävän nopeasti • Otettiin käyttöön ulkoinen connector-palvelin • Palautehakukokemuksestaollutpääosinhyvää • OpetetaanGSA:llevieläetsityimpienhakutermiensynonyymit (esim. kurssipalaute = opintojaksopalaute)