U bent nu hier: Home / Lessen / Blog article: Gratis enterprise search engines: gaat voor niets de zon op?

| Mobiel | RSS

Gratis enterprise search engines: gaat voor niets de zon op?

11 januari, 2010 | 2 reacties | Gepost in Lessen

In de wereld van enterprise search engines is een nieuwe trend waar te nemen: gratis software voor het doorzoekbaar maken van interne bedrijfsinformatie. Het gaat hierbij om het ontsluiten van informatie die opgeslagen is in content management systemen, fileshares en andere interne databases. Gratis klinkt hierbij als te mooi om waar te zijn, maar de producten zijn kwalitatief erg goed en zeker het overwegen waard.

In de huidige enterprise search markt zijn er op dit moment drie gratis producten van betekenis: Apache Lucene, IBM Omnifind Yahoo! Edition (OY!E) en Micosoft Search Server Express 2008 (MSSX2008). Laten we deze eens nader bekijken.

Apache Lucene is het enige open source product uit het rijtje. Lucene biedt uitsluitend een search library (indexeren van en zoeken naar documenten) en bijvoorbeeld geen content vergaring (crawling) of user interface. Al snel kom je daarom uit bij open-source producten Solr of Nutch, beide gebaseerd op Lucene, maar met meer functionaliteiten zoals faceted navigation, een admin interface en een crawler. De crux zit ‘m bij Lucene Solr/Nutch niet zozeer in beperkte mogelijkheden, die zijn er genoeg en maken het product flexibel en specifiek inzetbaar. Het is echter gericht op developers en die zullen er nog veel programmeertijd aan moeten besteden voordat er daadwerkelijk een search engine draait.

OY!E is een combinatie van Lucene en IBM search technologie, de toevoeging Yahoo! is in feite niet meer dan een catchy merknaam. Het product maakt het mogelijk om tot 500.000 documenten en 5 verschillende collecties doorzoekbaar te maken. Het is een stuk makkelijker te installeren en configureren dan Lucene, maar heeft een aantal functionele beperkingen. Denk bijvoorbeeld aan het indexeren van meer dan 500.000 documenten, een LDAP koppeling, faceted search of doorzoeken van SharePoint sites. Uiteraard wil IBM je in zo’n geval graag van dienst zijn met een ander, zij het betaald, product uit de Omnifind lijn.

MSSX2008 is in feite dezelfde software als de niet-Express versie van Microsoft Search Server, met als enige limiet: één server. Dat betekent in de praktijk een limiet van 4GB, dat neerkomt op ongeveer 400.000 documenten, afhankelijk van hun grootte. Pluspunt van MSSX2008 ten opzichte van OY!E is dat er gemakkelijk gekoppeld kan worden met diverse interne bronnen, zoals SharePoint sites, Lotus Notes en andere databases. Installatie en configuratie is eenvoudig, er hoeft geen developer aan te pas te komen. Zeker degenen die vertrouwd zijn met een SharePoint omgeving, zullen eenvoudig hun weg weten te vinden.

Of een gratis search engine software binnen jouw organisatie ingezet kan worden, is sterk afhankelijk van de wensen en eisen die je gebruikers stellen. Bepaal daarnaast ook de hoeveelheid en soort content die je toegankelijk wilt maken en in welke bronnen deze content opgeslagen is. Daarnaast moet je je realiseren dat gratis software betekent dat de licentie weliswaar gratis is, maar dat er altijd additionele kosten zijn voor ontwikkeling en implementatie. De zon kan dus bijna voor niets op gaan. Maar controleer voordat je je blootstelt aan de zon de UV-waarde, dit om lelijke verbranding te voorkomen.

Reageer 10736 x gelezen, 13 x vandaag |
Feed van reacties op dit bericht

2 Reacties op “Gratis enterprise search engines: gaat voor niets de zon op?”

  1. Eric Puister zegt:

    Alles leuk en wel, maar de meeste op Lucene gebaseerde digitale bibliotheken vragen nogal wat onderhoud. Grootte mag geen issue zijn, wel inzicht in de inhoud. De software zelf is wel gratis, maar je moet er mensen op zetten die geschikte metadata kunnen toekennen en dat ook een beetje slim kunnen doen, bij voorkeur in overleg met de gebruikers. Anders geformuleerd: zonder een toegewijde informatieprofessional is deze software niet zo functioneel.
    De reden is dat deze software wel in de documenten zelf kan zoeken, maar een document nu eenmaal erg veel trefwoorden bevat. Je raakt erin zoek als je er geen systeem in aanbrengt. Enige vorm van taxonomie aanbrengen is dus wel zinnig.
    Vergelijk het ook met Google Desktop. Dat is erg handig als je de zoekeigenschappen van Google op je eigen desktop wilt repliceren, maar als je niet precies meer weet hoe een document ook alweer heette, of wat de kern ervan was, dan kan het zijn dat je nog erg veel documenten individueel moet inzien voordat je het goede hebt.

  2. Nieuwe concurent van Google?

Reageer