dinsdag 07 februari

Zoek en gij zult vinden.

Met de enorme oeveelheden data wordt zoeken een uitdaging. In ´n omgeving waar mensen regelmatig bij elkaar zijn komen patronen in communicatie voor. Vanuit Debiteuren Crediteuren herkennen wij de "Goeie morgen deze  morgen" nog, die door heel Nederland keurig werd nagepapagaaid.
Zo ook in ons gezin. Met drie kindertjes en een aardig arsenaal aan rollend materieel en ander speelgoed is er om de haverklap een kleinnood zoek. De standaard vraag aan een van de beschikbare ouders is dan ook : "Papa (in mijn geval dan) waar is mijn <Speelgoed_Item>?" Ik antwoord dan ook steevast: "Daar waar je het hebt opgeruimd ". Totale onbegrip lees ik in de oogjes af: Opruimen?
Maar zoals wel vaker in het leven hebben deze ogenschijnlijke opvoedende inspiraties altijd weer een boemerang effect. Laatst stond er namelijk een collectant aan de deur voor de plaatselijke toneelvereniging. Ik heb niets tegen globalisering, maar het lokale moet zeker ondersteund blijven, dus ik greep naar mijn achterzak waar ik .... geen portemonnee vond. Op zoek naar Carolien, mijn vrouw, die gaat namelijk over het geld (among other things) zie ik mijn keurig spelende bloedjes en vraag enigszins geagiteerd:  "Waar is mama?". In koor kreeg ik terug: "Daar waar je haar het laatst hebt opgeruimd!"

Afijn, zoeken dus, het thema van deze "Mag IT iets méér zijn!"
En dat kunnen we, zoeken dan. Een wellicht wat onbekend product van IBM is OmniFind. Dit product is te vinden in de Information Management-familie en heet in een groter geheel Enterprise Content Manager.
In de goede oude tijd was zoeken relatief simpel. De gegevens zaten keurig netjes in databases, al dan niet relationeel. En dat was makkelijk zoeken. ´Gewoon´ even de tabellen raadplegen, eventueel met een index, en klaar was Klara. Niet alleen de ´plekken´ waar data stond (zoals databases, waren makkelijk te vinden, ook de gegevens zélf lieten zich makkelijk onderzoeken. Het waren immers cijfers en letters (leuke titel voor een flauw spelletje, trouwens). We spreken dan ook van gestructureerde data.
Vandaag de dag is het anders. Anders, omdat lang niet alle data gestructureerd is, en al lang niet alle data meer keurig netjes in databases staat. 80% van de data is inmiddels ongestructureerd. Denk hierbij aan text documenten, aan spreadsheets, aan webpages, aan presentaties en PDF bestanden. Dat is allemaal zeer ongestructureerde data. En dan heb ik het natuurlijk niet over de inhoud!

Daarin zoeken is niet makkelijk.Gelukkig, OmniFind kan dat. Het kan ook heel goed door de hele organisatie heen zoeken. En dat kan enorm veel voordelen bieden om de productiviteit van de medewerkers te verbeteren of kwaliteit van je product of dienst rapporteren. En dat zoeken beperkt zich niet tot woorden en zinnen. OmniFind blinkt uit in het zoeken naar concepten of naar intenties.

IBM Research (Almaden en Haifa) ligt ten grondslag aan dit product. Ze hebben een methodiek ontworpen wat ´Natural Language Processing´ wordt genoemd. Hierin wordt ongestructureerde tekst geanalyseerd. Denk hierbij bijvoorbeeld aan emails die aan bedrijven worden gestuurd, of concreter aan helpdesken. Alhoewel de leverancier er alles aan doet om zoveel mogelijk gestructureerde data te krijgen, die ingevuld moeten worden in de welbekende en frustrerende web-formulieren, zal er bij een klacht of vraag om hulp altijd een tekstveld moeten worden ingevuld:  "Ik weet niet hoe ik mijn geleverde kabelmodem moet aansluiten op mijn computer" of emails van gelijke strekking. Voor het geautomatiseerd beantwoorden van deze emails én om informatie over de producten te verkrijgen kan OmniFind uit de ongestructureerde emails zinnige informatie halen. Zinsneden en woorden als ´weet niet´ ´kabelmodem´ en ´computer´ kunnen in een groter context geplaatst worden. De email zal hier om een probleem of vraag gaan en wellicht niet over een aanvraag voor een nieuw product of het opzeggen van een abonnement. OmniFind kan ook een stuk data-mining doen en door alle emails in kaart brengen hoe vaak ´kan niet ...geheugen installeren´ voorkomt.
Zoals heel vaak met IBM producten beperkt OmniFind zich niet alleen tot IBM producten zoals Notes of WebSphere. Er zijn vele connectoren naar Document beheer systemen van derden. Denk hierbij aan Documentum van EMC. Tevens wordt OmniFind in een dertig verschillende talen geleverd, waaronder ook Nederlands, hetgeen wel handig is in uh, Nederland, bijvoorbeeld!

Het is nog even wachten op een versie die ook mijn kinderen (voor hun speelgoed) en ik (voor het vinden van Carolien) kunnen gebruiken, maar voorlopig is het een prachtige tool voor bedrijven om zinnige dingen met de enorme hoeveelheid data te doen. Zegt het voort!

You are here Home
Share/Save/Bookmark