OpenRefine is een krachtige gratis, open source-tool voor het werken met rommelige gegevens: opschonen, transformeren van het ene formaat naar het andere, en uitbreiden met webservices en verrijken met externe data (reconciliëren).
Omeka S kan gegevens importeren en exporteren in CSV formaat. Er kunnen dan ook in combinatie met OpenRefine twee gebruikersscenario's worden onderscheiden: opschonen/verrijken vóór import, opschonen/verrijken van datasets in Omeka S.
Opschonen/verrijken vóór import
Wanneer de data die in Omeka S worden opgeslagen elders vandaan komt, dan kan er de behoefte zijn om de data eerst op te schonen: te ontdubbelen, termen gelijk trekken, termen koppelen aan externe termenbronnen. Hiervoor is OpenRefine bij uitstek voor bedoeld. Het resultaat, de opgeschoonde dataset kan van vanuit OpenRefine worden geëxporteerd als CSV bestand en geïmporteerd in Omeka S worden.
Opschonen/verrijken van datasets in Omeka S
Wanneer de dataset beheert in Omeka S in bulk opgeschoond of (via reconciliatie) verrijkt moet worden dan is OpenRefine ook een handig hulpmiddel. Hierbij dient elk item in Omeka S wel een unieke identifier te hebben. De gegevens (bij een bepaalde item set) kan geëxporteerd worden naar CSV en geïmporteerd worden in OpenRefine waar de dataset dan onderhanden genomen kan worden. Na opschoning/verrijking kan de dataset weer geëxporteerd worden (als CSV) en ingelezen in Omeka S. Hier komt de unieke identifier te pas, hierdoor kan Omeka S tijdens de import bestaande items herkennen en updaten vanuit het CSV bestand.