Extract Text
Extraheer tekst uit bestanden om ze doorzoekbaar en machineleesbaar te maken. Eenmaal geïnstalleerd en actief, heeft deze module de volgende kenmerken:
- De module voegt een eigenschap "geëxtraheerde tekst" toe waarmee geëxtraheerde tekst wordt ingesteld op media en items.
- Bij het toevoegen van media zal de module automatisch tekst uit het bestand extraheren en de tekst op de media plaatsen.
- Bij het toevoegen of bewerken van een item zal de module automatisch de mediatekst aggregeren (in volgorde) en de tekst op het item zetten.
- Bij het bewerken van een item of het bewerken van batches kan de gebruiker ervoor kiezen om de geëxtraheerde tekst te vernieuwen of te wissen.
- De gebruiker kan de moduleconfiguratiepagina bekijken om te zien welke extractors beschikbaar zijn op hun systeem.
Ondersteunde bestandsindelingen:
DOC (application/msword)
- DOCX (application/vnd.openxmlformats-officedocument.wordprocessingml.document)
- HTML (text/html)
- ODT (application/vnd.oasis.opendocument.text)
- PDF (application/pdf)
- RTF (application/rtf)
- TXT (text/plain)
Extract OCR (plugin upgraded for Omeka S)
Module voor Omeka S om OCR-tekst in XML uit PDF-bestanden te extraheren, waardoor zoeken in volledige tekst mogelijk is binnen de Universal Viewer-plug-in.