Kan ik ook teksten uit documenten verkrijgen?

Extract Text

Extraheer tekst uit bestanden om ze doorzoekbaar en machineleesbaar te maken. Eenmaal geïnstalleerd en actief, heeft deze module de volgende kenmerken:

  • De module voegt een eigenschap "geëxtraheerde tekst" toe waarmee geëxtraheerde tekst wordt ingesteld op media en items.
  • Bij het toevoegen van media zal de module automatisch tekst uit het bestand extraheren en de tekst op de media plaatsen.
  • Bij het toevoegen of bewerken van een item zal de module automatisch de mediatekst aggregeren (in volgorde) en de tekst op het item zetten.
  • Bij het bewerken van een item of het bewerken van batches kan de gebruiker ervoor kiezen om de geëxtraheerde tekst te vernieuwen of te wissen.
  • De gebruiker kan de moduleconfiguratiepagina bekijken om te zien welke extractors beschikbaar zijn op hun systeem.

Ondersteunde bestandsindelingen:

DOC (application/msword)

  • DOCX (application/vnd.openxmlformats-officedocument.wordprocessingml.document)
  • HTML (text/html)
  • ODT (application/vnd.oasis.opendocument.text)
  • PDF (application/pdf)
  • RTF (application/rtf)
  • TXT (text/plain)

Extract OCR (plugin upgraded for Omeka S)

Module voor Omeka S om OCR-tekst in XML uit PDF-bestanden te extraheren, waardoor zoeken in volledige tekst mogelijk is binnen de Universal Viewer-plug-in.

U kunt commentaar op deze vraag geven

  • ~ 0 min
    ID #1045
  • 2023-06-11 20:55
  • 0 Commentaren

Beoordeel deze vraag:

0 (0 Stemmen)