• Let op: Dit is het archief van het Provider Forum. De berichten die je hier ziet zijn gedateerd en er kan niet meer op worden gereageerd.

Digitalisatie, ontsluiting en search engine.?

  • Onderwerp starter Onderwerp starter 5ive
  • Startdatum Startdatum
5

5ive

Beste forumbezoeker,

Wij zijn een groep studenten uit Groningen. Wij zijn bezig met een project, en daarbij willen we jou hulp vragen.

We hebben 3 vragen:

1) Op welke manier kun je het beste 20.000 pagina’s van een tijdschrift digitaliseren...?
2) Op welke manier kun je deze gedigitaliseerde pagina’s het beste op een internetsite zetten. Als statische pagina’s of in een database...? En misschien andere ideeen?
3) Als de pagina’s op de website staan, hoe kun je deze dan het beste doorzoeken? We zoeken een goede goedkope (gratis) zoekmachine..?

www.noorderbreedte.nl om deze site gaat het.

Alvast bedankt.

Greetz

Project Groep 5
Hanze Hoogeschool Groningen
 
1. /
2. gewoon in een database proppen, en daarna met php/perl/asp/java/what-ever wat doen.
3. www.google.com, óf gewoon zelf een zoekmachine schrijven.
 
5ive zei:
1) Op welke manier kun je het beste 20.000 pagina’s van een tijdschrift digitaliseren...?
aan de drukkerij een PDF vragen? (en er flink voor betalen)

5ive zei:
2)   Op welke manier kun je deze gedigitaliseerde pagina’s het beste op een internetsite zetten. Als statische pagina’s of in een database...? En misschien andere ideeen?
Als het om een tijdschript gaat lijkt statisch mij de meest tactische oplossing; tijdschriften wijzigen niet dagelijks, een mooie lijst met PDFjes dus :)

5ive zei:
3) Als de pagina’s op de website staan, hoe kun je deze dan het beste doorzoeken? We zoeken een goede goedkope (gratis) zoekmachine..?
converteer de pdfjes naar plain tekst en doe een mooie grep er op...
 
Als gratis zoekmachine kan ik je "alkaline" aanraden:
https://alkaline.vestris.com/
 
Terug
Bovenaan