Arcanum – pillantás a múltba

Olvasási idő: 5 perc

„A kultúránk akkor fejlődhet, ha a múltunkat, közös tudásunkat és identitásunkat hordozó emlékeinkből minél többet tudunk eljuttatni a lehető legtöbb emberhez; s mindezt úgy, hogy a befogadókban a továbbgondolkozás igényét is elősegítjük.”

Biszak Sándor – alapító Arcanum.

Szeptember második napján egy különleges helyre pillanthattunk be. Kedvenc helytörténi kutatóink a Szamák házaspár meghívására a 35 éves múltra visszatekintő ARCANUM Kft.-hez látogattunk egy kisebb 10 fős csoporttal Diósdról. A DNNÖ, a Német Hagyományőrző Egyesület néhány tagja is, és egy kedves történelemszakos diósdi fiatalember is jelen volt édesanyjával, meg persze mi is, hogy mesélni tudjunk.

A múlt nyomában – hogyan lesz a régi papírból digitális kincs?

Ma már nem kell poros könyvtárakban vagy levéltárak mélyén keresgélnünk, ha egy régi újságcikkre, könyvre, térképre vagy festményre vagyunk kíváncsiak. Egy hatalmas digitalizálási projektnek köszönhetően a múlt értékei egyre inkább karnyújtásnyira kerülnek tőlünk – pontosabban: néhány kattintásra. Elsősorban a II. Világháború előtti anyagokat kezdék el feldolgozni, de mára már könyvek és jelenkori folyóiratok, magazinok is feldolgozásra kerülnek. Több nyelven is kereshetünk, hiszen az Arcanum adatbázisban akár örmény, francia, angol, lengyel, román stb nyelvű folyóiratok, dokumentumok is megtalálhatóak

Millió betű oldalról oldalra

A munka nagyságrendje szinte felfoghatatlan:

1 méternyi polcon – 10.000 oldalnyi folyóirat, könyv is lehet.
Havonta másfél millió oldal kerül digitalizálásra, így mára már több mint 85 millió oldal érhető el online.

A feldolgozás mögött komoly technikai háttér áll: két vágógép, tíz nagy teljesítményű szkenner dolgozik folyamatosan, és két olyan speciális eszközök is, amelyek hatalmas méretű (A0 mérettől) térképeket, újságokat egyszerre mindkét oldalt – így akár egy gombnyomással 4 oldalnyit tudnak –biztonságosan beolvasni. Ma már csak érdekesség, de egy lapozó szkennert is láthattunk.

Mi történik mielőtt a képernyőn kereshetővé válik a dokumentum?

  • Ha az anyag be van kötve, bizony „szétvágják”
  • oldalról oldalra beolvassák
  • majd újrakötik a könyvkötő műhelyben

A digitalizálás folyamata

Egy-egy oldal útja a digitalizálástól az online kereshetőségig több lépésből áll:

  1. Szkennelés – nagy felbontásban, akár 300 dpi-vel, hogy minden részlet megőrződjön.
    500 000 000 000 000 bájt, vagyis 500 terabájt-nyi anyag kerül a helyi szerverre, és talán nincs annyi nulla amennyivel le lehetne írni, hogy mennyi adat van a felhőben.
  2. Szövegfelismerés (OCR) – a nyers képből szerkeszthető, kereshető szöveg lesz.
    Két rétegű pdf fájl készül1
  3. Javítás és rendezés – ellenőrzik a hasábokat, a sorrendet és a hibás karaktereket.
  4. Közzététel – az anyag biztonságosan a felhőben (Amazon szerverein) tárolódik, majd felkerül az Arcanum Digitális Tudománytárba vagy a Hungaricana – Közgyűjteményi portálra

Mit találhatunk meg így?

  • Újságcikkeket akár a 19. századból,
  • könyveket és szakfolyóiratokat,
  • régi térképeket és festményeket,
  • sőt, középkori okleveleket is – egészen a mohácsi vész előtti időkből.

És nem csak magyar anyagok: nemzetközi dokumentumok, például romániai források is bekerülnek az adatbázisba.

Miért fontos mindez?

A digitalizálás nem csupán arról szól, hogy kényelmesen kutathatunk a múltban. Arról is, hogy kulturális örökségünket biztonságban tudjuk, megőrizzük a jövő számára, és mindezt közkinccsé tesszük. Így a családfakutatótól kezdve a helytörténészen át a diákig bárki hozzáférhet olyan anyagokhoz, amelyek eddig csak keveseknek voltak elérhetők.

Ez a gigászi munka sok ember elkötelezettségét dicséri – köztük Biszak Sándorét, aki fontos szerepet vállal abban, hogy a történelem lapjai új életre keljenek a digitális térben.

Teljesen egyedülálló módon lehetőségünk van nem csak szövegre, hanem arcképre is keresni, a digitalizált anyagokban.

Az platformot regisztráció után használhatjuk – keresés mindenki számára elérhető, de az anyagokhoz csak előfizetés után jutunk – az Arcanum Kft működését az előfizetésekből biztosítják.
Ingyenesen hozzáférhető a Hungaricana – közgyűjtemény – térképek a II. katonai felméréstől – napjainkig, népzenei gyűjtemény, képtár , levéltár, építészeti tervek, könyv és dokumentumtár.
Kellemes keresgélést, böngészést kívánunk!

Kellemes böngészést!

  1. ↩︎

A kétrétegű PDF (más néven image + text PDF) olyan fájl, amelyben kétféle réteg van egyszerre:
Képréteg – a beszkennelt oldal képe (pontosan úgy néz ki, mint az eredeti könyv vagy újság).
Szövegréteg – a háttérben futó, OCR-rel (szövegfelismeréssel) készült szöveg. Ez sokszor nem látszik, de a keresőmotorok és a PDF-olvasók tudják olvasni.
Mit jelent ez a gyakorlatban?
Olvasáskor az eredeti kinézetet látod, mintha a papírt böngésznéd. Közben tudsz benne keresni szavakra, nevekre, és a szöveget ki is tudod másolni. Ezért használja az Arcanum is: így egyszerre megmarad az eredeti forma és a modern kereshetőség.