2018-01-11 09:54:58

Završeno sedmo harvestiranje nacionalne domene

Nacionalna i sveučilišna knjižnica u Zagrebu u suradnji sa Sveučilišnim računskim centrom Sveučilišta u Zagrebu (Srce) provela je od 14. do 31. prosinca 2017. sedmo harvestiranje hrvatskoga weba. Prikupljeni su i arhivirani javno dostupni sadržaji svih mrežnih sjedišta na vršnoj .hr domeni, uključujući from.hr i .com.hr.

Ukupno je prikupljeno i arhivirano u WARC formatu više od 84.530.294 milijuna datoteka veličine od preko 7.4 TB . Korišten je popis aktivnih domena koji je Nacionalnoj i sveučilišnoj knjižnici u Zagrebu dostavila CARNET-ova DNS služba, a pobiranje je provedeno pomoću alata otvorenoga koda Heritrix. Robot koji je provodio harvestiranje predstavljao se kao Mozilla/5.0 (compatible; heritrix/1.14.4; +http://haw.nsk.hr/faq).

Sadržaj sedmoga harvestiranja .hr domene bit će uskoro dostupan na stranicama Hrvatskoga arhiva weba, gdje se mogu pregledavati sadržaji pohranjeni u prethodna šest harvestiranja, tematska harvestiranja, kao i sadržaji prikupljeni selektivnim harvestiranjima.

 

Vijest je prenesena s mrežnih stranica Nacionalne i sveučilišne knjižnice u Zagrebu.


www.skole.hr