<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" href="http://mekosztaly.oszk.hu/mia/xml/mia_set.xsl"?>
<MIA xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="http://mekosztaly.oszk.hu/mia/xml/mia_set.xsd">
  <MIA_set>
    <BIBLIOGRAPHIC>
      <dc_identifier>
        <mia_set_id>MIA_SET-00001</mia_set_id>
        <archived_public_URL>http://mekosztaly.oszk.hu/mia/demo/</archived_public_URL>
      </dc_identifier>
      <dc_title>
        <main_title>OSZK Webaratás -  Demó archívum</main_title>
        <subtitle>Válogatott, nyilvánosan szolgáltatható archivált webhelyek</subtitle>
        <short_title>MIADEMO</short_title>
      </dc_title>
      <cataloging>
        <description_date>2018-08-12</description_date>
        <cataloger_name>Drótos László</cataloger_name>
      </cataloging>
      <collector>
        <collector_organization>Országos Széchényi Könyvtár</collector_organization>
        <collector_organization_unit>E-könyvtári Szolgáltatások Osztálya</collector_organization_unit>
        <collector_person>Visky Ákos László</collector_person>
        <project_name>MIA demó</project_name>
      </collector>
      <dc_rights>
        <rights_owner>Országos Széchényi Könyvtár</rights_owner>
        <legal_status>jogvédett</legal_status>
        <rights_note>Egyedi engedélyeket kértünk minden webhely esetében a nyilvános szolgáltatásra.</rights_note>
      </dc_rights>
      <dc_type>vegyes</dc_type>
      <dc_subject>
        <main_topic>Kulturális források</main_topic>
        <main_topic>Tudományos források</main_topic>
        <main_topic>Oktatási források</main_topic>
        <topic>Köz- és magángyűjtemények</topic>
        <topic>Felsőoktatás</topic>
        <topic>Közigazgatás</topic>
        <keyword>webhely</keyword>
        <keyword>digitális archívum</keyword>
      </dc_subject>
      <dc_description>Az Országos Széchényi Könyvtárban 2017-2018 években folyó kísérleti webaratás projekt keretében készült kis nyilvános gyűjtemény a webarchiválás és a lementett tartalomban való keresés technológiájának demonstrálása céljából.</dc_description>
      <dc_relation>
        <related_set_id>MIA_SET-00004</related_set_id>
      </dc_relation>
      <dc_date>
        <first_harvest>2017-12-12</first_harvest>
        <harvest_frequency>rendszertelenül</harvest_frequency>
      </dc_date>
    </BIBLIOGRAPHIC>
    <ADMINISTRATIVE>
      <curator>
        <curator_name>Visky Ákos László</curator_name>
        <curator_email>visky.akos.laszlo@oszk.hu</curator_email>
      </curator>
      <status>időszakosan mentett</status>
      <quality_assurance>
        <quality_assurance_status>teljesen ellenőrizve</quality_assurance_status>
        <quality_check>
          <quality_assurance_date>2018-07 - 2018-08</quality_assurance_date>
          <quality_assurance_note>Bár a demó gyűjteménybe eleve a jobban sikerült mentések lettek beválogatva, elég sok formai probléma és tartalmi hiány derült ki a részletes ellenőrzés során, amelyek részben javíthatók lesznek a következő aratásnál a robot jobb paraméterezésével.</quality_assurance_note>
        </quality_check>
      </quality_assurance>
      <screenshot>
        <screenshot_status>van oldalkép</screenshot_status>
        <screenshot_taken>
          <screenshot_date>2018-08-12</screenshot_date>
          <screenshot_file_name>MIA_SET-00001_2018-08-12_reszlet.png</screenshot_file_name>
          <screenshot_note>Az oldalkép olyan hosszú, hogy csak a felső részét szolgáltatjuk.</screenshot_note>
        </screenshot_taken>
        <unique_screenshot_status>vannak oldalképek</unique_screenshot_status>
        <unique_screenshot_taken>
          <unique_screenshot_date>2017-12 - 2018-06</unique_screenshot_date>
          <unique_screenshot_note>Windows-os szoftverekkel készült és egyenként ellenőrzött oldalképek.</unique_screenshot_note>
        </unique_screenshot_taken>
      </screenshot>
      <access>
        <access_status>nyilvánosan is szolgáltatható</access_status>
        <access_date>2018-01-21</access_date>
        <access_note>A tartalomtulajdonosok egyelőre 2018 végéig adtak engedélyt a nyilvános szolgáltatásra, utána egy új szerződést kötünk velük.</access_note>
      </access>
      <administrative_note>A demó gyűjtemény következő aratása 2019 első negyedévében lesz.</administrative_note>
    </ADMINISTRATIVE>
    <TECHNICAL>
      <harvester>WCT + Heritrix 3.x</harvester>
      <harvest_parameters>Többnyire három szint mélységig, a videó fájlok kizárásával.</harvest_parameters>
      <shutdown_conditions />
      <config_file>https://193.6.201.202:8443/engine/job/Seed_URL_demo_ismetlo_aratas_2018_04_23_VAL/jobdir/crawler-beans.cxml</config_file>
      <robots_rule>változó</robots_rule>
      <deduplication>nem</deduplication>
      <schedule>
        <schedule_start>2017-12-12</schedule_start>
      </schedule>
      <harvest_report>https://193.6.201.202:8443/engine/job/Seed_URL_demo_ismetlo_aratas_2018_04_23_VAL/jobdir/latest/reports/</harvest_report>
      <extent>
        <number_of_harvests>2</number_of_harvests>
        <harvest>
          <crawl_start_date>2018-04-24</crawl_start_date>
          <crawl_end_date>2018-04-24</crawl_end_date>
          <crawled_seeds>122</crawled_seeds>
          <visited_hosts>2965</visited_hosts>
          <successful_URIs>456297</successful_URIs>
          <uncompressed_size>68044</uncompressed_size>
        </harvest>
      </extent>
      <archive_format>WARC</archive_format>
      <storage>http://193.6.201.202/store/ </storage>
      <long-term_preservation />
      <technical_note>Az első aratási ciklusban (nagyrészt 2018 január-február) egyenként zajlottak a mentések részben a WCT-vel, részben közvetlenül a Heritrix-szel, ezért erről nincsenek összesített technikai adatok. A 2018-04-24-i aratás egyszerre történt a Heritrix-szel és reggel 9-től este 23 óráig tartott.</technical_note>
    </TECHNICAL>
  </MIA_set>
</MIA>