<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" href="https://webarchivum.oszk.hu/honlap/metaadat/mia_set.xsl"?>
<MIA xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://webarchivum.oszk.hu/honlap/metaadat/mia_set.xsd">
  <MIA_set>
    <BIBLIOGRAPHIC>
      <dc_identifier>
        <mia_set_id>MIA_SET-00010</mia_set_id>
      </dc_identifier>
      <dc_title>
        <main_title>Kormányzat, önkormányzatok, politikai és civil szervezetek</main_title>
        <subtitle>Kormányzati szervek, hazai és határon túli önkormányzatok, tájegységek-régiók, kisebbségek, politikai és civil szervezetek</subtitle>
        <short_title>KORMONKOR</short_title>
      </dc_title>
      <cataloging>
        <description_date>2018-11-28</description_date>
        <last_modified>2021-01-25</last_modified>
        <cataloger_name>Visky Ákos László</cataloger_name>
        <description_note />
      </cataloging>
      <collector>
        <collector_organization>Országos Széchényi Könyvtár</collector_organization>
        <collector_organization_unit>E-könyvtári Szolgáltatások Osztálya</collector_organization_unit>
        <collector_person>Drótos László</collector_person>
        <project_name>OSZK Webarchívum</project_name>
        <collector_note>Előrször szinte csak önkormányzati honlapok lettek összeállítva egy Wikipédiától kapott lista alapján. A második aratás (2018-11-26) előtt lettek felvéve kormányzati honlapok, illetve jelentősen ki lett bővítve (több mint 550 új cím) a lista egyéb, nagyrészt önkormányzati webhelyekkel (DKERS-lista és a kormany.lap.hu linkgyűjtemény alapján). A harmadik aratás (2019-09-25) előtt ellenőrizve lett valamennyi URL cím, és össze lett hasonlítva a Nemzeti Földrajzi Névtérből kapott listával, valamint ki lett egészítve kb. 380 új kormányzati és a témához kapcsolódó egyéb oldal címével. 2020-ban elkezdtük összegyűjteni az Instagram és a Facebook oldalakat is, ezek külön gyűjteménybe kerültek. A 6. aratás (2020-07-28) előtt jelentősen bővült a seed-lista határon túli településekkel, civil szervezetekkel és rendvédelmi, illetve mentő szervekkel. A 8. aratás (2021-01-29) előtt ellenőrizve lett a címlista.</collector_note>
      </collector>
      <dc_rights>
        <rights_owner>Országos Széchényi Könyvtár</rights_owner>
        <legal_status>jogvédett</legal_status>
      </dc_rights>
      <dc_type>tematikus</dc_type>
      <dc_subject>
        <main_topic>Közéleti források</main_topic>
        <main_topic>Tudományos források</main_topic>
        <topic>Politika</topic>
        <topic>Közigazgatás</topic>
        <topic>Önkormányzat</topic>
        <topic>Társadalomtudomány</topic>
        <subtopic>Történelem, helytörténet</subtopic>
        <keyword>kormányzat</keyword>
        <keyword>kormányhivatal</keyword>
        <keyword>közigazgatás</keyword>
        <keyword>	közigazgatási szerv</keyword>
        <keyword>önkormányzat</keyword>
        <keyword>	közpolitika</keyword>
        <keyword>település</keyword>
        <keyword>helytörténet</keyword>
      </dc_subject>
      <dc_description>Kormányzati és államigazgatási szervek, önkormányzatok és települések, illetve kistérségi társulások és kisebbségi önkormányzatok, valamint politikai és civil szervezetek webhelyeinek gyűjteménye.</dc_description>
      <dc_relation>
        <related_set_id>MIA_SET-00032</related_set_id>
        <related_set_id>MIA_SET-00043</related_set_id>
        <related_source></related_source>
      </dc_relation>
      <dc_date>
        <first_harvest>2018-02-21</first_harvest>
        <harvest_frequency>negyedévente</harvest_frequency>
        <date_note>2020-től az addigi rendszertelen aratásokról áttértünk a rendszeres, negyedéves aratásokra.</date_note>
      </dc_date>
    </BIBLIOGRAPHIC>
    <ADMINISTRATIVE>
      <curator>
        <curator_name>Visky Ákos László</curator_name>
        <curator_email>visky.akos.laszlo@oszk.hu</curator_email>
      </curator>
      <status>rendszeresen mentett</status>
      <quality_assurance>
        <quality_assurance_status>szúrópróbaszerűen ellenőrizve</quality_assurance_status>
        <quality_check>
          <quality_assurance_date>2018-02</quality_assurance_date>
          <quality_assurance_note>Az első aratás (2018-02-21) után az önkormányzati honlapokból szúrópróbaszerű ellenőrzéssel lett kiválogatva pár a demó archívum számára, alaposabb ellenőrzés nem volt. A második aratás (2018-11-21) a leírás idejéig még nem volt ellezőrizve.</quality_assurance_note>
        </quality_check>
      </quality_assurance>
      <screenshot>
        <screenshot_status>nincs oldalkép</screenshot_status>
        <screenshot_taken></screenshot_taken>
        <unique_screenshot_status>vannak oldalképek</unique_screenshot_status>
        <unique_screenshot_taken>
          <unique_screenshot_date>2018-11-27</unique_screenshot_date>
          <unique_screenshot_note>Az első aratásnál (2018-02-21) még nem készültek oldalképek, csak a második aratásnál (2018-11-21), ezek ellezőrizve nem voltak.</unique_screenshot_note>
        </unique_screenshot_taken>
        <unique_screenshot_taken>
          <unique_screenshot_date>2019-09-26</unique_screenshot_date>
          <unique_screenshot_note></unique_screenshot_note>
        </unique_screenshot_taken>
        <unique_screenshot_taken>
          <unique_screenshot_date>2019-12-04</unique_screenshot_date>
          <unique_screenshot_note></unique_screenshot_note>
        </unique_screenshot_taken>
        <unique_screenshot_taken>
          <unique_screenshot_date>2020-04-07</unique_screenshot_date>
          <unique_screenshot_note></unique_screenshot_note>
        </unique_screenshot_taken>
        <unique_screenshot_taken>
          <unique_screenshot_date>2020-08-01</unique_screenshot_date>
          <unique_screenshot_note></unique_screenshot_note>
        </unique_screenshot_taken>
        <unique_screenshot_taken>
          <unique_screenshot_date>2020-10-20</unique_screenshot_date>
          <unique_screenshot_note></unique_screenshot_note>
        </unique_screenshot_taken>
        <unique_screenshot_taken>
          <unique_screenshot_date>2021-02-02</unique_screenshot_date>
          <unique_screenshot_note></unique_screenshot_note>
        </unique_screenshot_taken>
      </screenshot>
      <access>
        <access_status>zárt hálózatban szolgáltatható</access_status>
        <access_date>2018-02-21</access_date>
        <access_note />
      </access>
      <administrative_note />
    </ADMINISTRATIVE>
    <TECHNICAL>
      <harvester>Heritrix 3.x</harvester>
      <harvest_parameters>Három szint mélység, videó fájlok kizárása.</harvest_parameters>
      <shutdown_conditions>Az eddigi öt aratást az operátor leállíta le. A 6. (2020-07-28), a 7. (2020-10-16) és a 8. (2021-01-29) aratás az előre beállított idő letelte után magától leállt.</shutdown_conditions>
      <config_file />
      <robots_rule>nem</robots_rule>
      <deduplication>igen</deduplication>
      <schedule></schedule>
      <harvest_report>http://webharvest.oszk.hu/aratasok/kormonkor/</harvest_report>
      <extent>
        <number_of_harvests>8</number_of_harvests>
        <harvest>
          <crawl_start_date>2018-02-21</crawl_start_date>
          <crawl_end_date>2018-02-26</crawl_end_date>
          <crawled_seeds>2374</crawled_seeds>
          <visited_hosts>9284</visited_hosts>
          <successful_URIs>3211202</successful_URIs>
          <uncompressed_size>391959</uncompressed_size>
        </harvest>
        <harvest>
          <crawl_start_date>2018-11-26</crawl_start_date>
          <crawl_end_date>2018-11-28</crawl_end_date>
          <crawled_seeds>3458</crawled_seeds>
          <visited_hosts>12787</visited_hosts>
          <successful_URIs>7485445</successful_URIs>
          <uncompressed_size>1360327</uncompressed_size>
        </harvest>
        <harvest>
          <crawl_start_date>2019-09-25</crawl_start_date>
          <crawl_end_date>2019-09-27</crawl_end_date>
          <crawled_seeds>4679</crawled_seeds>
          <visited_hosts>7174</visited_hosts>
          <successful_URIs>5930246</successful_URIs>
          <uncompressed_size>1252378</uncompressed_size>
        </harvest>
        <harvest>
          <crawl_start_date>2019-11-21</crawl_start_date>
          <crawl_end_date>2019-11-23</crawl_end_date>
          <crawled_seeds>4673</crawled_seeds>
          <visited_hosts>7118</visited_hosts>
          <successful_URIs>6000237</successful_URIs>
          <uncompressed_size>258048</uncompressed_size>
        </harvest>
        <harvest>
          <crawl_start_date>2020-04-04</crawl_start_date>
          <crawl_end_date>2020-04-06</crawl_end_date>
          <crawled_seeds>4405</crawled_seeds>
          <visited_hosts>6499</visited_hosts>
          <successful_URIs>1680300</successful_URIs>
          <uncompressed_size>210944</uncompressed_size>
        </harvest>
        <harvest>
          <crawl_start_date>2020-07-28</crawl_start_date>
          <crawl_end_date>2020-07-31</crawl_end_date>
          <crawled_seeds>6537</crawled_seeds>
          <visited_hosts>9393</visited_hosts>
          <successful_URIs>4194707</successful_URIs>
          <uncompressed_size>364544</uncompressed_size>
        </harvest>
        <harvest>
          <crawl_start_date>2020-10-16</crawl_start_date>
          <crawl_end_date>2020-10-19</crawl_end_date>
          <crawled_seeds>7230</crawled_seeds>
          <visited_hosts>10180</visited_hosts>
          <successful_URIs>4238166</successful_URIs>
          <uncompressed_size>195584</uncompressed_size>
        </harvest>
        <harvest>
          <crawl_start_date>2021-01-29</crawl_start_date>
          <crawl_end_date>2021-02-01</crawl_end_date>
          <crawled_seeds>7562</crawled_seeds>
          <visited_hosts>10391</visited_hosts>
          <successful_URIs>3746421</successful_URIs>
          <uncompressed_size>187392</uncompressed_size>
        </harvest>
      </extent>
      <archive_format>WARC</archive_format>
      <storage>webharvest.oszk.hu/</storage>
      <long-term_preservation />
      <technical_note>A 2019-09-25-i aratás eredetileg 23-án lett indítva, de szerver újraindítás miatt megszakadt. Az első napon lementett anyag mennyiségi adatai nem ismertek, illetve a robots.txt nélküli webhelyeket nem mentettük le külön, ezért tűnik kevesebbnek az előzőhöz képest a harmadik aratás. A 2020-04-04-i aratásnál a robots.txt meglétét a Heritrixhez írt Java modullal vizsgáltuk le aratás közben, így csak egy köre volt szükség. Mivel az EGYETEM aratás a Heritrix leállása, illetve az oldalképek tárhelyének elfogyása miatt időben elcsúszott, ezért erre az aratásra a szokásosnál kevesebb idő jutott. A 6. aratás (2020-07-28) eredetileg 2020-07-24-én indult, de kiderült, hogy a deduplikáció nem működik, mert a job directory nem lett áthozva a KIFÜ-s szerverről, ezért leállítottuk és letöröltük a letöltött anyagot, majd a job directory átmásolása után újraindítottuk. (A 2020-07-24-i aratás report fájljai megmaradtak.) Másodszor próbáltuk ki azt, hogy a Kaptafa felületen definiáltuk a job-ot, amit azután a rendszergazda még egyelőre kézzel indított el. A 7. aratás (2020-10-16) rendben lezajlott. A 8. aratás (2021-01-29) előtte a címlista aktualizálva lett a távmunkás által elvégzett ellenőrzés alapján, azonban mégis nagyon magas lett a "seeds uncrawled" arány, pedig ellenőrizve volt a címlista.</technical_note>
    </TECHNICAL>
  </MIA_set>
</MIA>