From 67d6e7c3350c18da3cc2850967840e4a6774e433 Mon Sep 17 00:00:00 2001 From: "github-actions[bot]" <41898282+github-actions[bot]@users.noreply.github.com> Date: Sun, 28 Jul 2024 09:51:03 +0000 Subject: [PATCH] Deployed dfbb01e with MkDocs version: 1.6.0 --- .nojekyll | 0 404.html | 505 ++ Automatizace/komponenty/index.html | 753 ++ Automatizace/nasazovani/index.html | 688 ++ Pywb/nastaveni/index.html | 845 +++ "Pywb/rozpracovan\303\251/index.html" | 725 ++ assets/images/favicon.png | Bin 0 -> 1870 bytes assets/javascripts/bundle.fe8b6f2b.min.js | 29 + assets/javascripts/bundle.fe8b6f2b.min.js.map | 7 + assets/javascripts/lunr/min/lunr.ar.min.js | 1 + assets/javascripts/lunr/min/lunr.da.min.js | 18 + assets/javascripts/lunr/min/lunr.de.min.js | 18 + assets/javascripts/lunr/min/lunr.du.min.js | 18 + assets/javascripts/lunr/min/lunr.el.min.js | 1 + assets/javascripts/lunr/min/lunr.es.min.js | 18 + assets/javascripts/lunr/min/lunr.fi.min.js | 18 + assets/javascripts/lunr/min/lunr.fr.min.js | 18 + assets/javascripts/lunr/min/lunr.he.min.js | 1 + assets/javascripts/lunr/min/lunr.hi.min.js | 1 + assets/javascripts/lunr/min/lunr.hu.min.js | 18 + assets/javascripts/lunr/min/lunr.hy.min.js | 1 + assets/javascripts/lunr/min/lunr.it.min.js | 18 + assets/javascripts/lunr/min/lunr.ja.min.js | 1 + assets/javascripts/lunr/min/lunr.jp.min.js | 1 + assets/javascripts/lunr/min/lunr.kn.min.js | 1 + assets/javascripts/lunr/min/lunr.ko.min.js | 1 + assets/javascripts/lunr/min/lunr.multi.min.js | 1 + assets/javascripts/lunr/min/lunr.nl.min.js | 18 + assets/javascripts/lunr/min/lunr.no.min.js | 18 + assets/javascripts/lunr/min/lunr.pt.min.js | 18 + assets/javascripts/lunr/min/lunr.ro.min.js | 18 + assets/javascripts/lunr/min/lunr.ru.min.js | 18 + assets/javascripts/lunr/min/lunr.sa.min.js | 1 + .../lunr/min/lunr.stemmer.support.min.js | 1 + assets/javascripts/lunr/min/lunr.sv.min.js | 18 + assets/javascripts/lunr/min/lunr.ta.min.js | 1 + assets/javascripts/lunr/min/lunr.te.min.js | 1 + assets/javascripts/lunr/min/lunr.th.min.js | 1 + assets/javascripts/lunr/min/lunr.tr.min.js | 18 + assets/javascripts/lunr/min/lunr.vi.min.js | 1 + assets/javascripts/lunr/min/lunr.zh.min.js | 1 + assets/javascripts/lunr/tinyseg.js | 206 + assets/javascripts/lunr/wordcut.js | 6708 +++++++++++++++++ .../workers/search.b8dbb3d2.min.js | 42 + .../workers/search.b8dbb3d2.min.js.map | 7 + assets/stylesheets/main.3cba04c6.min.css | 1 + assets/stylesheets/main.3cba04c6.min.css.map | 1 + assets/stylesheets/palette.06af60db.min.css | 1 + .../stylesheets/palette.06af60db.min.css.map | 1 + index.html | 601 ++ search/search_index.json | 1 + sitemap.xml | 3 + sitemap.xml.gz | Bin 0 -> 127 bytes 53 files changed, 11411 insertions(+) create mode 100644 .nojekyll create mode 100644 404.html create mode 100644 Automatizace/komponenty/index.html create mode 100644 Automatizace/nasazovani/index.html create mode 100644 Pywb/nastaveni/index.html create mode 100644 "Pywb/rozpracovan\303\251/index.html" create mode 100644 assets/images/favicon.png create mode 100644 assets/javascripts/bundle.fe8b6f2b.min.js create mode 100644 assets/javascripts/bundle.fe8b6f2b.min.js.map create mode 100644 assets/javascripts/lunr/min/lunr.ar.min.js create mode 100644 assets/javascripts/lunr/min/lunr.da.min.js create mode 100644 assets/javascripts/lunr/min/lunr.de.min.js create mode 100644 assets/javascripts/lunr/min/lunr.du.min.js create mode 100644 assets/javascripts/lunr/min/lunr.el.min.js create mode 100644 assets/javascripts/lunr/min/lunr.es.min.js create mode 100644 assets/javascripts/lunr/min/lunr.fi.min.js create mode 100644 assets/javascripts/lunr/min/lunr.fr.min.js create mode 100644 assets/javascripts/lunr/min/lunr.he.min.js create mode 100644 assets/javascripts/lunr/min/lunr.hi.min.js create mode 100644 assets/javascripts/lunr/min/lunr.hu.min.js create mode 100644 assets/javascripts/lunr/min/lunr.hy.min.js create mode 100644 assets/javascripts/lunr/min/lunr.it.min.js create mode 100644 assets/javascripts/lunr/min/lunr.ja.min.js create mode 100644 assets/javascripts/lunr/min/lunr.jp.min.js create mode 100644 assets/javascripts/lunr/min/lunr.kn.min.js create mode 100644 assets/javascripts/lunr/min/lunr.ko.min.js create mode 100644 assets/javascripts/lunr/min/lunr.multi.min.js create mode 100644 assets/javascripts/lunr/min/lunr.nl.min.js create mode 100644 assets/javascripts/lunr/min/lunr.no.min.js create mode 100644 assets/javascripts/lunr/min/lunr.pt.min.js create mode 100644 assets/javascripts/lunr/min/lunr.ro.min.js create mode 100644 assets/javascripts/lunr/min/lunr.ru.min.js create mode 100644 assets/javascripts/lunr/min/lunr.sa.min.js create mode 100644 assets/javascripts/lunr/min/lunr.stemmer.support.min.js create mode 100644 assets/javascripts/lunr/min/lunr.sv.min.js create mode 100644 assets/javascripts/lunr/min/lunr.ta.min.js create mode 100644 assets/javascripts/lunr/min/lunr.te.min.js create mode 100644 assets/javascripts/lunr/min/lunr.th.min.js create mode 100644 assets/javascripts/lunr/min/lunr.tr.min.js create mode 100644 assets/javascripts/lunr/min/lunr.vi.min.js create mode 100644 assets/javascripts/lunr/min/lunr.zh.min.js create mode 100644 assets/javascripts/lunr/tinyseg.js create mode 100644 assets/javascripts/lunr/wordcut.js create mode 100644 assets/javascripts/workers/search.b8dbb3d2.min.js create mode 100644 assets/javascripts/workers/search.b8dbb3d2.min.js.map create mode 100644 assets/stylesheets/main.3cba04c6.min.css create mode 100644 assets/stylesheets/main.3cba04c6.min.css.map create mode 100644 assets/stylesheets/palette.06af60db.min.css create mode 100644 assets/stylesheets/palette.06af60db.min.css.map create mode 100644 index.html create mode 100644 search/search_index.json create mode 100644 sitemap.xml create mode 100644 sitemap.xml.gz diff --git a/.nojekyll b/.nojekyll new file mode 100644 index 0000000..e69de29 diff --git a/404.html b/404.html new file mode 100644 index 0000000..e02c282 --- /dev/null +++ b/404.html @@ -0,0 +1,505 @@ + + + +
+ + + + + + + + + + + + + + +Automatizační nástroj je uchován na Githubu v repozitáři pywb, vlastněným organizací WebarchivCZ.
+Služba pywb je provozovaná z docker image vytvořeném tvůrcem pywb Ilya Kreymer. Všechny dostupné tagy obrazu jsou zveřejněné na Dockerhub. V okamžiku psaního tohoto dokumentu byla nejnovější verze pywb 2.7.4.
+Material for MkDocs je framework nad MkDocs který z Markdown dokumentace vytváří statickou stránku. Dokumentace je uchována ve složce
+./docs
.
Příkaz ./mkdocs.sh
spustí lokální dokumentaci na adrese http://0.0.0.0:8000/
Github Pages umožňuje hostování statickým webů z githubu. Včetně právě čtené Dokumentace.
+mkdocs.yml # The configuration file.
+docs/
+ index.md # The documentation homepage.
+ ... # Other markdown pages, images and other files.
+
+Traefik směřuje požadavky vůči serveru na konkrétní služby jako je např. pywb.
+Jenkins file instruuje https://jenkins.webarchiv.cz běžící na wa-dev-docker00.
+/home/ansible/pywb/run-test.sh
/home/ansible/pywb/run-prod.sh
pywb: http://10.3.0.21:443 +traefik dashboard: http://10.3.0.21
+pywb: https://pywb.webarchiv.cz - veřejný +Traefik dashboard: https://pywb.webarchiv.cz/traefik/ - z knihovny nebo VPN, může být i veřejný
+ + + + + + + + + + + + + +Sklizně jsou rozdělené do let a jsou v režimu read-only. Vyjímkou je vždy aktuální rok.
++++
+- +
05
- Read-only sklizně z roku 2005, navíc obsahuje všechny sklizně před rokem 2005.- +
06
- Read-only sklizně z roku 2006- +
23
- Read-only sklizně z roku 2023- +
24
- Read/Write sklizně z roku 2024 (aktuální rok).
S postupem času přibývali nové typy sklizní a strategie sklízení. Změnil se archviní formát z ARC do WARC s přechodem na Heritrix 3. Nyní je na zvážení používání archivního formátu WACZ.
+Typy sklizní jsou popsány na stránkách českého webového archivu. Obecně se dá říci, že výběrové sklizně jsou sklizně, u kterých je vyjednáno zpřístupnění archivovaného obsahu veřejnosti a webový archiv je sklízí periodicky. Tématické a celoplošné sklizně obsahují převážně data, k nímž v čase archivace nebylo vyjednáno zpřístupnění veřejnosti, ale mohou se okrajově překývat se zdroji, ke kterým bylo vyjednáno zpřístupnění veřejnosti. V referenčním centru Národní knihovny je dostupný i archivní obsah, který nebyl vyjednán k zveřejnění a který není omezen z jiných důvodů. Takto popsaný režim přístup vychází z české legislativy.
+V současné době se archiv obvykle skládá z následujících strategií sklizní. Výběrové sklizně jsou v drtivém případě realizované v rámci sklizní ve složce serials
, Celoplošné sklizně v rámci složky totals
. Ostatní sklizně plní primárně Tématické sklině. Koncový uživatel webového archivu neví, v rámci jaké sklízecí strategie a v rámci kterého typu sklizně byla data získána. To je technický údaj, který není dostupný pomocí OpenWayback. V rámci Pywb je určitá šance, tuto informaci zpřístupnit.
serials
- Výběrové sklizně.tests
- testovací, technické sklizně na zvážení zda je možné webovou stránku archivovat v dostačující kvalitě.topics
- Tématické sklizněcontinuous
- průběžné sklizně NewsDigest - Tématické sklizněcontinuous-cov19
- průběžné sklizně k tématu Covid 2019 - Tématické sklizněcontinuous-ukrainewar
- průběžné sklizně k tématu válka na Ukrajině - Tématické skliznětotals
- Celoplošné sklizněmanuals
- ruční sklizně - Tématické sklizně & z malé části výběrové sklizně/index/
- SSD disk připojený pro rychlou práci s indexem/mnt/archive/
- Obsahuje sklizené archivy pro každý rok. Každý rok je připojený přes NFSv4./webarchive/config.yaml
- konfigurační soubor/webarchive/collections/
- adresář se všemi namapovaný kolekcemi z /mnt/archive
Oficiální Pywb dokumentace: Dynamic Collections and Automatic Indexing
+ + + + + + + + + + + + + + +/mnt/archive/23/topics/Topics-2023-07-T-APVVM
/mnt/prase
pywb:
+ image: webrecorder/pywb:2.7.4
+ volumes:
+ # INDEX
+ - "/mnt/prase:/webarchive/collections/topics/indexes/"
+ # ARCHIV
+ - /mnt/archive/23/topics/Topics-2023-07-T-APVVM:/webarchive/collections/topics/archive/23/Topics-2023-07-T-APVVM
+ - /mnt/archive/23/topics/Topics-2023-08-T-MilanKundera:/webarchive/collections/topics/archive/23/Topics-2023-08-T-MilanKundera
+ # KONFIGURACE
+ - "{{ pywb_dir }}/config.yaml:/webarchive/config.yaml"
+
+++Otázka jestli do téhle struktury zapadají i historická data. Je potřeba projít strukturu archivu od roku 2005.
+
Collections
+
+- Topic 1 // Tématická sklizeň
+ - Archive
+ - Sklizeň 1
+ - Sklizeň 2
+ - Sklizeň 3
+ - Indexes
+ - Sklizeň 1
+ - Sklizeň 2
+ - Sklizeň 3
+
+- Topic 2 // Tématická sklizeň
+
+Index fyzický struktura
+- /mnt/index
+ - /topics
+ - /Topics-2023-07-T-APVVM
+ - /Topics-2023-08-T-MilanKundera
+ - /totals
+ - /2023
+ - /2024
+
+
+Mapování v Docker-compose
+"fyzická casta na serveru":"cesta z pohledu pywb"
+ - /mnt/archive/22/serials:/webarchive/collections/serials/archive/
+ - /mnt/archive/22/totals:/webarchive/collections/totals/archive/
+ - /mnt/archive/23/serials:/webarchive/collections/serials/archive/
+ - /mnt/archive/23/totals:/webarchive/collections/totals/archive/
+
+Ruční sklizeň - Facebook podmínky služby
+docker-compose konfigurace
+ pywb:
+ image: webrecorder/pywb:2.7.4
+ volumes:
+
+ - "{{ pywb_dir }}/config.yaml:/webarchive/config.yaml"
+ - "/mnt/archive/23/manuals/crawls/collections/:/webarchive/collections/"
+
+
+API Call curl -s '10.3.0.21:443/all/cdx?url=www.facebook.com/legal/terms&output=json'
vrací
{
+ "urlkey": "com,facebook)/legal/terms",
+ "timestamp": "20221209191852",
+ "url": "https://www.facebook.com/legal/terms",
+ "mime": "text/html",
+ "status": "200",
+ "digest": "GRUWGB5ZAMAPKEAC2DOOD2AEY7M6P2EZ",
+ "length": "290673",
+ "offset": "496164353",
+ "filename": "rec-20221209182111914788-65f062a0d7a3.warc.gz",
+ "source": "1222_prezident23/indexes/index.cdxj",
+ "source-coll": "1222_prezident23",
+ "access": "allow"
+}
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+