Skip to content

Instantly share code, notes, and snippets.

@pkiraly
Created April 1, 2021 14:49
Show Gist options
  • Save pkiraly/541d85082aed731be1ee4c600e715de6 to your computer and use it in GitHub Desktop.
Save pkiraly/541d85082aed731be1ee4c600e715de6 to your computer and use it in GitHub Desktop.
---
title: Adat a könyvtárban
type: slide
slideOptions:
transition: slide
theme: white
---
# <div style="border-bottom: 1px solid cornflowerblue; margin: 5px">Adat a könyvtárban</div>
Király Péter (GWDG, Göttingen)
Szakkönyvtári Seregszemle, 2021-03-31
---
<img src="https://pro.europeana.eu/thumbs/1240x600c/Images/Blog_images/2018-10/Labs%20crop.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 80%">
[Emmanuelle Bermes (BnF) vázlata](https://pro.europeana.eu/post/building-library-labs-what-do-they-do-and-who-are-they-for)
</div>
---
„Sok munkát fektettünk _digitális gyűjtemények_ létrehozásába.
Hogyan ösztönözhetnénk [most már] az adatok intenzívebb használatát és változatosabb újrahasznosítását?”
---
[DIKW piramis](https://en.wikipedia.org/wiki/DIKW_pyramid) (Ackoff, 1989)
<img src="https://upload.wikimedia.org/wikipedia/commons/0/06/DIKW_Pyramid.svg" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 80%">
[Longlivetheux, 2015](https://commons.wikimedia.org/wiki/File:DIKW_Pyramid.svg)
</div>
---
egyszerű megosztás
<img src="https://pad.gwdg.de/uploads/upload_00929835fbe0b103e223d047dfeb7352.png" style="background:none; border:none; box-shadow:none;" width="800">
---
adatgazdagítás (körutazás) I.
<img src="https://pad.gwdg.de/uploads/upload_770e5eaba5216e7440b0f4fa034cf2de.png" style="background:none; border:none; box-shadow:none;" width="800">
---
adatgazdagítás II.
<img src="https://pad.gwdg.de/uploads/upload_66db7c85a4184812e20dfdba89b503a9.png" style="background:none; border:none; box-shadow:none;" width="800">
---
bibliográfiai adatok tájképe
<img src="https://pad.gwdg.de/uploads/upload_1ddba8d9475fb00ca398372e37b38615.png" style="background:none; border:none; box-shadow:none;" width="800">
---
funkcionalitás szerint
<img src="https://pad.gwdg.de/uploads/upload_37ac3f655deef6516eccab1f3c04b0d9.png" style="background:none; border:none; box-shadow:none;" height="550">
---
előnyök
* adatgazdagítás
* együttműködés
---
alapdokumentumok
* [Collections as Data](https://collectionsasdata.github.io/), 2016
* [Heritage Data Reuse Charter](https://datacharter.hypotheses.org/), 2017
* [Tasovac--Chambers--Tóth-Czifra](https://hal.archives-ouvertes.fr/hal-02961317), 2020
* [Tóth-Czifra--Romary](https://halshs.archives-ouvertes.fr/halshs-02475692), 2020
* [Passenger Piegon Manifesto](https://ppmanifesto.hcommons.org/), 2020
* [Best practices for library LOD publ.](https://libereurope.eu/wp-content/uploads/2021/02/LOD-Guidelines-FINAL-Feb-2021.pdf), 2021
---
alapelvek
* kölcsönösség
* interoperabilitás
* idézhetőség
* nyílt adatok
* adatgondozás
* bizalom
---
összetevők
* kapcsolat
* hozzáférési protokollok
* felhasználási feltételek
* citációs szabványok
* a gazdagított adat tárolása
* összekapcsolás
---
finomított keretrendszer
<img src="https://pad.gwdg.de/uploads/upload_ea0a01da47aad409beb98d4f409c1508.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 80%">
[Candela et al., 2020](https://doi.org/10.1177/0165551520950246)
</div>
---
ütköző elvárások
* archivátori ↔ szerkesztői
* szemcsézettség
* szókincs
---
## közös közgyűjteményi alapok
---
idődimenzió
* [hosszú időtartam](http://acta.bibl.u-szeged.hu/40882/) ↔ ipar: „historical” ~ pár perccel korábi
* a jelen mentése ([documenting the now](https://www.docnow.io/))
* bizonytalanság kezelése (előtt, után, kb., főként)
---
kulturális entitások
* személyek, családok, intézmények
* földrajzi (és imaginárius) helyek
* események
* fogalmak
---
## példák
---
szakterületek
* irodalomszociológia
* fordítás-tudomány
* történelem
* művészettörténet
---
címkék
* „bibliográfiai adattudomány”
* „kulturális analitika”
* „Korporatheken”
* „bibliomining”
* „digitális ...”
---
napilapok városonként
<img src="https://pad.gwdg.de/uploads/upload_0bc4bf1bfa3534c23ad2813a18a03126.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 60%">
[Marjanen et al., 2019](https://doi.org/10.21825/jeps.v4i1.10483)
</div>
---
finn női szerzők
<img src="https://pad.gwdg.de/uploads/upload_ae53421825dadf335ade8ccee2a07207.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 60%">
[Lahti et al., 2019a](https://researchportal.helsinki.fi/en/publications/best-practices-in-bibliographic-data-science)
</div>
---
a latin arányváltozásai
<img src="https://pad.gwdg.de/uploads/upload_73fcbbfe7e2b9884442fc0af5b17b510.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 60%">
[Lahti et al., 2019b](https://doi.org/10.1080/01639374.2018.1543747)
</div>
---
A nyomtatott terület aránya
<img src="https://pad.gwdg.de/uploads/upload_14b54b0857021b683c38ac7c60bd51a0.png" style="background:none; border:none; box-shadow:none;" height="500">
<div style="text-align: right; font-size: 60%">
[Lahti et al., 2019b](https://doi.org/10.1080/01639374.2018.1543747)
</div>
---
Képek csoportosítása
<img src="https://pad.gwdg.de/uploads/upload_3788b95610900a13eb323c0333922be9.png" style="background:none; border:none; box-shadow:none;" height="400">
<div style="text-align: right; font-size: 60%">
[Klinke, 2018](https://doi.org/10.5282/ubm/epub.42415)
</div>
---
Műfaji pontosság: könyvtáros vs. gépi model
<img src="https://pad.gwdg.de/uploads/upload_30310745a2201ed39d6b2659360bfb70.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 60%">
[Underwood, 2020](https://doi.org/10.17613/fzf7-tm48)
</div>
---
Műfaji pontosság: gépi model vs. idő
<img src="https://pad.gwdg.de/uploads/upload_9884090b5bc3c30dc7d6b09737338ef9.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 60%">
[Underwood, 2020](https://doi.org/10.17613/fzf7-tm48)
</div>
---
műfajok egyéb MARC adatelemek alapján
<img src="https://pad.gwdg.de/uploads/upload_2fd0f932231aa5da64bf286cae621a61.png" style="background:none; border:none; box-shadow:none;">
<div style="text-align: right; font-size: 60%">
[Lüschow--Calvo Tello, 2021](http://ceur-ws.org/Vol-2836/qurator2021_paper_9.pdf)
</div>
---
szerző--nyomdász--könyvkereskedő
<img src="https://pad.gwdg.de/uploads/upload_5b5466d333d596208cf7ab066f3a9d80.png" style="background:none; border:none; box-shadow:none;" width="600">
<div style="text-align: right; font-size: 60%">
[Péter et al., 2020](http://publicatio.bibl.u-szeged.hu/18634/1/mszny2020_0.pdf)
</div>
---
matematikai modellek
* determinisztikus
* **probabilisztikus**
---
<table>
<thead>
<tr>
<th style="border-bottom: 1px solid blue;">könyvtári adat</th>
<th style="border-bottom: 1px solid blue;">származtatott adat</th>
</tr>
</thead>
<tbody>
<tr>
<td valign="top" width="50%">
<ul>
<li>cím</li>
<li>megjelenés helye</li>
<li>nyelv</li>
<li>terjedelem</li>
</ul>
</td>
<td>
<ul>
<li>betűtípus és méret</li>
<li>papírfogyasztás</li>
<li>szavak száma</li>
<li>egy lakosra eső nyomtatott szavak száma</li>
</ul>
</td>
</tr>
</tbody>
</table>
---
körforgás
* [oxfordi kéziratkatalógus](https://github.com/bodleian/medieval-mss) a GitHubon
* „[cselekmény helyszíne](https://www.wikidata.org/wiki/Q726254)” a Wikidatán
* körutazás ([Roundtripping](https://meta.wikimedia.org/wiki/Wikimedia_Commons_Data_Roundtripping))
---
intézmények
* https://**data.**{kbr.be, kb.nl, bnf.fr, bl.uk, ...}
* https://**lab.**....
---
könyvtár + adattudomány
* [Berkeley Institute for Data Science](https://bids.berkeley.edu/)
* [The Alan Turing Institute](https://www.turing.ac.uk/), London
* [Open Data Institute](https://theodi.org/)
* [Inst. of Qualitative Social Science](https://www.iq.harvard.edu/), Harvard
---
közgyűjteményi adattudomány
* [Cultural Data Analytics Lab](https://cudan.tlu.ee/), Tallin
* [Helsinki Computational History Group](https://www2.helsinki.fi/en/researchgroups/computational-history)
* [Computational Archival Science](https://ischool.umd.edu/research/computational-archival-science)
* [Cultural AI Lab](https://www.cultural-ai.nl/)
---
oktatás
* [Library Carpentry](https://librarycarpentry.org/)
* BL [Digital Scholarship Training Programme](https://www.bl.uk/projects/digital-scholarship-training-programme)
* [Data Scientist Training for Librarians](http://www.dst4l.info/)
* [Programming Historian](https://programminghistorian.org/), [Programozó Történész](https://aprogramozotortenesz.hu/)
---
párbeszéd
* [Fantastic Futures](https://library.stanford.edu/projects/fantastic-futures) → [AI4LAM](http://ai4lam.org/)
* DARIAH [Bibliographical Data](https://www.dariah.eu/activities/working-groups/bibliographical-data-bibliodata/), [RDM](https://www.dariah.eu/activities/working-groups/research-data-management/)
* LIBER [Linked Open Data](https://libereurope.eu/working-group/liber-linked-open-data-working-group/), Data Science
* Research Data Alliance
---
amiről nem volt szó
* adatminőség
* dokumentáció
* licenszek
* etika
* kommunikáció
* nem közgyűjteményi kulturális adatok
---
kapcsolat
* pkiraly@gwdg.de
* [@kiru](https://twitter.com/kiru)
* pkiraly.github.io
* az előadás diái: https://pad.gwdg.de/p/YbRg4-gy4#/
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment