Skip to content

Instantly share code, notes, and snippets.

@peio
Created June 19, 2012 17:06
Show Gist options
  • Star 1 You must be signed in to star a gist
  • Fork 1 You must be signed in to fork a gist
  • Save peio/2955318 to your computer and use it in GitHub Desktop.
Save peio/2955318 to your computer and use it in GitHub Desktop.
Препоръки за публикуване на отворени правителствени данни

Препоръки за публикуване на отворени правителствени данни

Формати

Най-бързият и лесен начин да се направят определени данни достъпни онлайн е да се публикуват в суровия "изходен" формат (примерно XML файловете с имотните декларации на лицата, заемащи висши държавни длъжности). Важно е данните да бъдат добре структурирани. Структурата позволява автоматизирания достъп и обработка на данните. Добре познати и разпространени формати за структуриране на данни са XML, RDF и CSV. Файлови формати, които позволяват на данните да бъдат видяни, без да бъдат извлечени и обработени (примерно изображения на документи), не са използваеми и следва да бъдат избягвани.

Каталог

Създайте онлайн каталог на достъпните данни, който да позволи на хората лесно да откриват достъпната информация. Данните следва да бъдат добре описани и документирани, защото в противен случай тяхната използваемост би била минимална. Популярните методи за съхранение в Excel, Word, PDF и други двоични формати следва да бъдат избягвани.

За хора и машини

Направете данните достъпни за хора и машини като:

  • обогатите, вашите съществуващи (X)HTML страници със семантични анотации и други мета-данни;
  • използвате стандартизираните и отворени общоприети формати за публикуване, какъвто е XML или RDF;
  • направете вашите данни читаеми от хора, като ги конвертирате към (X)HTML или като използвате стилови трансформации с помощта на CSS или XSLT.
  • изградете схема за адресация и използвайте непроменливи уникални ресурсни идентификатори (URI);
  • създайте възможност за цитиране и позоваване на сегмент от вашите данни, като използвате (anchor/id links или XLINKs/XPointers) връзки.

Тези стъпки ще помогнат на обществото лесно да намира, цитира и разбере публикуваните данни. Каталогът/Порталът трябва да прави ясни условията и правилата, които следва да бъдат спазени за ползване на данните. Съдържанието на каталога, само по себе си, следва да бъде считано за отделен набор от данни и да позволява извличането на информация за достъпните масиви от данни. Подробно документирайте частите на страницата и създайте шаблон за достъпни URL адреси. Създайте RSS емисия, за да осведомявате за новостите в сайта.

@emanuil-tolev
Copy link

Чудя се, JSON в секция "Формати"? Не знам дали се брои като особено разпространен, макар че мейнстрийм езиците имат библиотеки които лесно се оправят с него.

Също така хората обикновено не щат да публикуват каталози и подобна информация във формат, удобен за машини, тъй като удвоява работата по разработка и поддръжка в повечето случаи. Не заради друго, просто заради начина, по който им е настроена средата и/или инструментите, които ползват. Например, ако всичко ти е написано на PHP с някакъв фреймуърк и някаква база данни (пак по-добре от повечето правителствени сайтове), ще ти отнеме поне малко усилие да добавиш API точки, които да връщат XML вместо HTML и прочее. Ако обаче, като правиш нова версия на даден сайт примерно, помислиш за тези неща и го построиш с нужната функционалност още от самото начало, разширяването на такъв дизайн с нова функционалност и съдържание не би следвало да изисква повече усилия.

А, сега ако можех да съкратя туй, което искам да кажа тъй че да става за "препоръка"...

@peio
Copy link
Author

peio commented Jun 20, 2012

За мен краткият отговор на JSON e "да". Проблемът му е че не позволява самодокументация, но е същото и за CSV. Отговорът, който дават W3C стандартите е различен спрямо формата. Обикновено препоръчват XML + Стил, за да спестят двойното съдържание. Когато обаче си говорим за съдържание по вид (примерно когато се публикува RDF) трябва да говорим и за URI архитектура, което пак е тема на подобни препоръки, но на една по-разширена тяхна част.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment