Най-бързият и лесен начин да се направят определени данни достъпни онлайн е да се публикуват в суровия "изходен" формат (примерно XML файловете с имотните декларации на лицата, заемащи висши държавни длъжности). Важно е данните да бъдат добре структурирани. Структурата позволява автоматизирания достъп и обработка на данните. Добре познати и разпространени формати за структуриране на данни са XML, RDF и CSV. Файлови формати, които позволяват на данните да бъдат видяни, без да бъдат извлечени и обработени (примерно изображения на документи), не са използваеми и следва да бъдат избягвани.
Създайте онлайн каталог на достъпните данни, който да позволи на хората лесно да откриват достъпната информация. Данните следва да бъдат добре описани и документирани, защото в противен случай тяхната използваемост би била минимална. Популярните методи за съхранение в Excel, Word, PDF и други двоични формати следва да бъдат избягвани.
Направете данните достъпни за хора и машини като:
- обогатите, вашите съществуващи (X)HTML страници със семантични анотации и други мета-данни;
- използвате стандартизираните и отворени общоприети формати за публикуване, какъвто е XML или RDF;
- направете вашите данни читаеми от хора, като ги конвертирате към (X)HTML или като използвате стилови трансформации с помощта на CSS или XSLT.
- изградете схема за адресация и използвайте непроменливи уникални ресурсни идентификатори (URI);
- създайте възможност за цитиране и позоваване на сегмент от вашите данни, като използвате (anchor/id links или XLINKs/XPointers) връзки.
Тези стъпки ще помогнат на обществото лесно да намира, цитира и разбере публикуваните данни. Каталогът/Порталът трябва да прави ясни условията и правилата, които следва да бъдат спазени за ползване на данните. Съдържанието на каталога, само по себе си, следва да бъде считано за отделен набор от данни и да позволява извличането на информация за достъпните масиви от данни. Подробно документирайте частите на страницата и създайте шаблон за достъпни URL адреси. Създайте RSS емисия, за да осведомявате за новостите в сайта.
Чудя се, JSON в секция "Формати"? Не знам дали се брои като особено разпространен, макар че мейнстрийм езиците имат библиотеки които лесно се оправят с него.
Също така хората обикновено не щат да публикуват каталози и подобна информация във формат, удобен за машини, тъй като удвоява работата по разработка и поддръжка в повечето случаи. Не заради друго, просто заради начина, по който им е настроена средата и/или инструментите, които ползват. Например, ако всичко ти е написано на PHP с някакъв фреймуърк и някаква база данни (пак по-добре от повечето правителствени сайтове), ще ти отнеме поне малко усилие да добавиш API точки, които да връщат XML вместо HTML и прочее. Ако обаче, като правиш нова версия на даден сайт примерно, помислиш за тези неща и го построиш с нужната функционалност още от самото начало, разширяването на такъв дизайн с нова функционалност и съдържание не би следвало да изисква повече усилия.
А, сега ако можех да съкратя туй, което искам да кажа тъй че да става за "препоръка"...