Skip to content

Instantly share code, notes, and snippets.

@peio
peio / opendata-pub-reccomendations.bg.md
Created June 19, 2012 17:06
Препоръки за публикуване на отворени правителствени данни

Препоръки за публикуване на отворени правителствени данни

Формати

Най-бързият и лесен начин да се направят определени данни достъпни онлайн е да се публикуват в суровия "изходен" формат (примерно XML файловете с имотните декларации на лицата, заемащи висши държавни длъжности). Важно е данните да бъдат добре структурирани. Структурата позволява автоматизирания достъп и обработка на данните. Добре познати и разпространени формати за структуриране на данни са XML, RDF и CSV. Файлови формати, които позволяват на данните да бъдат видяни, без да бъдат извлечени и обработени (примерно изображения на документи), не са използваеми и следва да бъдат избягвани.

Каталог

Създайте онлайн каталог на достъпните данни, който да позволи на хората лесно да откриват достъпната информация. Данните следва да бъдат добре описани и документирани, защото в противен случай тяхната използваемост би била минимална. Популярните методи за съхранение в Excel, Word, PDF и други двоични формати следва да бъдат избягвани.

@peio
peio / ru_regexps.py
Created March 28, 2012 17:04
Regular expressions to detect russian language
is_cyrilic = re.compile(u'а|е|и|о|у|ъ|я|ю', re.U) # Кирилска гласна
ru_extra_letters = re.compile(u'Ё|ё|Ы|ы|Э|э|ь[^о]+', re.U) # Специфични букви за руския език както и палатализация http://en.wikipedia.org/wiki/Russian_phonology#Palatalization
ru_j = re.compile(u' ж[ \.!?,;]', re.U) # в руския се среща ж като самостоятелна част в изречение "Впрочем, что ж я"
ru_k = re.compile(u' к[ \.!?,;]', re.U|re.I) # в руския се среща к като предлог
bg_definite_article = re.compile(u'\wът[ \.!?,;]', re.U)
@peio
peio / md2kindle.sh
Created January 2, 2012 13:26
Convert and email a markdown file to my Kindle
#!/bin/bash
# Convert and email MarkDown file to Kindle
MD_FILE=$1
HTML_FILE=`basename "$MD_FILE" .md`
HTML_FILE='/tmp/'$HTML_FILE".html"
KINDLE_HEADER='/home/peio/bin/kindle.header'
# Create header
cat $KINDLE_HEADER > "$HTML_FILE"
@peio
peio / Directive2Markdown.py
Created January 2, 2012 13:12
Annotate an EC Directive with MarkDown
#!/usr/local/bin/python
# -*- coding: utf-8 -*-
'''
Structure of a legal act
http://publications.europa.eu/code/en/en-120000.htm
# Bulgarian
#chapter_bg = re.compile('(^ГЛАВА [IVXLCDM]+)\s+([А-Яа-я0-9 ]{1,}$)', re.M | re.U)
'''
@peio
peio / deal.php
Created November 29, 2011 07:27
Deal or no deal - bulgarian version
#!/usr/bin/php-cgi -q
<?php
include "stats.lib.php";
# Сделка или не
// Брой игри, които ще бъдат изиграни. От значение за статистиката на резултатите, които ще се покажат:
$games = 1;
for ($game = 0; $game < $games; $game++) { //Начало на играта