Skip to content

Instantly share code, notes, and snippets.

View vanatteveldt's full-sized avatar

Wouter van Atteveldt vanatteveldt

  • VU University
  • Amsterdam
View GitHub Profile
import settings, sys
import time
from amcat.tasks import do_scrape, FakeScraper
from celery.result import AsyncResult
res = do_scrape.delay(FakeScraper, 3)
while True:
if not res.ready():
time.sleep(.2)
from amcat.models import Article
import csv, sys
for line in csv.DictReader(sys.stdin, delimiter=';'):
aid = int(line["Article ID"])
mid = int(line["New Medium ID"])
print aid, "->", mid
a = Article.objects.get(pk=aid)
a.medium_id = mid
class Article(AmcatModel):
[...]
def save_and_index(self, articleset=None):
"""
Save this article to the database and index, adding it to the given articleset
"""
if self.pk:
raise Exception("Cannot only call save_and_index on unstored articles!")
# ElasticSearch Service
description "ElasticSearch"
start on (net-device-up
and local-filesystems
and runlevel [2345])
stop on runlevel [016]
{
"frames": [
{
"target": {
"name": "Attack",
"spans": [
{
"start": 2,
"end": 3,
"text": "attacked"
jong#(jongeren OR minderjarig OR jongen OR meisje* OR tiener* OR reljeugd OR jeugdig* OR jeugdbende* OR minderjarig* OR kopschopper*) W/10 (misdrij* OR misdaden OR delict* geweldpleging* OR geweldsmisdrij* OR geweldmisdrij* OR mishandel* racis* OR seksis* OR haatzaai* OR grafschen* OR lijkschennis OR verniel* OR vandal* OR brandschtiging* pyroma* vrijheidsberoving* OR gijzel* OR ontvoer* terreur* OR terror* OR aanslag* moord* OR doodslag OR doodgeslagen OR doodslaan OR omgebracht* OR gedood OR vermoord* OR bloedbad OR doodgeschoten OR liquidatie* OR liquidee* OR liquideren OR geliquideerd* vermoord OR vermoordt OR vermoordde OR vermoorden OR vermoordden OR doodt OR doodde OR doden OR doodden OR gedood OR gedode OR vermoorde vechtpartij* OR vechtersba* OR hooligan* OR wapenbezit Or schietpartij* OR schietincident OR steekpartij OR messentrekker* OR stalking overval* OR berov* OR beroof* OR roofoverval* OR straatrov* OR straatroof* diefstal OR stelen OR steelt OR gestolen OR dief OR dieven OR ontvreemd* OR
((("(jongeren OR minderjarig OR jongen OR meisje* OR tiener* OR reljeugd OR jeugdig* OR jeugdbende* OR minderjarig* OR kopschopper*) (misdrij* OR misdaden OR delict* geweldpleging* OR geweldsmisdrij* OR geweldmisdrij* OR mishandel* racis* OR seksis* OR haatzaai* OR grafschen* OR lijkschennis OR verniel* OR vandal* OR brandschtiging* pyroma* vrijheidsberoving* OR gijzel* OR ontvoer* terreur* OR terror* OR aanslag* moord* OR doodslag OR doodgeslagen OR doodslaan OR omgebracht* OR gedood OR vermoord* OR bloedbad OR doodgeschoten OR liquidatie* OR liquidee* OR liquideren OR geliquideerd* vermoord OR vermoordt OR vermoordde OR vermoorden OR vermoordden OR doodt OR doodde OR doden OR doodden OR gedood OR gedode OR vermoorde vechtpartij* OR vechtersba* OR hooligan* OR wapenbezit Or schietpartij* OR schietincident OR steekpartij OR messentrekker* OR stalking overval* OR berov* OR beroof* OR roofoverval* OR straatrov* OR straatroof* diefstal OR stelen OR steelt OR gestolen OR dief OR dieven OR ontvreemd* OR koper
> d = data.frame(mediumid=c(4,4,4,5,5,6,7,5))
> d
mediumid
1 4
2 4
3 4
4 5
5 5
6 6
7 7
_jong#"(jongeren OR minderjarig OR jongen OR meisje* OR tiener* OR reljeugd OR jeugdig* OR jeugdbende* OR minderjarig* OR kopschopper*) (misdrij* OR misdaden OR delict* geweldpleging* OR geweldsmisdrij* OR geweldmisdrij* OR mishandel* racis* OR seksis* OR haatzaai* OR grafschen* OR lijkschennis OR verniel* OR vandal* OR brandschtiging* pyroma* vrijheidsberoving* OR gijzel* OR ontvoer* terreur* OR terror* OR aanslag* moord* OR doodslag OR doodgeslagen OR doodslaan OR omgebracht* OR gedood OR vermoord* OR bloedbad OR doodgeschoten OR liquidatie* OR liquidee* OR liquideren OR geliquideerd* vermoord OR vermoordt OR vermoordde OR vermoorden OR vermoordden OR doodt OR doodde OR doden OR doodden OR gedood OR gedode OR vermoorde vechtpartij* OR vechtersba* OR hooligan* OR wapenbezit Or schietpartij* OR schietincident OR steekpartij OR messentrekker* OR stalking overval* OR berov* OR beroof* OR roofoverval* OR straatrov* OR straatroof* diefstal OR stelen OR steelt OR gestolen OR dief OR dieven OR ontvreemd* OR ko
wva@amcatsql2:~/xtas/xtas$ cat /tmp/marines.conll
1 The _ DT DT _ 2 det _ _
2 marines _ NNS NNS _ 3 nsubj _ _
3 attacked _ VBN VBN _ 0 root _ _
4 the _ DT DT _ 5 det _ _
5 compound _ NN NN _ 3 dobj _ _
6 . _ . . _ 3 punct _ _
wva@amcatsql2:~/xtas/xtas$ cat /tmp/marines.conll | nc localhost 9888 | python -m json.tool
{