Alexander Kalinin AlexDel

## view_video.php
<link rel="stylesheet" href="/static/js/fancybox-1.3.1/jquery.fancybox-1.3.1.css" media="screen" type="text/css" />

<script type='text/javascript' src='/static/js/jquery.js'></script>
<script type='text/javascript' src='/static/js/fancybox-1.3.1/jquery.fancybox-1.3.1.js'></script>


<script type='text/javascript'>
$(document).ready(function(){
    $('#main-video-block #preview_texts a').mouseenter(function () {
        if (!$(this).hasClass('current')) {

## gist:1683242
import nltk

def find_language(word):
    #загружаем декларацию
    from nltk.corpus import udhr

    #заготавливаем пустой массив
    result_lang = []

    #перебираем тексты с латинской транскрипцией

## gist:1683351
import nltk

#имплортируем wordnet
from nltk.corpus import wordnet as wn

#инициализируем переменные для аггегации
hyponyms_number = 0
synsets_with_hyponyms = 0

for synset in list(wn.all_synsets('n')): # перебираем все синсеты с существительными

## gist:1687834
from __future__ import division

def stand_dev(mylist, random_selection = 0):
	mean = sum(mylist)/len(mylist)

	#если стоит флаг случайной выборки, уменьшаем знаменатель на 1
	if random_selection != 0:
		denominator = len(mylist)-1
	else:
		denominator = len(mylist)

## gist:1924225
#NLTK упр 21. Выводим слова из сайта, которых нет в корпусе слов (типа неизвестные)

def unknown(url):
        #загружаем фигню
        import nltk, urllib

        #читаем url
	html = urllib.urlopen(url).read()
	raw = nltk.clean_html(html)
	tokens = set(nltk.word_tokenize(raw))

## gist:1925119
#NLTk упр 24. Функция кодирует английский текст, заменяя буквы на всякую фигню
# с помощью регулярок

import nltk,re

def hackerize(text):
        #делаем буквы строчными
        text = text.lower()

        #список кортежей "регулярка-замена"

## gist:1991365
from __future__ import division
from math import sqrt

def heron(a,b,c):
    perimeter = a+b+c
    halfp = perimeter/2
    square = sqrt(halfp*(halfp-a)*(halfp-b)*(halfp-c))
    return square

## gist:2464585
import nltk, re

def piglatinize(word):
    plword = re.findall(r'^(y|qu|[bcdfghgklmprstvwzx]*)(.*)', word)

    if plword != []:
        plword = plword[0][1] + plword[0][0]
    else:
        plword = word


## gist:2949180
#этот скрипт удаляет тэги и нормализует пробелы
import nltk,re

def normalize(text):
#список кортежей "регулярка-замена"
    replaces = [('<[\/\!]*?[^<>]*?>',''),('\s+',' ')]
    normtext = []
#цикл пробегает весь список, применяя каждый кортеж замен к тексту
    for target,replace in replaces:
        normtext = re.sub(target, replace, text)

## gist:3956431
# -*- coding: utf8 -*-
import lxml, lxml.html, re, random
from lxml import etree

text = lxml.html.parse('C:/Users/user/Desktop/темп/Новая папка/Билеты1.html').getroot()

ques = []
for child in text[0]:
    html_text = re.sub("^\s+|\n|\r|\t|\s+$", '', lxml.html.tostring(child))
    if child.tag == 'h1':
	<link rel="stylesheet" href="/static/js/fancybox-1.3.1/jquery.fancybox-1.3.1.css" media="screen" type="text/css" />

	<script type='text/javascript' src='/static/js/jquery.js'></script>
	<script type='text/javascript' src='/static/js/fancybox-1.3.1/jquery.fancybox-1.3.1.js'></script>


	<script type='text/javascript'>
	$(document).ready(function(){
	$('#main-video-block #preview_texts a').mouseenter(function () {
	if (!$(this).hasClass('current')) {
	import nltk

	def find_language(word):
	#загружаем декларацию
	from nltk.corpus import udhr

	#заготавливаем пустой массив
	result_lang = []

	#перебираем тексты с латинской транскрипцией
	import nltk

	#имплортируем wordnet
	from nltk.corpus import wordnet as wn

	#инициализируем переменные для аггегации
	hyponyms_number = 0
	synsets_with_hyponyms = 0

	for synset in list(wn.all_synsets('n')): # перебираем все синсеты с существительными
	from __future__ import division

	def stand_dev(mylist, random_selection = 0):
	mean = sum(mylist)/len(mylist)

	#если стоит флаг случайной выборки, уменьшаем знаменатель на 1
	if random_selection != 0:
	denominator = len(mylist)-1
	else:
	denominator = len(mylist)
	#NLTK упр 21. Выводим слова из сайта, которых нет в корпусе слов (типа неизвестные)

	def unknown(url):
	#загружаем фигню
	import nltk, urllib

	#читаем url
	html = urllib.urlopen(url).read()
	raw = nltk.clean_html(html)
	tokens = set(nltk.word_tokenize(raw))
	#NLTk упр 24. Функция кодирует английский текст, заменяя буквы на всякую фигню
	# с помощью регулярок

	import nltk,re

	def hackerize(text):
	#делаем буквы строчными
	text = text.lower()

	#список кортежей "регулярка-замена"
	from __future__ import division
	from math import sqrt

	def heron(a,b,c):
	perimeter = a+b+c
	halfp = perimeter/2
	square = sqrt(halfp(halfp-a)(halfp-b)*(halfp-c))
	return square
	import nltk, re

	def piglatinize(word):
	plword = re.findall(r'^(y\|qu\|[bcdfghgklmprstvwzx])(.)', word)

	if plword != []:
	plword = plword[0][1] + plword[0][0]
	else:
	plword = word
	#этот скрипт удаляет тэги и нормализует пробелы
	import nltk,re

	def normalize(text):
	#список кортежей "регулярка-замена"
	replaces = [('<[\/\!]?[^<>]?>',''),('\s+',' ')]
	normtext = []
	#цикл пробегает весь список, применяя каждый кортеж замен к тексту
	for target,replace in replaces:
	normtext = re.sub(target, replace, text)
	# -- coding: utf8 --
	import lxml, lxml.html, re, random
	from lxml import etree

	text = lxml.html.parse('C:/Users/user/Desktop/темп/Новая папка/Билеты1.html').getroot()

	ques = []
	for child in text[0]:
	html_text = re.sub("^\s+\|\n\|\r\|\t\|\s+$", '', lxml.html.tostring(child))
	if child.tag == 'h1':