Skip to content

Instantly share code, notes, and snippets.

View mazurov's full-sized avatar

Alexander Mazurov mazurov

View GitHub Profile
@mazurov
mazurov / convert.sh
Created May 3, 2020 22:52
Convert pdf to image
convert A2_2046X_FR.pdf[33] -resize 600x "./Lingoda/%02d-A2_2046X_FR.png
@mazurov
mazurov / abstract.txt
Last active October 10, 2018 11:04
Mazurov Highload++ abstract
Как масштабировать обработку большого количества аналитических данных
Hive является одним из основных инструментов обработки данных в Criteo, где каждый день сотни аналитиков и тысячи автоматизированных программ запускают Hive запросы. В докладе обсуждается эволюция платформы Hive в Criteo от подверженной ошибкам установки на выделенных серверах до самой лучшей в своем классе архитектуры, способной к самовосстановлению, автоматическому масштабированию для управления растущей нагрузкой.
Полученная платформа основана на системе управления кластерами Mesos, которая позволяет Criteo масштабироваться по требованию, рациональнее использовать ресурсы и без проблем развертывать новые версии Hive. В докладе подробно описывается архитектура данных Criteo. Cлушатели узнают как компания решила проблемы безопасности, мониторинга, планирования, тестирования и балансировки нагрузки на нескольких уровнях.
Criteo обладает одним из самых больших Hadoop кластеров в Европе. Основными продуктами компании являются системы для
@mazurov
mazurov / chef-shell-es2.sh
Last active July 4, 2018 16:06
Debug chef on ec2
sudo -i
cd /tmp/kitchen
/opt/chef/embedded/bin/chef-zero -d
knife upload . -c client.rb -VVV
/opt/chef/embedded/bin/chef-shell -z -c ./client.rb -j ./dna.json -o <run list>
@mazurov
mazurov / hut_performance.ipynb
Created June 21, 2018 13:30
Hive1 and Hive2 performance comparison
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@mazurov
mazurov / hut_errors_classification.ipynb
Created June 19, 2018 09:02
Hive2 errors classification
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
@mazurov
mazurov / kibana.ql
Created May 4, 2018 12:43
Find verticacopyerrors
http://kibana.pa4.prod.crto.in/app/logtrail#/?q=application:verticacopyerrors%20AND%20hostname:vertica10gopera*&h=All&t=Now&i=kestrel-*&_g=()
@mazurov
mazurov / setup.sh
Last active July 19, 2017 12:01
Fork athena and compile
# Fork main athena repository: https://gitlab.cern.ch/atlas/athena/forks/new
git clone https://:@gitlab.cern.ch:8443/[YOUR_USER_NAME]/athena.git
cd athena
git remote add upstream https://:@gitlab.cern.ch:8443/atlas/athena.git
git fetch upstream # Ensure sync with main repository
# Use useful name for branch "-b your useful name"
git checkout -b 21.0-fix-for-something upstream/21.0 --no-track
# Use the latest date in r2017-XX-XX or the day vefore
cd ..
@mazurov
mazurov / amazurovdc.pp
Created May 5, 2017 14:50
amazurov puppet for docker
class hg_playground::amazurov {
motd::news{'lhcbpr installed':
date => '2015-11-26',
message => ' The LHCb PR machines installed with puppet.'
}
notify {'LHCb settings for LHCb PR machines' :}
include hg_playground::amazurov::software
include hg_playground::amazurov::firewall
@mazurov
mazurov / steps.sh
Created April 25, 2017 10:20
How to get Trigger Menu in xml
AtlCoolConsole.py COOLONL_TRIGGER/CONDBR2
# In AtlCoolConsole prompt
userunlumi 282026
more /TRIGGER/HLT/HltConfigKeys
# extract key, 2218 in the example
TrigConfReadWrite -i TRIGGERDB 2218 -o xml
@mazurov
mazurov / evthelper.py
Created April 25, 2017 09:37
Dump events from GRID
import sys,os
files = sys.argv[1].replace(',',' ')
events = ''
for line in open('event.txt'):
events += '%s,' % line.split()[-1]
events = events[:-1]
com = "AtlCopyBSEvent -e %s -o event.dat %s" % (events,files)
print com
sta = os.system(com)
sys.exit(sta % 255)