Skip to content

Instantly share code, notes, and snippets.

View xight's full-sized avatar

Yoshiki Sato xight

  • Tokyo Gakugei University
  • 4-1-1 Nukuikita-machi, Koganei-shi, Tokyo 184-8501 Japan
View GitHub Profile
@m-radzikowski
m-radzikowski / script-template.sh
Last active April 25, 2024 18:43
Minimal safe Bash script template - see the article with full description: https://betterdev.blog/minimal-safe-bash-script-template/
#!/usr/bin/env bash
set -Eeuo pipefail
trap cleanup SIGINT SIGTERM ERR EXIT
script_dir=$(cd "$(dirname "${BASH_SOURCE[0]}")" &>/dev/null && pwd -P)
usage() {
cat <<EOF
Usage: $(basename "${BASH_SOURCE[0]}") [-h] [-v] [-f] -p param_value arg1 [arg2...]
@sys9kdr
sys9kdr / Puppeteerがクローリングに使えるかも.md
Created December 16, 2017 18:03
Puppeteerがクローリングに使えそう

この記事はWebスクレイピング Advent Calendar 2017の17日目の記事です。puppeteerでクローリングします。

Google Chrome(Chromium)でクローリングをやる

SPAみたいなちょっと凝ったWebサイトをクローリングするときは一昔前はSelenium + PhantomJSあたりが鉄板でしたが、今後はSelenium + Headless ChromeもしくはPuppeteer + Headless Chromeが主流となっていく見通しです。 (HeadlessとはGUIアプリケーションのGUIを介さないモードのことです。)

前者についてはWeb上に情報も多いですが、Puppeteerでクローリングする話をそんなに見ない気がするのでクローリングの歴史を踏まえてやってみます。

一昔前のクローリング

@zr-tex8r
zr-tex8r / generate-fontmap.pl
Last active August 21, 2019 08:22
kanji-config-updmap用のマップファイルを生成するスクリプト(手抜き)
#!/usr/bin/env perl
# generate-fontmap family mincho-l.Xtf mincho-m.Xtf mincho-b.Xtf \
# gothic-m.Xtf gothic-b.Xtf gothic-e.Xtf marugothic.Xtf
use strict;
($#ARGV == 7) or die "Wrong number of arguments";
my ($fam, $mcl, $mcr, $mcb, $gtr, $gtb, $gte, $mgr) = @ARGV;
foreach my $fi (qw(
otf-hiragino.map
otf-up-hiragino.map
ptex-hiragino-04.map
@nnasaki
nnasaki / azure-cli-resource-multiple-delete
Last active March 15, 2019 09:25
Azure CLIでリソースグループを一括削除。一応確認付。
#!/bin/sh
for i in $(az group list | jq -r '.[].name');
do
echo resource group $i include resouces below
az resource list -g $i | jq
echo will delete $i
az group delete --name $i --no-wait
done
@maeharin
maeharin / gist:4993397
Last active May 29, 2022 12:45
du 直下のディレクトリの総計のみ表示(サイズが大きい順)
du -sh ./* | sort -nr