Skip to content

Instantly share code, notes, and snippets.

View sin-tanaka's full-sized avatar

tanasinn sin-tanaka

View GitHub Profile

非破壊 TypeSctript

mizchi / TypeScript Meetup 2


About Me

  • mizchi / 竹馬光太郎
  • フロントエンドと Node.js
@voluntas
voluntas / open_ayame.rst
Last active February 19, 2024 16:25
OpenAyame プロジェクト
@sys9kdr
sys9kdr / Puppeteerがクローリングに使えるかも.md
Created December 16, 2017 18:03
Puppeteerがクローリングに使えそう

この記事はWebスクレイピング Advent Calendar 2017の17日目の記事です。puppeteerでクローリングします。

Google Chrome(Chromium)でクローリングをやる

SPAみたいなちょっと凝ったWebサイトをクローリングするときは一昔前はSelenium + PhantomJSあたりが鉄板でしたが、今後はSelenium + Headless ChromeもしくはPuppeteer + Headless Chromeが主流となっていく見通しです。 (HeadlessとはGUIアプリケーションのGUIを介さないモードのことです。)

前者についてはWeb上に情報も多いですが、Puppeteerでクローリングする話をそんなに見ない気がするのでクローリングの歴史を踏まえてやってみます。

一昔前のクローリング

@xl1
xl1 / pwa-checklist.md
Created June 19, 2017 17:39
プログレッシブウェブアプリチェックリスト
@sambatriste
sambatriste / oo-exercise.org
Last active November 9, 2023 13:54
「オブジェクト指向エクササイズ (ちょっとだけ)Groovy編」

オブジェクト指向エクササイズ

@martijnvermaat
martijnvermaat / server.py
Created February 5, 2016 17:43
SimpleHTTPServer with history API fallback
#!/usr/bin/env python
"""
Modification of `python -m SimpleHTTPServer` with a fallback to /index.html
on requests for non-existing files.
This is useful when serving a static single page application using the HTML5
history API.
"""
@kokumura
kokumura / xljj.py
Last active March 18, 2021 11:33
xlsxファイルの各セルにjinja2テンプレートを適用するやつ
#!/usr/bin/env python
# -*- coding:utf8 -*-
import optparse
import sys
from contextlib import closing
import yaml
import jinja2
from openpyxl import load_workbook
@voluntas
voluntas / webrtc.rst
Last active May 14, 2024 10:12
WebRTC コトハジメ
@yomotsu
yomotsu / gist:7e2ec401c1520d880308
Last active February 24, 2022 14:16
BEMが失敗しているパターンとその問題点

思いついたら足していく

名前にとらわれすぎ

BAD1

「コンポーネントのエレメントのエレメントのエレメントの...」として定義している

  <div class="v1-news">