Skip to content

Instantly share code, notes, and snippets.

View peketamin's full-sized avatar
🐔
Hello world!

Yuki Yokoyama peketamin

🐔
Hello world!
View GitHub Profile
@peketamin
peketamin / fuelphp_fuel_lang_ja_upload.php
Last active April 17, 2016 12:00
fuelphp の Upload クラス用メッセージの日本語ファイル / 配置先: fuelphp/fuel/lang/ja/upload.php / 参考: http://btt.hatenablog.com/entry/2012/06/15/002453 (BTTさんのブログ)
<?php
/**
* Part of the Fuel framework.
*
* @package Fuel
* @version 1.5
* @author Yuki Yokoyama
* @license MIT License
* @copyright 2010 - 2013 Fuel Development Team
* @link http://fuelphp.com
@peketamin
peketamin / small_steps.rst
Created May 11, 2016 14:50
停滞した時にやること

毎日 1~3分を続けることがポイント。

  • 脳トレゲーム
  • 数学ドリル
  • 腕立て、腹筋
    • (5回ずつ)
  • 読書
    • 読むのが辛い場合、とりあえずパラパラ眺めて、戻って、それを3回繰り返す。
    • 3回めはじっくり読む
    • 3回めで頭に入らない場合も、とりあえず読み進める
@peketamin
peketamin / aiohttp_and_asyncio_download.py
Last active June 17, 2016 08:36
aiohttp, asyncio を使った並行ダウンロードコードサンプル
import asyncio
import aiohttp
urls = [
(1, "http://example.com/1"),
(2, "http://example.com/2"),
(3, "http://example.com/3"),
]
sem = asyncio.Semaphore(5)
@peketamin
peketamin / create_pil_object_from_internet.py
Created October 11, 2016 10:22
PIL.Image.open with requests.get
import requests
import PIL.Image
from io import BytesIO
url = "http://example.com/image.png"
r = reuests.get(url, timeout=10, headers={'User-Agent': 'MyUserAgent/1.0'})
image_file = BytesIO(r.content)
img = PIL.Image.open(image_file)
print("{}: {}x{}".format(img.format, img.width, img.height))
@peketamin
peketamin / download_parallels.py
Created July 12, 2016 08:38
非同期並行ダウンロードサンプル (修正余地あり)
import aiohttp
import asyncio
async def fetch(session, url, name):
with await sem:
with aiohttp.Timeout(10):
async with session.get(url) as response:
text = await response.text()
with open(name + '.html', 'w') as f:
@peketamin
peketamin / list_up_multiple_enclosure.md
Last active October 26, 2016 06:33
RSSのitemにenclosureが2つ以上含まれている記事だけリストアップする

urls.txt というファイルにフィードURLが列記されている前提で、

$ mkdir feeds
$ cd feeds
$ xargs -P 20 -n 1 wget < urls.txt

$ ipython

@peketamin
peketamin / extract_content.md
Created October 27, 2016 14:43
HTMLからの本文抽出草案
  • 複数ページのHTMLページを用意する。
  • HTMLをDOMツリーにする。
  • 直列化する。
  • 比較して、一番差分が大きい場所を出す。
  • 差分が大きい場所の親要素を出す。

課題

広告エリアや関連記事エリアも一緒に出てしまう。

@peketamin
peketamin / pairs_communities.md
Created December 11, 2016 13:54
pairs で入っていたコミュ
  • ダイビング
  • foster the people
  • 無地の服がすき
  • 朝本浩文
  • 世武 裕子
  • ぞうさん♡象さん
  • 安部公房
  • すずめが好き!
  • 洋画が好き
  • 結婚したい
@peketamin
peketamin / ps_top_memory_used_list.md
Created December 15, 2016 14:10
メモリ使用量の多いprocessを出すコマンド (ps と cut を組み合わせる. awk ではなく)

awk だとプロセスのコマンド名「以降」を範囲指定するのが難しかったので、cutを使ってみる。

  • ps alx | tr -s " " | cut -d " " -f 8,13- | sort -nr | head -20
  • ps -eo rss,comm,args | sort -nr | head -20