Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save koduki/244f1c746d68aca0415ab70258d55b76 to your computer and use it in GitHub Desktop.
Save koduki/244f1c746d68aca0415ab70258d55b76 to your computer and use it in GitHub Desktop.
時は大メニーコア時代。我々はビックデータなんて持ってない。
いや、正確には持っている。が、業務の全てがビックデータではない。
普通のたかだか数百GBのデータのジョブを数千単位でマネージする必要がある。
それが現実だ。ビックデータを効率的に処理する基盤では無く、ちょっとデカイデータをスマートにに管理することが必要だ。
ビックデータ処理基盤はすばらしい。大量にのマシンを効率的に管理するためのエコシステムがある。
ではそれで充分か? 否である。我々は大量のサーバーなんて必要としていない。
今や1台で数十個のvCPUを持ったサーバは普通だ。大量のサーバではないので、それなりの信頼性は期待できる。
つまりビックデータ基盤の冗長性や耐久性は過剰である。サーバが停止するようなレアなイベントに対しては、新しく立ち上げ直して処理自体をやりなおせばそれでいい。
透過的な自動復旧のためのしくみは過剰なオーバーヘッドとなり日々の効率を下げることになる。
我々が欲するものは何か? ビックではない中規模のデータを安定したネットワークで動作する数台から十数台マシンで効率的に動かせる仕組だ。
リソースが許すなら分散では無くローカルで完結する仕組だ。ローカルを越えるなら自動で分散する仕組みだ。
予想される負荷に合わせてマシンをElasticに足したり減らしたりできる仕組みだ。
モニタリングができる仕組みだ。ロギングができる仕組みだ。
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment