추천시스템을 제공하기위해서 대규모 데이터를 핸들링하기 위한 RDBMS가 필요했습니다. (이 글을 보시는 분들께,,, 가급적 Parquet 또는 다른 하둡 에코를 이용하시는게 정신건강에 이롭습니다.)
찾아본 솔루션은 다음과 같습니다.
- Cockroach DB : Raft 합의알고리즘채택으로 가장 많이 기대하고 사용해 봤으나, 1천만 건 테이블 Join 시 killed. 적은 건수는 잘 됨. (go로 개발되었는데, 메모리 할당할 때 문제가 생기는 듯...)
- Pivotal Greenplum : Postgres 버전이 낮음. v8.3 (버전관리 안하고있는듯...)
- Citusdata : 꼭 상용 솔루션을 써야만 될것 같은 느낌적인 느낌! Postgresql V10 지원. (개인적으로는 가장 나이스해 보입니다.)