Skip to content

Instantly share code, notes, and snippets.

@hfhimage
Created April 17, 2013 07:18
Show Gist options
  • Save hfhimage/5402378 to your computer and use it in GitHub Desktop.
Save hfhimage/5402378 to your computer and use it in GitHub Desktop.
twitter storm 学习资源汇总
storm-contrib
https://github.com/nathanmarz/storm-contrib
java doc
http://nathanmarz.github.com/storm/doc-0.8.1/index.html
implemention doc
https://github.com/nathanmarz/storm/wiki/Implementation-docs
trident
https://github.com/nathanmarz/storm/wiki/Trident-tutorial
使用者:支付宝、淘宝、阿里巴巴、twitter、groupon
特点:快(1million的元组(turple)处理每秒、每个节点)、可扩展、容错、可靠的(保证数据会被处理)、容易搭建和操作
和你已用的队列以及数据库技术相结合
storm的重要性
Extremely broad set of use cases
可扩展
使用zookeeper来协调同步集群
保证无数据丢失
健壮
相比hadoop集群更容易管理
容错性
发生错误会重新跑任务,一次计算可以永远跑下去直到被kill
语言无关
文档资料
官网: http://storm-project.net/
wiki文档: https://github.com/nathanmarz/storm/wiki
源码: https://github.com/nathanmarz/storm
google group: https://groups.google.com/group/storm-user
blog资源
徐明明(核心贡献者) http://xumingming.sinaapp.com/category/storm/
coder zhang http://www.coderzhang.com/blog/category/big-data/storm/
淘宝 九翎 http://www.cnblogs.com/panfeng412/category/367117.html
包括storm使用到的技术总结、常见问题及解决方法,各种常见的模式
优缺点
优势:
社区活跃,支持较好,有发展潜力
传输模型丰富
JAVA开发,快速响应业务
劣势:
拓扑修改后需重启拓扑,不够方便
非JAVA处理任务支持较为麻烦,效率不高
任务部署不够灵活,拓扑间不能通信
文章
infoq 关于storm的介绍,很好的总结
http://www.infoq.com/cn/news/2011/09/twitter-storm-real-time-hadoop
taobao搜索技术blog关于storm的介绍,很好
http://www.searchtb.com/2012/09/introduction-to-storm.html
Twitter Storm 实时数据处理框架分析总结
http://www.cnblogs.com/aga-j/archive/2012/02/03/2337440.html
Understanding the parallelism of a Storm topology
http://www.michael-noll.com/blog/2012/10/16/understanding-the-parallelism-of-a-storm-topology/
taobao的一些文章
http://www.blogjava.net/killme2008/category/33789.html
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment