Yelp 是个 不错的公司
公司github地址:
https://github.com/Yelp

data-pipeline介绍
http://www.infoq.com/cn/news/2016/12/Yelp-data-pipeline-open-source?utm_source=infoq&utm_medium=popular_widget&utm_campaign=popular_content_list&utm_content=homepage

第一篇:一天几十亿条消息:Yelp的实时数据管道。(英文)(http://www.infoq.com/cn/articles/yelp-real-time-data-pipeline-part01)
第二篇:Yelp的实时流技术之二:将MySQL表数据变更实时流到Kafka中。(英文)(http://www.infoq.com/cn/articles/yelp-real-time-data-pipeline-part02)
第三篇:Yelp的实时流技术之三:不止是模式存储服务的Schematizer。(英文)(http://www.infoq.com/cn/articles/yelp-real-time-stream-technology-part03)
第四篇:Yelp的实时流技术之四:流处理器PaaStorm。(英文)(http://www.infoq.com/cn/articles/yelp-real-time-data-pipeline-part04)
第五篇:Yelp的实时流技术之五:数据管道之Salesforce Connector。(英文)(http://www.infoq.com/cn/articles/yelp-real-time-data-pipeline-part05)
第六篇:Yelp的实时流技术之六:近实时地将Kafka中的数据流入Redshift。(英文)(http://www.infoq.com/cn/articles/yelp-real-time-data-pipeline-part06)

这个貌似可以解决 部署问题:
https://github.com/Yelp/virtualenv-tools
https://github.com/Yelp/requirements-tools

项目部署:
https://www.zhihu.com/question/38081354
http://www.cnblogs.com/shuliang/p/3536264.html