如何快速构build大型分析服务器?

我需要快速构build大规模(七位数以上)的分析服务器,而且价格便宜。

Piwik将会是一个很容易的select,但是到目前为止,Piwik相当难以扩展,可能需要相当大的服务器来处理负载。

我的第二个想法是创build一个快速而肮脏的Node.js服务器,它将所有内容都推送到Amazon DynamoDB,以便人们可以从第一天开始收集数据,然后再构buildUI。 这将很快创build和缩放(垂直和水平)。 但是,我想知道DynamoDB是否是这种使用的正确select? (收集数据,生成报告)

       

网上收集的解决方案 "如何快速构build大型分析服务器?"

我正在使用DynamoDB professionaly,不会将它用于您的应用程序。

DynamoDB真的有很多限制。 其中,只能有一个hash_key ,另外还可以有一个range_key

您可以使用query对给定的hash_key下的项目进行一些“分析”,但实际上没有什么奇特的。 对于复杂的查询,您将不得不使用scan或EMR,这些操作速度缓慢且昂贵,并且由于节stream而存在一些缺点。

尽pipe如此,NoSQL似乎是一个不错的select,至less在你的应用程序的原型阶段。 但是,我会推荐MongoDB。 你可以索引任何列,做复杂的查询,不用担心数据限制。 分片和复制不是很难设置。

MongoDB拥有强大的生态系统和社区,DynamoDB还没有(因为它年轻得多)。 MongoDB也提供了托pipe服务,使您可以像使用DynamoDB一样快速引导您的应用程序。

Piwik每月可扩展到数百万页和数十个被跟踪的网站。 查看他们的文档: http : //piwik.org/docs/optimize/和: http : //piwik.org/blog/2012/07/piwik-high-scale-performance-report-as-of-july-2012/