【云端运算】Mixpanel告别Rackspace,改用Am

2020-06-12 浏览量: 598

【云端运算】Mixpanel告别Rackspace,改用Am

Mixpanel 是 Y Combinator 的培育团队之一,可以参考前文的介绍:Mixpanel:即时性的 Web 与 Mobile 流量分析服务 。

最近有非常多的文章在谈论这个新的流量分析服务。Mixpanel 的特点在于它强调「即时」的流量分析,其实过去也有些网站流量分析服务强调即时性,像是 Yahoo! 站长工具或是 Reinvigorator,不过这种「传统的流量分析服务」要做到真正的即时性是非常困难的。

Mixpanel 提供即时的流量统计服务,是针对「使用者的浏览行为」进行统计,你可以追蹤包括影片是否有被播放、某个连结究竟有没有被点击或是商品有没有被放入购物车中,目前号称一个月可以收集到 10 亿次的使用者浏览行为,在过去可能只有像 Google 这种规模的公司有能力从容地应付庞大的流量,然而在这个软硬体技术疯狂进步的年代,打造这种中大型服务、大玩具门槛似乎降低了不少。对于 Mixpanel 这种可能快速成长的服务来说,平台本身的延展性是非常重要的,如果硬体、机房的配置无法配合持续成长的业务需求进行扩充,便会阻碍公司的成长。

任何採用所谓云端技术、云端服务的厂商,包括 Mixpanel 在内,其实都会希望在硬体需求扩增时,透过所谓"One-step function",简单的一个操作就扩充硬体效能,而不需要过多其他的组态、设定影响到服务持续提供营运的时间。

Mixpanel 从最早使用 Slicehost接着搬到 Linode,随后又因为成为 Y Combinator 育成团队之一,便与 Y Combinator 的签约厂商 Rackspace 展开了合作关係。

我们可以发现,2009 年 8 月底 Mixpanel 曾在其官方部落格上宣告 Mixpanel 与 Rackspace 的伙伴关係,不过显然 Mixpanel 对于 Rackspace 这个伙伴是不太满意的,因此最近 Mixpanel 就在他们的开发部落格上直接向 Rackspace 说 Goodbye,并且投奔 Amazon,文章里面分析了几个主要重点,我想会是评估要採用哪一家厂商所提供的云端运算平台的好案例。

储存空间

像 Mixpanel 规模的系统运作时对于资料存取的要求是非常高的,因此在建设具有延展性的架构时,资料存取的表现显然是个必须认真考虑的主要因素。早期 Mixpanel 使用 Cassandra 作为主要的资料库系统,但 Rackspace 提供的服务在方面的表现是非常非常糟糕的,将资料写回资料库的磁碟与实际存放资料的磁碟是分开的,Rackspace 却无法让这件事变得简单点。相较之下,Amazon 所提供的 EBS 显然就是天赐之物 。

根据 Mixpanel 的经验,在 Rackspace 如果你想要增加磁碟空间的时候该怎幺办呢?通常你必须重新设定组态,然后重新开机或是重新挂载磁碟,如果你想要超过 620GB 的容量怎幺办呢?大概是做不到的。

而在 Amazon 所提供的 EBS,基本上你可以随时任意的新增磁区到云端平台上的任何节点上,这是很棒的一个特色,因为在转移资料的过程中,你只要重新挂载 EBS 即可,不需要进行远端複製。

不过,Mixpanel 也提到,他们也不认为 EBS 的 IO 效能可以好到哪里去,事实上只要谈到 Disk I/O 的效能,就是个很大的挑战,但至少 EBS 让 Mixpanel 不用去处理资料库存取在不同的磁碟上这件事情。

硬体等级

Amazon 提供了各种不同等级的虚拟硬体,依照不同的需求你可以选购超大记忆体或是超强的运算效能,各种容量、规格任君选择。相较之下,Rackspace 提供的服务虽然价格上的门槛比较低,但如果你的服务会快速的成长,那幺 Rackspace 显然就不那幺适合。Rackspace 提供的选择其实也比较接近 VPS,可以调配的规格似乎着重在储存空间与记忆体的容量,不像 Amazon,记忆体是夸张的大、运算单元也是有很多种选择。

上线时间

根据 Mixpanel 的说法,Rackspace 的上线时间是很糟糕的,过去这一年来使用 Rackspace 的经验中,曾经出过两次大包。而且问题看起来是有点严重,例如某个节点每个礼拜都会出问题,Mixpanel 甚至还要自己建置容错的机制来避免特定节点出错后造成整个服务中断,这幺累,用这个假云端干嘛?儘管知道 Amazon 也是会出问题的,不过 Mixpanel 认为,对于 Amazon 他们是比较放心的,因为 Amazon 自己也非常依赖 AWS。

容量限制

容量的限制大概是 Mixpanel 遇到最麻烦的问题,在 Rackspace 想要增加记忆体总是经常遇到问题,你必须开一张 ticket 等待客服人员来替你处理。在 Amazon 的话,其实这一切都是可以自己处理的,而且通常应该是不会遇到什幺问题。

全球化

Amazon 提供名为 Cloudfront 的 CDN服务,透过 CDN 你可以很轻鬆地将内容放送到全世界,网友在使用你的网站时,会根据网友的所在位置选择邻近的机房下载需要的内容,加快网友载入网站的速度。对 Mixpanel 来说,Rackspace 目前没有提供 CDN 的服务,这是很困扰的。

备份

根据 Mixpanel 的说法,Rackspace 提供的自动备份服务只有 2G,这个数据实在是有点扯。相较之下,如果是 Amazon 的 S3 用来作备份显然是强大许多。Mixpanel 认为在 Amazon 要进行备份动作是既清楚又直观。

价格

Mixpanel 针对 Rackspace 与 Amazon 提供的云端服务进行了一系列的试算、比价,由于还不确定到底实际在 Amazon 上部署服务后到底会需要增加多少机器,所以试算过程中也高估即将在 Amazon 上使用的各种资源数量。试算的结果,Amazon 大概可以帮 Mixpanel 省下 5%-10% 左右的成本,差距并不大,目前能看到每个月的成本姑且就算是差不多吧!

不过 Amazon 有另一个好处:Amazon 提供了 Reserved instances 以及 Bided instantces 两种模式,对于有心要长久经营服务的厂商,长期来说势必会省下一笔可观的费用。而且,Amazon 经常有事没事就降价回馈消费者,这也是很吸引人的。

对 Mixpanel 来说,最重要的理由究竟是什幺?

Amazon 在所有云端产品的更新维护都有优于其他厂商的表现,显然是目前最好的云端服务提供商。Mixpanel 的使用者肯定是会持续使用 Mixpanel 提供的服务,既然如此,就应该选择最好、最稳定、口碑最棒的服务,Rackspace 实在是很慢。就一个发展云端架构的人来说,在进行架构设计规划、建置、维护的过程中,当然是希望能使用又快又好,用起来又开心又快乐的产品呀!

结语

我认为 Amazon 的云端服务,最初就是将公司本身闲置的 IT 资源拿出来进行租赁服务,除了提高资产的利用率之外也另外创造一块营收,没想到最终是创造了另一块非常可观的商机,同时也改变了产业中的一些生态,也顺便让媒体可以在高喊云端运算的时候又多一个案例。Rackspace,虽然我没用过,但光是看 Amazon 所提供的云端运算产品线是如此的广,在预留发展空间的前提下,我也会优先选择 Amazon 的服务。不晓得你有使用过其他云端运算服务吗?欢迎跟我们分享你的心得。

References

上一篇: 下一篇:

相关推荐