|
Apache卡夫卡是润滑的轮子大数据如何 灰鸽子使用教程,灰鸽子下载
IBM只是用它来推出两个新Bluemix服务,灰鸽子。
分析通常被描述为与大数据相关的最大挑战之一,但即使是在这一步之前,数据必须摄取和向企业用户提供。这就是Apache卡夫卡。
最初开发的LinkedIn,卡夫卡是一个开源系统管理实时数据流,从网站、应用程序和传感器。
从本质上讲,它作为一种企业“中枢神经系统”,收集大量数据对用户活动、日志、应用指标,股票行情和设备仪器,例如,使它可以实时对企业用户的消费。
卡夫卡等常被比作技术ActiveMQ或RabbitMQ本地实现,或与Amazon Web服务的运动对于云客户,Stephen O’grady说,此次的联合创始人和首席分析师。
“这是越来越明显,因为它是一个高质量的开源项目,还因为它能够处理高速流的信息越来越在物联网等维修工作负载的使用需求,其中,”O ' grady补充道。
在LinkedIn构想以来,卡夫卡获得引人注目的Netflix等公司的支持,超级,思科和高盛。
周五,它有一个新鲜的刺激来自IBM,宣布两个新的Kafka-based的可用性服务通过其Bluemix平台。
IBM的新流分析服务旨在分析为毫秒级的响应时间和每秒数百万事件即时决策。IBM信息中心,现在在测试,提供可伸缩的、分布式的、高通量、云应用程序异步消息传递,选择使用休息或Apache卡夫卡API(应用程序编程接口)与其他应用程序进行通信。
卡夫卡是2011年开源。去年,三个卡夫卡的创造者汇合的推出,公司致力于帮助企业在大规模生产中使用它。
“我们在LinkedIn的爆炸性增长阶段期间,我们不能跟上不断增长的用户群和数据。
可以用来帮助我们改善用户体验,“Neha Narkhede说卡夫卡的创造者和支流的创始人之一。
“卡夫卡允许您做的是移动数据整个公司,让它可以在几秒内连续自由流的人需要使用它,”Narkhede解释道。”和它在规模。”
在LinkedIn的影响是“转型”,她说。今天,LinkedIn仍然是最大的卡夫卡部署生产;每天超过1.1万亿条消息。
融合性的,与此同时,大公司提供了先进的管理软件通过订阅来帮助卡夫卡对生产系统运行。
在其客户主要大型零售商和“最大的信用卡发行商之一在美国,“Narkhede说。
后者是使用技术实时欺诈保护,她说。卡夫卡是“一个令人难以置信的快消息总线”,擅长帮助集成快速大量的不同类型的数据,分析师Jason压模,说451年的研究。“这就是为什么成为一个最受欢迎的选择。”
除了ActiveMQ和RabbitMQ之外,另一个提供类似功能的产品是Apache水槽,他指出,风暴和火花流在许多方面是相似的。
在商业空间,支流的竞争对手包括IBM InfoSphere Streams,Informatica超消息流版和SAS的事件流处理引擎(ESP)连同Software AG Apama,Tibco StreamBase和SAP Aleri,印章补充道。较小的竞争对手包括DataTorrent,Splunk、Loggly Logentries,连接软件,相扑逻辑和Glassbeam。
在云中,AWS的运动流处理服务”的好处与喜欢的红移的集成数据仓库和S3存储平台,”他说。
Teradata新宣布的侦听器是另一个竞争者,它Kafka-based,指出布莱恩·霍普金斯,弗雷斯特研究公司的副总裁和首席分析师。
一般来说,有一个显著的趋势实时数据,霍普金斯说,灰鸽子远程控制软件,远程控制软件。
直到2013年左右,“大数据是大量的数据塞进Hadoop,”他说。“现在,如果你不这样做,你已经在功率曲线后面。”
今天,来自智能手机和其他数据源的数据给企业与客户进行实时交流的机会,并提供上下文的经历,他说。反过来,取决于更快地理解数据的能力。
“物联网就像移动的第二波,“霍普金斯解释道。每个供应商都是雪崩的定位数据。”因此,相应的技术改造。
“2014全是Hadoop,然后是火花,”他说。“现在,这是Hadoop,火花和卡夫卡。这三个平等的同伴摄入管道在这个现代的分析架构。” |
|