|
MapR自助SQL分析补充道 灰鸽子远程控制软件,灰鸽子使用教程
MapR技术更新与Apache的Hadoop分布钻1.0支持独立于SQL为大数据分析。
今天MapR技术更新其Hadoop分布来支持SQL分析自助服务。
公司介绍Apache钻去年9月的0.5,但现在取而代之的是Apache钻1.0版本。
钻是一个开源的分布式ANSI SQL查询引擎自助数据探索——上钻一个开源版本的谷歌的小孔系统交互查询大型数据集,它的权力BigQuery服务。
Apache钻机项目的目标是使它可以扩展到10000个服务器或更多在处理海量数据和数万亿记录的秒。
钻到数据
钻允许您与来自遗留事务系统和新数据源的数据,包括物联网传感器(物联网),Web click-streams和其他半结构化数据,支持流行的商业智能(BI)和数据可视化工具。也许最重要的是,这是一个独立于大数据的SQL引擎。因为它不需要预定义的模式定义,它没有将自己插入到中间的发现过程来平数据。
“这是被强调,这是一个鸡和蛋的问题,”杰克诺里斯说,MapR的名头。“我们想要探索这个数据,但是我们如何优先考虑我们想工作如果我们不知道我们所要找的。”
诺里斯说,利用钻提供了数据的灵活性。例如,JSON文件混乱的结构。它们包含自己的模式,这可能很复杂,几乎record-by-record可以改变。一个文档可能购买的名字。未来可能包括购买和数据的配偶和孩子嵌套。当你进入物联网数据,您可能已经JSON文件从成千上万的设备,每个数据集可能都有不同的格式。
[相关最好的开源大数据工具):灰鸽子下载。
“你必须摧毁它或做一些类型的子选择,”诺里斯表示。“这是典型的IT功能来决定如何表示这些数据。这是与其他的工具。”
钻,另一方面,是为了处理嵌套结构,不需要介入平出来,提前找出哪些数据是很重要的。
诺里斯还指出,拥抱Apache钻MapR的合作伙伴生态系统,包括:信息建筑商,JReport(Jinfonet软件),MicroStrategy,Qlik,SAP,辛巴,画面和TIBCO。他们都是与MapR和钻社区密切合作与钻可互操作的BI工具通过标准ODBC / JDBC连接。钻Explorer坐落在ODBC驱动程序,浏览数据可以通过钻和公开透明的视角模式,支持无缝的和快速的自助服务数据探索。
获得实时的洞察力
“Apache的可用性钻MapR SQL-on-Hadoop项目分布是一个重要的里程碑,这是重要的在提供实时的见解从复杂数据格式,而不需要任何数据准备,”马特•Aslett研究主任的数据平台和分析,451年研究,周二在一个新闻声明中说,远程控制软件。 |
|