Elasticsearch服务器开发(第2版)
介绍:
ElasticSearch是一个开源的分布式搜索引擎,具有高可靠性,支持非常多的企业级搜索用例。ElasticsearchHadoop作为一个完美的工具,用来连接Elasticsearch和Hadoop的生态系统。通过Kibana技术,ElasticsearchHadoop很容易从Hadoop生态系统中获得大数据分析的结果。
本书全面介绍ElasticsearchHadoop技术用于大数据分析以及数据可视化的方法。内容共分7章,包括Hadoop、Elasticsearch、Marvel和Kibana安装;通过编写MapReduce作业,把Hadoop数据导入Elasticsearch;全面分析Elasticsearch本质,如全文本搜索分析、查询、筛选器和聚合;使用Kibana创建各种可视化和交互式仪表板,并使用Storm和Elasticsearch分类现实世界的流数据以及相关的其他主题。
本书适合从事大数据分析人员、大数据应用开发的人员参考,也适合高等院校及培训机构相关专业的师生教学参考。
目录:
第1章 环境部署 1
1.1 安装部署Hadoop集群 1Java安装和配置 2用户添加和配置 2SSH认证配置 3Hadoop下载 4环境变量配置 4Hadoop配置 5配置core-site.xml 6配置hdfs-site.xml 6配置yarn-site.xml 6配置mapred-site.xml 7格式化HDFS 7启动Hadoop进程 81.2 安装Elasticsearch及相关插件 8下载Elasticsearch 9配置Elasticsearch 9安装Head插件 11安装Marvel插件 11启动Elasticsearch 121.3 运行WordCount示例 13下载编译示例程序 13将示例文件上传到HDFS 13运行第一个作业 141.4 使用Head 和 Marvel浏览数据 16使用Head浏览数据 16初识Marvel 18使用Sense浏览数据 19小结 21第2章 初识ES-Hadoop 222.1 理解WordCount程序 23理解Mapper 23理解Reducer 24理解Driver 25使用旧的API——org.apache.hadoop.mapred 282.2 实际案例——网络数据监控 28获取并理解数据 28明确问题 29解决方案 30解决方案1——预聚合结果 30解决方案2——直接查询聚合结果 322.3 开发MapReduce作业 33编写Mapper类 34编写Driver 37编译作业 38上传数据到HDFS 41运行作业 41查看TOP N结果 422.4 将数据从Elasticsearch写回HDFS 44了解Twitter数据集 44导入Elasticsearch 45创建MapReduce作业 46编写Tweets2HdfsMapper 46运行示例 50确认输出 50小结 52第3章 深入理解Elasticsearch 533.1 理解搜索 53观念转换 54索引 54类型 55文档 55字段 553.2 与Elasticsearch交互 56Elasticsearch的CRUD 56创建文档 56获取文档 57更新文档 58删除文档 58创建索引 58映射 59数据类型 60创建映射 61索引模板 623.3 控制索引过程 63什么是反转索引 63输入数据分析 64停止词 64大小写 65词根 65同义词 65分析器 653.4 Elastic查询 67编写查询语句 68URI查询 68match_all查询 68term查询 68boolean查询 70match查询 71range查询 72wildcard查询 73过滤器 733.5 聚合查询 75执行聚合查询 76terms聚合 76histogram聚合 78range聚合 78geo distance聚合 79嵌套聚合 81自测题 82小结 82第4章 利用Kibana进行大数据可视化 834.1 安装部署 83Kibana安装 84准备数据 84自测题 85启动Kibana 864.2 数据发现 874.3 数据可视化 90饼图 91堆积柱状图 94使用堆积柱状图完成日期直方图 96面积图 97饼图组图 98环形图 98瓦片地图 99自测题 1004.4 动态图表 101小结 104第5章 实时分析 1055.1 了解Twitter趋势分析器 105实现目标 106Apache Storm安装 1075.2 将流式数据接入Storm 107编写Storm spout 108编写Storm bolt 110创建Storm topology 112编译运行Storm作业 1135.3 趋势分析 114significant term聚合 114使用Kibana分析趋势 1165.4 使用Percolator对推文分类 117Percolator 118Percolator优化 120推文分类 121小结 124第6章 ES-Hadoop配置 1256.1 分布式环境中的Elasticsearch 125集群和节点 126节点类型 126节点发现 128数据分布 129分片 129副本 129分片分配 1306.2 ES-Hadoop架构 132动态并行 132写入Elasticsearch 133从Elasticsearch中读取 134失败捕获 134数据本地化 1356.3 生产环境配置 135硬件 135内存 135CPU 135磁盘 136网络 136集群安装 137集群拓扑结构 137设置名称 138设置路径 138设置内存 139脑裂问题 140设置恢复参数 141预设配置 142数据导入 142全文检索 144快速聚合 144生产环境部署检查列表 1456.4 集群管理 146监控集群健康 146备份和恢复 149数据备份 149数据恢复 150小结 151第7章 与Hadoop生态系统集成 1527.1 与Pig集成 152Pig安装 154向Elasticsearch中导入数据 155从JSON源写数据 157类型转换 157从Elasticsearch中读取数据 1587.2 与Hive集成 158安装Apache Hive 158向Elasticsearch中导入数据 159从JSON源写数据 161类型转换 161从Elasticsearch中读取数据 1627.3 与Cascading集成 163向Elasticsearch中导入数据 163编写一个Cascading作业 163运行作业 164从Elasticsearch中读取数据 165编写一个reader作业 165使用Lingual 1657.4 与Spark集成 167安装Spark 168向Elasticsearch中导入数据 168使用SparkSQL向Elasticsearch中导入数据 169从Elasticsearch中读取数据 170使用SparkSQL从Elasticsearch中读取数据 1707.5 与YARN集成 171小结 172附录 配置 174基本配置 174es.resource 174es.resource.read 174es.resource.write 175es.nodes 175es.port 175读写配置 175es.query 175es.input.json 176es.write.operation 177es.update.script 177es.update.script.lang 177es.update.script.params 177es.update.script.params.json 178es.batch.size.bytes 178es.batch.size.entries 178es.batch.write.refresh 178es.batch.write.retry.count 178es.batch.write.retry.wait 179es.ser.reader.value.class 179es.ser.writer.value.class 179es.update.retry.on.conflict 179映射配置 179es.mapping.id 179es.mapping.parent 180es.mapping.version 180es.mapping.version.type 180es.mapping.routing 180es.mapping.ttl 180es.mapping.timestamp 181es.mapping.date.rich 181es.mapping.include 181es.mapping.exclude 181索引配置 181es.index.auto.create 181es.index.read.missing.as.empty 182es.field.read.empty.as.null 182es.field.read.validate.presence 182网络配置 182es.nodes.discovery 182es.nodes.client.only 183es.http.timeout 183es.http.retries 183es.scroll.keepalive 183es.scroll.size 183es.action.heart.beat.lead 183认证配置 184es.net.http.auth.user 184es.net.http.auth.pass 184SSL配置 184es.net.ssl 184es.net.ssl.keystore.location 184es.net.ssl.keystore.pass 184es.net.ssl.keystore.type 184es.net.ssl.truststore.location 184es.net.ssl.truststore.pass 185es.net.ssl.cert.allow.self.signed 185es.net.ssl.protocol 185es.scroll.size 185代理配置 185es.net.proxy.http.host 185es.net.proxy.http.port 185es.net.proxy.http.user 185es.net.proxy.http.pass 186es.net.proxy.http.use.system.props 186es.net.proxy.socks.host 186es.net.proxy.socks.port 186es.net.proxy.socks.user 186es.net.proxy.socks.pass 186es.net.proxy.socks.use.system.props 186
下载地址:
关注微信公众号获取提取码:
输入:eshd 获取提取码。