全文搜索引擎 Elasticsearch 教程

全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。

它可以快速地储存、搜索和分析海量数据。维基百科、Stack Overflow、Github 都采用它。

Elastic 的底层是开源库 Lucene。但是,你没法直接用 Lucene,必须自己写代码去调用它的接口。Elastic 是 Lucene 的封装,提供了 REST API 的操作接口,开箱即用。

本文从零开始,讲解如何使用 Elastic 搭建自己的全文搜索引擎。每一步都有详细的说明,大家跟着做就能学会。 Continue reading “全文搜索引擎 Elasticsearch 教程”

使用docker安装kibana

使用dockerhub镜像运行:

其中指定的ES地址为docker虚拟IP地址,172.17.0.1为宿主docker虚拟IP地址,当然也可以指定对应ES容器的IP地址。

随后打开 http://127.0.0.1:5061/ ,可以看到kibana界面。 Continue reading “使用docker安装kibana”

使用docker安装ElasticSearch

方案一:使用dockerhub镜像

成功后访问:http://127.0.0.1:9200,该镜像默认不需要任何账号密码验证。

方案二:使用elastic镜像

具体请参考官方网站手册:https://www.elastic.co/guide/en/elasticsearch/reference/5.0/docker.html

开发环境可以通过以下命令执行ES:

成功后访问:http://127.0.0.1:9200,默认账号密码:elastic/changeme

Continue reading “使用docker安装ElasticSearch”

Kafka常用命令

启动命令

启动kafka很简单,配置好前置的操作后,先进入zookeeper的目录下,启动zookeeper

启动后结果如下所示,就代表命令执行成功了:

PS:因为kafka是需要注册在zookeeper上面,通过zookeeper进行管理和调度的,所以启动kafka之前,我们必须要启动zookeeper。

随后我们进入Kafka目录下,启动kafka,具体操作命令如下所示:

看到没有报错之后kafka就是已经成功被运行了,当然可以jps -lm查看一下,操作命令如下:

可以看到zookeeper和kafka都已经运行起来了,当然这个是单机的命令,集群的命令后面再讲。 
这样启动又一个坏处,就是kafka启动完毕之后,不能关闭终端,为此,我们可以运行这条命令:

运行结果:

多个kafka的话,在各个虚拟机上运行kafka启动命令多次即可。 Continue reading “Kafka常用命令”

git清理历史记录中的大文件

查看哪些历史提交过文件占用空间较大

使用以下命令可以查看占用空间最多的五个文件:

rev-list命令用来列出Git仓库中的提交,我们用它来列出所有提交中涉及的文件名及其ID。 该命令可以指定只显示某个引用(或分支)的上下游的提交。

--objects:列出该提交涉及的所有文件ID。

--all:所有分支的提交,相当于指定了位于/refs下的所有引用。

verify-pack命令用于显示已打包的内容。 Continue reading “git清理历史记录中的大文件”

k8s配置文件示例

Pod

Continue reading “k8s配置文件示例”