Java 的 elasticsearch Rollover API 简介

发表于2019-08-15，长度1922， 109个单词， 5分钟读完

有时候我们需要用ES保存海量的流水数据，比如日志、比如轨迹等等。这种数据时效性低，几个月前（甚至一个月前）的数据价值可能就没有了，可做删除或归档处理。ES 提供了rollover机制自动分隔索引（类似于业务log可根据日期和大小分隔），并提供了shrink机制归档过期索引。本篇简单介绍一下rollover api的使用。

别名

es给索引提供了别名。索引别名有两种，一种是读索引，可以包含多个索引；一种是写索引，只能指向一个索引。

除了索引别名，还有字段别名。这里不讨论

为了方便的使用rollover api，我们需要结合别名。

模板

模板和其他软件的功能一样，都是简化创建过程的。模板需要指定一个模式，索引在创建的时候会先去查询模板，看自己的名字符合哪些模板就套用。索引在rollover的时候一般索引前缀都一样，何况结构完全一样，所以我们可以使用模板。更重要的是，我们可以指定符合模板的索引可以被包含到哪个别名中（这里只能是读索引）。

比如我们的一系列索引都以my-index开头，后面跟流水号。那模板的模式就可以指定为my-index-*：

PutIndexTemplateRequest pitr = new PutIndexTemplateRequest()
                .name(yourTemplateName) // 指定模板的名字，就和索引名一样
                .patterns(Collections.singletonList("my-index-*")) // 模式
                .alias(new Alias(YourReadAlias)); // 匹配模板的索引具有的别名
transportClient.admin().indices().putTemplate(pitr);

创建好模板以后就可以创建索引了，第一个索引一般叫my-index-1，而且要指定写别名：

CreateIndexRequest cir = new CreateIndexRequest()
        .index("my-index-1")
        .alias(new Alias(yourWriteAlias));
transportClient.admin().indices().create(cir);

滚动

es的rollover不是自动的，必须调用相应的api触发滚动；当然不符合滚动条件不会真正滚动的。

RolloverRequest rr = new RolloverRequest(yourWriteAlias, null);
rr.addMaxIndexAgeCondition(new TimeValue(10, TimeUnit.DAYS));
rr.addMaxIndexDocsCondition(1_0000_0000);
ActionFuture<RolloverResponse> index = transportClient.admin().indices().rolloversIndex(rr);

滚动请求必须传入一个写别名，和第一个索引创建的时候是同一个。第二个参数是新的索引名称，不传入的话会自动使用000002、000003这样的后缀。

滚动可以触发的条件有三种，都是org.elasticsearch.action.admin.indices.rollover.Condition的子类。