有一个巨大的文本文件(内容是日志),每条记录按换行分隔(每行的长度不固定),并且第一列是时间(当然是递增的)。
有没有这样的查询引擎,能根据给定的时间范围,通过对文件二分搜索,快速定位到时间范围内的数据记录?而无需扫描整个文件内容。
有没有这样的查询引擎,能根据给定的时间范围,通过对文件二分搜索,快速定位到时间范围内的数据记录?而无需扫描整个文件内容。
1
cyspy Mar 24, 2019
timecat?
|
2
ebingtel Mar 24, 2019
awk 写一下 shell 应该可以的
|
3
des Mar 24, 2019
每行的长度不固定,你怎么二分?
除非预先建索引 |
4
des Mar 24, 2019
倒是偶尔手动二分过,用 split -l
|
5
geelaw Mar 24, 2019 via iPhone
|
7
idcspy Mar 24, 2019 本站有朋友开发了,归海数据引擎。
|
8
xlmo Mar 24, 2019
|
9
rekulas Mar 24, 2019
感觉比较简单 自己写个脚本就可以实现了
|
10
xenme Mar 25, 2019 via iPhone
|
11
mmdsun Mar 25, 2019 via Android
文档查询推荐 solr 二次开发
|
12
jorneyr Mar 25, 2019 手动的话第一步建立索引,第二步就是使用索引定位小范围搜索了。
或者导入 MySQL 对时间建立索引,也可以使用全文搜索引擎如 Solr,ElasticSearch 等。 |
14
defaultuser Mar 25, 2019
一般先建索引,ElasticSearch 或者 Splunk 都可以
|
15
bypythoncom Mar 25, 2019
大佬,你这是。。。这个不就写个脚本几行代码的事吗?莫非其中有什么蹊跷
|