我从2014年初入职新浪后就开始接触实时日志分析相关的技术,主要是ELK(Elasticsearch、Logstash、Kibana),当时是学习+ELK优化,接一些日志,小打小闹。从2015年起,我们正式得把实时日志分析作为服务提供给公司的其他部门。今天
日期:2016年04月06日:https://github.com/elasticsearch/elasticsearch-hadoop#readme add上面的jar包到hive hive –e “add jarelasticsearch-hadoop-2.1.1.jar;” (其实前面有写
日期:2016年05月06日)。 看下面的一个例子, 就能够很清楚的知道二者的区别了。例子来自https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-term-query.html myindex下的一个
日期:2016年04月21日前些日子在InfoQ看到篇文章 "抛砖引玉——重构是必要的浪费" http://www.infoq.com/cn/news/2007/12/refactoring-is-waste. 文中认为 “重构并不能为客户创造可衡量的价值。所以将重构归为必要的浪费。 个人觉得这样的解读很牵强,也有悖于精益的基本精神。 我觉得问题核心在于重构对于客户创造了什么价值。 近日从金融学的角度来进行分析,略有所悟。 重构其实提供了“需求变化”的“看多期权”(call)--事实上还提供了其他多种变化的看多期权。需求变化的可能性越大,这份期权就价值越高。而在金融市场上充满了明码标价
日期:2016年01月01日java api 可以通过两种方式来连接到elasticsearch(简称es)集群,第一种是通过在你的程序中创建一个嵌入es节点(Node),使之成为es集群的一部分,然后通过这个节点来与es集群通信。第二种方式是用TransportClient这个接口
日期:2016年06月21日在es中所有的查询结果都会保存在SearchResponse中,在从SearchResponse中读取数据的时候,有两种方式:第一种是对Query的结果进行读取,使用的是hit,每一条查询到的doc都是一个hit,可以将每个hit转换为map形式的数据, map的具体形式为<"field","value">的形式,可以得到每一个字段的名称与内容(具体代码如下); public static List<Product> getSC(SearchResponse sr) { List<Product> products = new ArrayList<Product>(); for (Se
日期:2017年03月20日前言 Elasticsearch可以支持全文检索,那么ES是以什么机制来支持的,这里索引就是一个重要的步骤,经过索引之后的文档才可以被分析存储、建立倒排索引。 本篇就是以ES的数据检索操作来讨论的。 更多内容情参考: 索引操作 ES索引可以根据指定
日期:2016年05月22日原文地址:https://www.elastic.co/blog/elasticsearch-as-a-time-series-data-store As the project manager of stagemonitor, an open source
日期:2016年01月07日安装 首先到github ik上下载版本为1.8.1的源码,可以直接下载zip文件,也可以通过git下载。 解压文件elasticsearch-analyze-ik-1.8.1.zip,在下载目录执行unzip
日期:2016年04月21日Elasticsearch 可以被当成一个 "NoSQL"-数据库来使用么? NoSQL 意味着在不同的环境下存在不同的东西, 而erestingly 它并不是真的跟 SQL 有啥关系. 我们开始只会觉得 "可能"而已, 所以细细研究
日期:2016年01月11日参考官方文档说明如下:https://www.elastic.co/guide/en/elasticsearch/guide/current/_queries_and_filters.html#_performance_differences 主要意思
日期:2016年01月22日一、判断索引是否存在 指定索引名,判断指定的索引是否存在集群中 /** * 判断指定的索引名是否存在 * @param indexName 索引名 * @return 存在:true; 不存在:false; */ public boolean isExistsIndex(String indexName){ IndicesExistsResponse response = getClient().admin().indices().exists( new IndicesExistsR
日期:2016年06月21日转自:http://www.cnblogs.com/flish/archive/2011/08/08/2131031.html 基于CRF(Conditional Random Field)分词算法 论文链接:http://nlp.stanford.edu/pubs/sighan2005.pdf 一、 为什么要进行中文分词? 词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。 Lucene中对中文的处理是基于自动切分的单字切分,或者二元切
日期:2016年07月02日参考链接:https://www.elastic.co/guide/en/elasticsearch/guide/current/_rolling_restarts.html 当需要对集群进行顺序安全重启(不暂停业务操作和离线)的时候,把节点依次重启,本文
日期:2016年06月21日Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。 Elasticsearch是一个建立在全文
日期:2016年03月11日摘要 :为了提升车牌识别系统中海量数据的车辆特征与涉案车辆及交通违法信息的实时分析、布控与跟踪的响应时间与性能。本文在对传统技术分析的基础上,针对现有系统中无法实现大数据分析与处理的问题,提出了利用Elasticsearch大数据实时检索技术构建交通大数据
日期:2016年06月21日up vote 3 down vote favorite 3 In my Project, I have a customised @interface GraphView: UIView. Hence GraphView is a subclass of UIView and is meant to show a graph. Then, I create a new View Controller called Summary using a NIB. In the Interface builder, I just add a UIToolbar at the bottom of the
日期:2016年03月18日elastcisearch 为java开发了API接口,方便java程序的使用。 首先引入jar包,需要跟elasticsearch版本对应。下面是maven的引入,也可以下载jar包引入。 <!-- http://mvnrepository.com
日期:2016年06月22日elasticsearch可以通过reroute api来手动进行索引分片的分配。 不过要想完全手动,必须先把cluster.routing.allocation.disable_allocation参数设置为true,禁止es进行自动索引分片分配
日期:2015年08月14日ElasticSearch详解与优化设计 目录 简介 概念 安装部署 ES安装 数据索引 索引优化 内存优化 1简介 ElasticSearch(简称ES)是一个分布式、Restful的搜索及分析服务器,设计用于分布式计算;能够达到实时搜索,稳定,可靠,快速
日期:2016年03月31日