Coin163

  • Hbase使用问题记录

    ("hbase.zookeeper.quorum", "127.0.0.1"));     config.set("hbase.zookeeper.property.clientPort", "2181")); HTable table1 = new HTable(conf

    日期:2016年02月03日
  • 创建hive整合hbase的表总结

    [Author]: kwu  创建hive整合hbase的表总结,如下两种方式: 1、创建hive表的同步创建hbase的表 [sql]  view plain copy CREATE  TABLE

    日期:2015年10月13日
  • 转:基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

    基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎   网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源

    日期:2015年07月16日
  • 如何监控你的Hadoop+Hbase集群?

    Ganglia的jmx接口,里面包含了各个核心组件metrics获取功能,这一点你可以查看hadoop和hbase包括spark的conf下面的metrics文件里面配置,就能得到验证。  (一)Ganglia是什么?   Ganglia 是 UC Berkeley 发起

    日期:2016年03月21日
  • HBase总结(十二)Java API 与HBase交互实例

    转自:http://blog.csdn.net/lifuxiangcaohui/article/details/39997391 HBase提供了Java Api的访问接口,掌握这个就跟Java应用使用RDBMS时需要JDBC一样重要 import

    日期:2016年04月25日
  • HBase compact

    转http://www.mamicode.com/info-detail-951200.html HBase是基于LSM树存储模型的分布式NoSQL数据库。LSM树对比普遍的B+树来说,能够获得较高随机写性能的同时,也能保持可靠的随机读性能(可参考

    日期:2016年05月18日
  • Linux下hbase的配置

    今天给大家分享一下Linux下hbase数据库的配置,首先一个前提条件就是你的Linux下的hadoop配置成功并且可以跑起来。那么我们下面以centos系统为例开始配置hbase 1,  打开虚拟机,进入centosLinux系统,利用远程连接工具连接

    日期:2016年06月01日
  • hadoop生态系统学习之路(八)hbase与hive的数据同步以及hive与impala的数据同步

    在之前的博文中提到,hive的表数据是可以同步到impala中去的。一般impala是提供实时查询操作的,像比较耗时的入库操作我们可以使用hive,然后再将数据同步到impala中。另外,我们也可以在hive中创建一张表同时映射hbase中的表,实现数据同步

    日期:2017年03月16日
  • Hadoop 2.6.0 hbase 0.98 Java API 调用实例

    环境搭完了,不知道怎样引jar包,怎样调用的看这里! ps. 不涉及HBase原理详解,那个之后单独弄一篇 Let’s go! Java IDE选用的是 eclipse, 用Intellij IDE的也差不多, 当然用sublime、vim、Emacs

    日期:2016年04月03日
  • php通过thrift 0.9.0操作HBase

    最近项目中需要使用thrift和php来读写HBase中的相关数据,所以就整理了下相关的类,做了下测试. 现在自己用到的操作HBase的方式主要有以下几种: 1.HBase Shell, 主要是配置后执行 shell 通过命令查看 HBase 中的数据

    日期:2015年12月10日
  • hbase shell基础和常用命令详解

    From: http://www.jb51.net/article/31172.htm 基础知识记录,方便查阅  1. 简介  HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable:一个结构化数据的分布式存储系统

    日期:2015年07月14日
  • 利用Arena Allocation避免HBase触发Full GC

    Arena Allocation,是一种GC优化技术,它可以有效地减少因内存碎片导致的Full GC,从而提高系统的整体性能。本文介绍Arena Allocation的原理及其在Hbase中的应用-MSLAB。 背景 假设有1G内存,我顺序创建了1百万个对象

    日期:2011年11月30日
  • HBase Coprocessor 剖析与编程实践

    1.起因(Why HBase  Coprocessor) HBase作为列族数据库最经常被人诟病的特性包括:无法轻易建立“二级索引”,难以执行求和、计数、排序等操作。比如,在旧版本的(<0.92)Hbase中,统计数据表的总行数,需要使用Counter方法

    日期:2016年04月23日
  • 利用Solr建立HBase的二级索引

    利用Solr建立HBase的二级索引: 1、编写的协处理器代码为 package com; import java.io.IOException; import java.util.HashMap; import java.util.List; import

    日期:2016年06月17日
  • Org.apache.solr.client.solrj.impl.CloudSolrServer$RouteException:DEF_CONTENT_CHARST 错误解决

     用Solr建立HBase的二级索引,Solr包与HBase包不一致出现错误:  org.apache.solr.client.solrj.impl.CloudSolrServer$RouteException:DEF_CONTENT_CHARST  原因

    日期:2016年06月17日
  • Hbase--1 简介

    Hbase简介 1.1 简介 1)Hbase是一个分布式的、多版本的、面向列的开源数据库 2)Hbase利用Hadoop HDFS 作为其文件存储系统,提供高可靠性、搞性能、列存储、可升缩、实时读写、适用于非结构化数据存储的数据库系统 3)Hbase利用

    日期:2016年07月18日
  • 【HBase运维系列】集群间的数据拷贝-copytable - 博客频道 - CSDN.NET

    。CopyTable是可以复制的部分或全部的表中,既可以在同一个群集或另一个集群的实用程序。 用法如下: $ bin/hbase org.apache.hadoop.hbase.mapreduce.CopyTable [--starttime=X] [--endtime=Y

    日期:2017年03月18日
  • HBase简单介绍

    前言 本周学习了部分关于Hadoop生态圈周边的一些系统,简单的做个小结,本篇文章主要讲的是HBase的介绍。HBase是一个在HDFS上构建的面向列的分布式数据库,他与传统的RDBMS还是有许多的不同之处的。HBase的出现可以解决海量数据存储的问题

    日期:2015年05月10日
  • Hadoop第13周练习—HBase作业

    转载:http://www.cnblogs.com/shishanyuan/p/4227528.html 1    书面作业1:举例子说明HBASE相对简单 1.1     书面作业题目1 1.2     回答 2    书面作业2:设计HBASE存储站内

    日期:2015年08月31日
  • 如何使用HBase构建NewSQL?

    摘要:本文是刘奇在SDCC 2015数据库实践论坛上分享的《HBase分布式事务与SQL实现》主题内容。文中分享了Goolge Percolator内部实现、雅虎的OMID实现、TiDB的内部架构、技术选型以及如何使用HBase构建NewSQL。 本文是刘奇

    日期:2015年12月13日