Coin163

  • nutch - linux java_home安装路径

    现在配置nutch 执行 echo $JAVA_HOME 没有输出。 使用指令whereis java,输出的结果都尝试了,Java的安装路径一直找不到,jdk是安装时自带的,jdk的版本是jdk1.7.0_45,求解

    日期:1970年01月01日
  • 如何通过ant来下载nutch的jar

    如何通过ant命令来下载jar啊?please help.thanks.

    日期:1970年01月01日
  • SOLR4.2+NUTCH1.6

    1、SOLR4.2集成NUTCH1.6 wget  http://archive.apache.org/dist/lucene/solr/4.2.0/solr-4.2.0.tgz tar  -xzvf  solr-4.2.0.tgz  cd

    日期:2015年04月08日
  • Nutch1.8插件编译步骤

    Nutch的架构,采用了非常灵活的插件模式,大部分的核心功能,都可以通过组装插件的方式的来完成。如果想熟悉具体的nutch插件运行的机制,可以参考下nutch的官方wiki,今天散仙,主要来介绍下,怎么在nutch里,添加我们自己的插件。 1,下载

    日期:2014年05月21日
  • Nutch的发展历程

    Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人   下面是Nutch的发展历程:   2002年8月由Doug Cutting发起,托管于Sourceforge,之后发布了0.4、0.5

    日期:2013年09月29日
  • How to make nutch run in eclipse ?

    Nutch是一个优秀的开源的数据爬取框架,我们只需要简单的配置,就可以完成数据爬取,当然,Nutch里面也提供了很灵活的的插件机制,我们随时都可以对它进行二次开发,以满足我们的需求,本篇散仙,先来介绍下,如何在eclipse里面以local模式调试nutch

  • Nutch抓取需要登录的网站

    Tomcat自身带的后台管理程序是需要用户登录的,这样的网站如何用Nutch来爬呢?Nutch可以处理Http authentication(BASIC, DIGEST)这种稍显简单的认证,对于普遍流行的用户自定义Form表单以Post或Get方式提交数据

    日期:2014年03月16日
  • nutch1.6+solr3.6的在win7下入门部署

    1,在windows平台下,使用nutch,得需要cygwin工具作为其模拟linux的运行环境,cygwin在这里的安装就不多说了,可以到http://www.cygwin.com/下下载,直接点击setup.exe即可下载,然后就点下一步下一步安装就可以

    日期:2013年06月17日
  • nutch2.1+mysql报错及解决

    )at org.apache.gora.sql.store.SqlStore.flush(SqlStore.java:328) 解决方法: 在nutch2.1中配置<property>  <name>encodingdetector.charset.min.confidence</name>  <value>1</value

    日期:2013年03月31日
  • 运行nutch报错:unzipBestEffort returned null

    : unzipBestEffort returned null at org.apache.nutch.protocol.http.api.HttpBase.processGzipEncoded(HttpBase.java:317

    日期:2014年03月12日