|
课程目录4 e3 w, e" m8 A2 ~8 {
01-概述、运行方式、连接Hadoop、分析Nutch脚本.mp4
5 a% J) `& h/ O) r; C$ j2 Q, f02-nutch-default.xml配置项、常用命令.mp46 ]% ?6 o% _! c2 {& z
03-详解Nutch的存储文件夹data、crawldb&segments&linkdb命令.mp4. X+ }( o, I4 V9 H; ]7 F) U
04-深入分析Nutch的抓取周期、3大merge和3大read命令阐释、反转链接、解析页面.mp44 x$ y1 r3 i% D) {, K0 t+ I9 C
05-域统计、webgraph.mp48 {* w7 S- q# D- Y5 G
06-注入分值、轻量级抓取.mp4
' U3 ]8 ?" k1 Y N P z u2 D+ w07-indexchecker、安装配置Solr、运行Solr并提交索引、使用Luke工具查看索引、给Solr配置分词器mmseg4j.mp4& l0 G5 y- Z% T' \& B; g& S
08-指定Luke工具的分词器、运行Solr并提交索引.mp4
: `6 n. I2 L8 M2 {! c09-安装Windows上的Nutch运行环境Cygwin、运行Nutch.mp4
" A; O& o4 ~4 ~) z/ E: q10-Hadoop单机本地模式、Hadoop单机伪分布式模式、执行Nutch的crawl命令.mp4
% u2 i0 D3 }: f4 k& K) W: h' M11-配置Cygwin支持无密码SSH登录、Windows上的Hadoop单机伪分布式、执行wordcount命令.mp4
7 C6 X4 v, q3 X# c0 N12-Hadoop多机完全分布式模式.mp4
4 l7 v6 @& t2 d% c: A. @13-改变机器负载、SecondaryNameNode、启用回收站.mp4$ C6 Y1 i) R, f, l5 X& ?3 u/ L8 w' W
14-动态增加DataNode节点和TaskTracker节点.mp4# C7 B3 Z# O' [/ Y0 ^9 o
15-限制Hadoop节点连接、动态删除DataNode节点和TaskTracker节点.mp4! t* g {% k% u$ o7 w$ A
16-运行基准测试.mp4
+ V9 m, c* ?. p& v Y17-配置服务端、配置客户端、访问页面、集成Hadoop.mp4
' u/ X* [6 h+ h5 f G( @18-压缩数据、以不同压缩方法注入URL、Hadoop配置Snappy压缩.mp4
" _( V. ^* Z" k1 T1 |& l- Y. a* u19-Ganglia以组播或单播方式监控同一个网段中的多个集群、Ganglia监控不同网段中的多个集群.mp4
9 z7 G2 n" o. I- Y1 t9 H. p% O: R20-Ganglia以单播方式监控跨多个网段的单一集群、配置Hadoop集群使用单播地址、扩展集群让其节点分别位于3个不同网段、配置host138.mp4
# z5 u$ l$ X4 P2 y& w" @# ?# `. Q
资源下载地址和密码(百度云盘): [/hide] 百度网盘信息回帖可见! r% O9 }$ x" U3 b; i% N ~
/ D! q q6 [4 k' e i" u
[0 g, A% F# g& F/ d( P! H
! i; Y& [7 m% S# q0 c" W
本资源由Java自学网收集整理【www.javazx.com】 |
|