項目一 大數據采集認知\t001
任務1.1 開始大數據采集認知\t002
1.1.1 任務描述\t002
1.1.2 知識準備\t002
1.1.3 任務效果\t007
任務1.2 了解大數據采集平臺\t007
1.2.1 任務描述\t007
1.2.2 知識準備\t008
1.2.3 任務實施\t009
1.2.4 任務效果\t021
任務1.3 認識大數據預處理\t021
1.3.1 任務描述\t021
1.3.2 知識準備\t022
1.3.3 任務實施\t022
1.3.4 任務效果\t033
任務1.4 了解大數據預處理常用工具\t034
1.4.1 任務描述\t034
1.4.2 任務實施\t035
1.4.3 任務效果\t042
項目小結\t043
習題\t044
項目二 使用Apache Flume采集日志數據\t045
任務2.1 Windows環(huán)境下的Apache Flume環(huán)境搭建\t046
2.1.1 任務描述\t046
2.1.2 知識準備\t046
2.1.3 任務實施\t060
2.1.4 任務效果\t067
任務2.2 Apache Flume數據采集案例\t067
2.2.1 任務描述\t067
2.2.2 任務實施\t068
項目小結\t071
習題\t072
項目三 使用Logstash采集日志數據\t074
任務3.1 Logstash工具安裝\t075
3.1.1 任務描述\t075
3.1.2 知識準備\t075
3.1.3 任務實施\t089
3.1.4 任務效果\t093
任務3.2 Logstash數據采集工作\t094
3.2.1 任務描述\t094
3.2.2 任務實施\t095
3.2.3 任務效果\t097
項目小結\t097
習題\t098
項目四 使用爬蟲工具完成網頁數據獲取\t099
任務4.1 使用Web Scraper完成列車時刻表數據采集工作\t100
4.1.1 任務描述\t100
4.1.2 任務知識準備\t100
4.1.3 任務實施\t107
4.1.4 任務效果\t115
任務4.2 使用八爪魚工具采集數據\t115
4.2.1 任務描述\t115
4.2.2 知識準備\t116
4.2.3 任務實施\t117
4.2.4 任務效果\t123
項目小結\t123
習題\t124
項目五 完成招聘數據預處理\t125
任務5.1 使用OpenRefine完成數據清洗任務\t126
5.1.1 任務描述\t126
5.1.2 任務實施\t126
5.1.3 任務效果\t137
任務5.2 使用Kettle完成數據集成任務\t138
5.2.1 任務描述\t138
5.2.2 任務實施\t138
5.2.3 任務效果\t158
項目小結\t159
習題\t159
項目六 數據可視化處理\t161
任務6.1 數據可視化認知\t162
6.1.1 任務描述\t162
6.1.2 知識準備\t162
6.1.3 任務效果\t167
任務6.2 熟悉Echarts數據可視化\t167
6.2.1 任務描述\t167
6.2.2 知識準備\t168
6.2.3 任務實施\t169
任務6.2.3 任務效果\t183
任務6.3 使用Tableau Desktop完成數據可視化任務\t183
6.3.1 任務描述\t183
6.3.2 知識準備\t183
6.3.3 任務實施\t187
6.3.4 任務效果\t197
項目小結\t198
習題\t198
項目七 數據標注\t199
預備知識\t200
任務7.1 安裝Labelme圖像標注工具\t201
7.1.1 任務描述\t201
7.1.2 知識準備\t202
7.1.3 任務實施\t203
任務7.2 使用Labelme標注工具完成數據標注任務\t206
7.2.1 任務描述\t206
7.2.2 知識準備\t206
7.2.3 任務實施\t207
項目小結\t221
習題\t221