--

hadoop 安装



项目的代码地址在:
http://github.com/words-sdsc/coursera
获取big-data-2.zip 之后运行 ./setup.sh

我们选择从 cloudra 提供的虚拟机来创建一个工作环境。

mac   

1. 下载并安装 virtual box,版本可以选择 5.1 X
https://www.virtualbox.org/wiki/Downloads

2. 下载 cloudra 的 virtual Machine
https://downloads.cloudera.com/demo_vm/virtualbox/cloudera-quickstart-vm-5.4.2-0-virtualbox.zip

3. 解压缩 zip 的 virtual machine 文件

4. 启动virtual box,并 import 该 virtual machine
























对于 windows 下,基本相同,只是 courdera 的 virtual machine 用:
https://downloads.cloudera.com/demo_vm/virtualbox/cloudera-quickstart-vm-5.4.2-0-virtualbox.zip




















虚拟机下载和安装

https://downloads.cloudera.com/demo_vm/virtualbox/cloudera-quickstart-vm-5.4.2-0-virtualbox.zip

安装 hadoop


1. 下载 data 文件

http://github.com/words-sdsc/coursera
big-data-2.zip

2. 运行 setup.sh

安装 spark 环境


1. 下载 data 文件
http://github.com/words-sdsc/coursera
big-data-3.zip
到 /../Download/

2. unzip -o big-data-3.zip
解压缩 在 Donwload

3. 运行安装命令
  $ cd big-data-3
  $ ./setup.sh

在安装过程中 Anaconda 需要一些输入。

4. 启动环境
  $ source $HOME/.bashrc