简介:本文将指导您完成Hadoop的安装过程,并通过简单的步骤验证其是否正确安装。
在开始之前,请确保您的系统满足Hadoop的最低要求。通常,Hadoop需要在64位操作系统上运行,并需要Java Development Kit (JDK) 1.8或更高版本。
步骤1:下载Hadoop
访问Hadoop官方网站或使用您的包管理器下载Hadoop。对于大多数Linux发行版,可以使用以下命令:
sudo apt-get install hadoop
步骤2:配置Hadoop
在Hadoop安装目录下,找到并编辑etc/hadoop/core-site.xml文件。添加以下配置:
<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property></configuration>
步骤3:格式化HDFS
运行以下命令来格式化HDFS:
hdfs namenode -format
步骤4:启动Hadoop
使用以下命令启动Hadoop:
start-all.sh
步骤5:验证Hadoop
要验证Hadoop是否正确安装,可以执行以下命令:
如果看到NameNode、SecondaryNameNode、DataNode等进程,则表示Hadoop正在运行。
jps
http://localhost:50070/。您应该能够看到Hadoop NameNode的Web界面。这将列出HDFS根目录下的文件和文件夹。如果一切正常,您应该看到类似于
hadoop fs -ls /
/user和/tmp的目录。其中
hadoop jar hadoop-examples.jar wordcount /input /output
/input是输入文件的路径,/output是输出文件的路径。运行作业后,您可以在输出目录中查看结果。然后使用
hadoop fs -put localfile /hdfs/destination/path
hadoop fs -ls /hdfs/destination/path来检查文件是否已成功复制到HDFS。
stop-all.sh