九个步骤,手把手教你在Windows上安装Hadoop
在Windows上安装Hadoop时经常会出现许多错误,很多用户使用基于Linux的操作系统。本文详细讲述如何在Windows上安装和运行Apache Hadoop,如果遇到了问题,可以参考文章中的步骤进行解决。
(资料图)
在 Microsoft Windows 上运行 Apache Hadoop 是比较繁琐的任务,在安装过程中会出现许多错误,最终,大多数用户放弃了通过 Windows 使用 Hadoop,并转而使用基于 Linux 的操作系统。
本文讲述了有关如何在Windows上无误安装和运行Apache Hadoop所有组件的各个方面。请先为以下先决条件准备好PC/笔记本电脑:
1. Java开发工具包
Apache Hadoop 与最新版本的JDK不兼容。建议下载Java SE Development Kit版本15.0.x(可能需要注册Oracle帐户)。
安装链接:https://www.oracle.com/java/technologies/javase/jdk15-archive-downloads.html
2. 设置环境路径
(仅在未安装Java或从未设置Java路径时才执行此步骤)。
进入设置 -> 搜索 “环境变量” -> 选择 “编辑系统变量 “选项。出现以下对话框:
单击“环境变量…”按钮。出现以下窗口:
选择新按钮并在变量名称中键入“JAVA_HOME”,将值设置为Java SDK的bin文件夹的路径(通常为类型:C:\Program Files\Java\jdk-15.0.1\bin)。对于用户和系统变量都执行此步骤。
从用户变量中选择路径选项(稍后同样适用于系统变量)。单击“编辑”并通过单击“新建”按钮(从右侧)添加Java bin路径。对于用户和系统变量都执行此步骤。
现在,通过满足先决条件,已准备好在Windows上安装Apache Hadoop。
从以下链接中下载tar.gz文件(注意-最可能需要下载的是底部的第三个文件)。
安装链接:https://downloads.apache.org/hadoop/common/hadoop-3.3.4/
确保将Hadoop文件夹提取到C:驱动器中(而不是任何文件夹或其他驱动器中)
提取后,请确保hadoop-3.3.4(文件夹名称)对用户具有写入权限。
下面我们进入安装步骤的关键部分,设置Hadoop的配置,请仔细遵循这些步骤。我们需要更改以下文件:
编辑文件C:\ Hadoop-3.3.4 \ etc \ hadoop \ core-site.xml,编辑xml代码并保存: fs.defaultFS hdfs://localhost:9000
注意:如果端口正在使用,则可能需要更改端口(此处为9000)。
编辑文件C:\Hadoop-3.3.4\etc\hadoop\mapred-site.xml,编辑xml代码并保存: mapreduce.framework.name yarn
3. 编辑文件
编辑C:\Hadoop-3.3.4\etc\hadoop\hdfs-site.xml,编辑xml代码并保存:
dfs.replication 1 dfs.namenode.name.dir /hadoop-3.3.4/data/namenode dfs.datanode.data.dir /hadoop-3.3.4/data/datanode
4. 创建目录
创建以下目录
a. 在“C:\ hadoop-3.3.4 \”下创建文件夹“data”
b. 在“C:\ hadoop-3.3.4 \ data \”下创建文件夹“datanode”
c. 在“C:\ hadoopo-3.3.4 \ data \”下创建文件夹“namenode”
5. 编辑文件
编辑文件C:\ Hadoop-3.3.4 \ etc \ hadoop \ yarn-site.xml,编辑xml代码并保存:
yarn.nodemanager.aux-services mapreduce_shuffle yarn.nodemanager.auservices.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler
6. 编辑文件
编辑文件C:\Hadoop-3.3.4\etc\hadoop\hadoop-env.cmd,编辑以下行:
“JAVA_HOME=C:\\Progra~1\Java\jdk-15.0.1\bin” instead of set “JAVA_HOME=C:\Java”
注意:可以使用JAVA_HOME变量,但由于路径地址(Program Files)中存在空格,会引发错误。
到这一步已经完成了编辑配置的工作。现在,我们将在cmd中执行命令以运行Hadoop。
从下面链接中的bin文件夹中粘贴文件到Hadoop bin文件夹中,注意不要替换整个bin文件夹,复制文件并仅替换选定的文件。确保bin文件夹总共有22个项目。这一步很关键,因为现有的bin文件夹具有不完整的文件集,这些文件集是运行资源管理器所需的。
安装链接:https://drive.google.com/drive/folders/1fDbblP61sUKmDqvQ8pfU98nMt_we4b5J?usp=share_link
7. 为Hadoop设置环境和路径变量
进入设置->打开环境变量->在用户变量中添加新变量:
变量名称:HADOOP_HOME,值:C:\ hadoop-3.3.4 \ bin(到hadoop bin文件夹的路径)。
进入用户变量中的路径,点击编辑,添加新路径:
路径值与上面相同(到Hadoop bin文件夹的路径)。
将以下路径值添加到系统变量中:
C:\ hadoop-3.3.4 \ bin
C:\ hadoop-3.3.4 \ sbin
以“管理员身份运行”打开cmd(或powershell),并使用cd命令导航到Hadoop的bin目录:
cd C:\hadoop-3.3.4\bin\
8. 格式化目录
使用相同的cmd(powershell)命令格式化“namenode”目录;
hdfs namenode -format
9. 启动组件
要启动Hadoop组件,将当前目录改为sbin文件夹:
cd C:\hadoop-3.3.4\sbin\
并运行“start-all.cmd”可执行文件。可以通过在文件资源管理器中导航到sbin目录中的start-all.cmd并选择“以管理员身份运行”来执行此操作。
注意:如果通过执行第8步,无法查看yarn终端(cmd),请从同一目录中以管理员身份打开“start-yarn.cmd”。
现在就能看到四个终端(cmd)同时运行。
确保所有四个组件都在运行,这些组件是:
a. hadoop namenode
b. hadoop datanode
c. yarn resourcemanager
d. yarn nodemanager
注意:可以使用终端中的“jps”命令进行验证。如果任何一个(或多个)进程“关闭”,请检查上一部分中的Hadoop配置步骤。
在成功运行组件后,可以通过在Web浏览器中打开http://localhost:8088来访问Hadoop默认创建的群集。
上图显示了具有值1的活动节点的突出显示字段,表示已创建一个节点并正在运行。
单击左侧栏上的“节点”以查看所创建节点的详细信息。
要检查namenode的状态,请在Web浏览器中打开http://localhost:9870。可以通过顶部导航栏下的“实用程序”部分在GUI下访问HDFS。
注意:图中显示 “localhost:9001″,因为端口号9000已经被我的电脑使用了。我已经在Hadoop配置步骤中改变了它。(在core-site.xml文件中)。
恭喜,已成功在PC上安装了Apache Hadoop。现在,可以从本地计算机执行map reduce任务,开始探索Hadoop Map Reduce的功能吧。
标签:
相关推荐:
最新新闻:
- 九个步骤,手把手教你在Windows上安装Hadoop
- 天天微速讯:2999元!优派推出新款27寸4K Mini LED显示器:96W反向充
- 塞尔维亚,进入最高战备状态
- 当前快看:《魔戒:咕噜》Steam好评率仅为33% 不推荐游玩
- 首列甘肃酒泉(敦煌)铁海国际联运班列成功开行 天天新视野
- 官宣免职!广西科技大学一学院党总支副书记酒驾后逃进女厕被抓
- 吴谢宇故意杀人、诈骗、买卖身份证件上诉一案将于5月30日9时公开宣判-报道
- 局中人曼丽_《局中人》曼丽的真实身份究竟是什么 世界视讯
- (新华全媒+)科技改变乡村|“木瓜哥”的理念
- 世界速读:2023闭眼买爆款王花落谁家 海信电视U7K夺魁
- 七旬婆婆突发脑出血,立体定向术后恢复良好
- 观速讯丨吉林省25项先进技术成果亮相科博会
- 尝鲜正当时!思茅新鲜竹笋大量上市-世界快播报
- 挪用91万学杂费炒股,吉安一教师被判刑!
- 【视频】冰毒25.93公斤!勐康边检站查获特大毒品案 今日讯
- 风云决战天门谁老婆最多 风云决战天门
- 实时焦点:定期存款到期银行却不给取钱?原因主要有4方面,很多人还不知道
- 动漫美图杂赏:盛夏未至 清凉先来 小姐姐尽情展现绝美身材|独家
- 全球最新:用户被"宠坏":拼多多一季度营收同比增长58.2%!
- 《碟中谍7》片长156分钟成系列最长电影
- 华安基金:哲库科技退租事项计划实施缓释措施
- 全球热消息:中国华能江西分公司丰城新能源与中建三局签署合作框架协议
- 再见!银川西路大绿罐今日正式退出历史舞台-天天新资讯
- 世界热讯:迪马尔科保留曲目!北看台之子再次领唱与国米球迷共...
- 一部分美妆开始“黑化”了_全球观速讯
- 当前观察:上海有色网: 下游补库需求基本完成 近期碳酸锂价格以持稳为主
- 工银瑞祥定开债基分红
- 亿联网络2022年年度每10股转4股派13元 股权登记日为6月1日
- 集美区计生协聚焦生育支持和家庭健康,切实提升群众幸福感获得感
- 《龙之信条2》简中官网上线 完全单机体验
- 世界看点:十七世纪荷兰美术(荷兰美术)
- 小说路明非的真实身份 路明非的真实身份
- 《三体》电视剧荣获5项提名:最佳中国电视剧等 报道
- Xbox《星空》展会将在电影院同步放映!玩家可提前订票|微资讯
- 广东队将有大动作,胡明轩宣布新决定,徐杰被说打球脏却成为导师 信息
- 3D-23135期晒票分享,岁月静好,别来无恙|讯息
- 古代女子裹足从什么时候开始的 什么朝代裹脚-每日报道
- 徐州航务中心“周五大讲堂”走进中国矿业大学
- 当前视讯!遂平县召开强化社会治理优化基层网格建设推进会
- 全球观热点:“创业北京”创业创新大赛启动-即时焦点
- 暴雪副总裁调侃《暗黑破坏神4》和《芭比》都有足部特写:应该联动
- 花纤
- 浙江警察学院2017分数线届录取排名及_世界动态
- 新款暗影精灵9锐龙版游戏本开售:R7 7840H+RTX 4060
- 【环球新视野】《塞尔达传说:王国之泪》开发团队规模超大!70%的成员是新人
- 纯棉服饰推荐(纯棉服饰)
- Redmi K60 Ultra工业设计曝光 外观变化大_环球热消息
- 世界热点!小米14 Pro配置曝光:搭载骁龙8 Gen 3、采用5000mAh电池
- 163只主动偏股公募复权净值创历史新低 冯波葛兰洪流韩创等明星基金经理在列
- 全球热消息:什么是6房_什么是69条码
- 索尼藏了?爆料人称很多内容没能在PS展示会亮相
- 《碟中谍7》曝光剧照 阿汤哥牵手海莉·阿特维尔_全球短讯
- 天天播报:NVIDIA黄仁勋:CPU用得越来越少 GPU才是关键
- 电子身份证在微信哪里_电子身份证如何注册
- 世界播报:变速箱油多长时间换一次_变速箱油多长时间换一次的解析
- 为海内外企业解难题通堵点 广西自贸试验区营商环境监测“不打烊” 时快讯
- 全新蔚来ES6提升续航
- 英特尔Flex系列GPU发布软件更新包,扩展支持Windows云游戏等新功能_世界观点
- 每日快讯!华为Mate 40 Pro官翻机上架:4299元起、麒麟9000处理器
- 百度肖阳:奇点降临 搜索迎来代际变革
- 国货影像品牌创导者松典,2023品牌全新升级
- 百度网盘云一朵智能助理内测,预约体验步骤整理好了
- 2023年中国白酒界口感评比结果出炉,茅台稳坐榜首,没见剑南春
- 阜阳:孙正东赴上海、江苏溧阳考察招商|世界信息
- 中国专精特新“小巨人”与德国“隐形冠军”培育政策研究 视点
- 强于预期的企业盈利正帮助美国避免衰退|天天时讯
- 蔚来新车放低了身段 全球即时
- 一份辟谣让昆明上热搜:经济失速,卖地收入暴跌,发生了什么 环球今亮点
- 全球首张!通威荣获T V北德海上光伏组件认证证书 全球热点评
- 货币基金净值都是1么 内行人士这么说
- 外媒称《Forspoken》DLC比本体更出色:就是流程短
- 每日简讯:外媒灵魂拷问:放眼中土世界 为何偏选咕噜当主角?
- 【当前热闻】《小美人鱼》国内上映首日票房249万 观众难接受黑人鱼
- 《人间地狱》将英军引入其备受推崇的二战射击游戏中 世界快消息
- 西装革履当暴徒!潜行动作《伪信号(Fake Signals)》现已发售