[HDFS-1312] Re-balance disks within a Datanode - ASF JIRA

XML

Word

Printable

JSON

Details

Type: New Feature
Status: Resolved
Priority: Major
Resolution: Fixed
Affects Version/s: None
Fix Version/s: 3.0.0-alpha1
Component/s: datanode
Labels:
None

Hadoop Flags:

Reviewed
Release Note:

Hide
The Disk Balancer lets administrators rebalance data across multiple disks of a DataNode. It is useful to correct skewed data distribution often seen after adding or replacing disks. Disk Balancer can be enabled by setting dfs.disk.balancer.enabled to true in hdfs-site.xml. It can be invoked by running "hdfs diskbalancer". See the "HDFS Diskbalancer" section in the HDFS Commands guide for detailed usage.

Show
The Disk Balancer lets administrators rebalance data across multiple disks of a DataNode. It is useful to correct skewed data distribution often seen after adding or replacing disks. Disk Balancer can be enabled by setting dfs.disk.balancer.enabled to true in hdfs-site.xml. It can be invoked by running "hdfs diskbalancer". See the "HDFS Diskbalancer" section in the HDFS Commands guide for detailed usage.

Description

Filing this issue in response to ``full disk woes`` on hdfs-user.

Datanodes fill their storage directories unevenly, leading to situations where certain disks are full while others are significantly less used. Users at many different sites have experienced this issue, and HDFS administrators are taking steps like:

Manually rebalancing blocks in storage directories
Decomissioning nodes & later readding them

There's a tradeoff between making use of all available spindles, and filling disks at the sameish rate. Possible solutions include:

Weighting less-used disks heavier when placing new blocks on the datanode. In write-heavy environments this will still make use of all spindles, equalizing disk use over time.
Rebalancing blocks locally. This would help equalize disk use as disks are added/replaced in older cluster nodes.

Datanodes should actively manage their local disk so operator intervention is not needed.

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

HDFS-1312.007.patch
24/Jun/16 01:41
744 kB
Arpit Agarwal
HDFS-1312.006.patch
23/Jun/16 21:54
743 kB
Anu Engineer
HDFS-1312.005.patch
23/Jun/16 18:33
743 kB
Arpit Agarwal
HDFS-1312.004.patch
23/Jun/16 00:41
743 kB
Anu Engineer
HDFS-1312.003.patch
22/Jun/16 15:29
738 kB
Arpit Agarwal
HDFS-1312.002.patch
20/Jun/16 17:14
739 kB
Anu Engineer
HDFS-1312.001.patch
15/Jun/16 22:37
739 kB
Anu Engineer
disk-balancer-proposal.pdf
10/Sep/15 20:56
328 kB
Anu Engineer
Architecture_and_testplan.pdf
11/Nov/15 20:35
218 kB
Anu Engineer
Architecture_and_test_update.pdf
15/Jun/16 00:21
273 kB
Anu Engineer

Issue Links

is duplicated by

HDFS-4408 Balancer for DataNode's Volumes

Resolved

is related to

HDFS-10576 DiskBalancer followup work items

Resolved

HDFS-1804 Add a new block-volume device choosing policy that looks at free space

Closed

HDFS-1121 Allow HDFS client to measure distribution of blocks across devices for a specific DataNode

Open

HDFS-1120 Make DataNode's block-to-device placement policy pluggable

Resolved

relates to

HDFS-8538 Change the default volume choosing policy to AvailableSpaceVolumeChoosingPolicy

Patch Available

(1 relates to)

Sub-Tasks

1.	DiskBalancer : Add DataModels	Resolved	Anu Engineer
2.	DiskBalancer : Add connectors	Resolved	Anu Engineer
3.	DiskBalancer : Add Planner	Resolved	Anu Engineer
4.	DiskBalancer: change htrace...JsonIgnore to codehaus...JsonIgnore	Resolved	Xiaobing Zhou
5.	DiskBalancer : Replace htrace json imports with jackson	Resolved	Anu Engineer
6.	DiskBalancer : Add submitDiskbalancer RPC	Resolved	Anu Engineer
7.	DiskBalancer : Add cancelPlan RPC	Resolved	Anu Engineer
8.	DiskBalancer : Add Query RPC	Resolved	Anu Engineer
9.	DiskBalancer : Add getRuntimeSettings	Resolved	Anu Engineer
10.	DiskBalancer : SubmitPlan implementation	Resolved	Anu Engineer
11.	DiskBalancer : Add QueryPlan implementation	Resolved	Anu Engineer
12.	DiskBalancer : Add cancelPlan implementation	Resolved	Anu Engineer
13.	Suppress Jenkins warning for sample JSON file	Resolved	Xiaobing Zhou
14.	Use SLF4J in new classes	Resolved	Anu Engineer
15.	Stop tracking CHANGES.txt in the HDFS-1312 feature branch.	Resolved	Xiaobing Zhou
16.	DiskBalancer : getVolumeMap implementation	Resolved	Anu Engineer
17.	DiskBalancer : getBandwidth implementation	Resolved	Anu Engineer
18.	DiskBalancer: Force rebase diskbalancer branch	Resolved	Anu Engineer
19.	DiskBalancer : Add tests for disk balancer using a Mock Mover class.	Resolved	Anu Engineer
20.	DiskBalancer : Add configuration parameters	Resolved	Anu Engineer
21.	DiskBalancer : Command utitlities	Resolved	Anu Engineer
22.	DiskBalancer : Refactor moveBlockAcrossStorage to be used by disk balancer	Resolved	Anu Engineer
23.	DiskBalancer : Add Data mover	Resolved	Anu Engineer
24.	DiskBalancer : Add Plan Command	Resolved	Anu Engineer
25.	DiskBalancer : Add Execute command	Resolved	Anu Engineer
26.	DiskBalancer: Add JMX for DiskBalancer	Resolved	Anu Engineer
27.	DiskBalancer: Add QueryStatus command	Resolved	Anu Engineer
28.	DiskBalancer: Add cancel command	Resolved	Anu Engineer
29.	DiskBalancer : Add user documentation	Resolved	Anu Engineer
30.	DiskBalancer: Plan command output directory should be a sub-directory	Resolved	Anu Engineer
31.	DiskBalancer: resolve volume path names	Resolved	Anu Engineer
32.	DiskBalancer: ExecuteCommand checks planFile in a wrong way	Resolved	Lei (Eddy) Xu
33.	Diskbalancer: Print out information when a plan is not generated.	Resolved	Anu Engineer
34.	DiskBalancer: Use the default datanode port if port is not provided.	Resolved	Anu Engineer
35.	DiskBalancer: Add Report Command	Resolved	Xiaobing Zhou
36.	DiskBalancer: Refactor Plan Command	Resolved	Xiaobing Zhou
37.	DiskBalancer: Refactor Execute Command	Resolved	Xiaobing Zhou
38.	DiskBalancer: Support help command	Resolved	Anu Engineer
39.	DiskBalancer: Pretty-print json in Query command	Resolved	Anu Engineer
40.	DiskBalancer: Fix Checkstyle issues in test code	Resolved	Anu Engineer
41.	Diskbalancer: The CLI error message for disk balancer is not enabled is not clear.	Resolved	Anu Engineer
42.	Diskbalancer: When no actions in plan, error message says "Plan was generated more than 24 hours ago"	Resolved	Anu Engineer
43.	DiskBalancer: PlanCommand should use -fs instead of -uri to be consistent with other hdfs commands	Resolved	Anu Engineer
44.	DiskBalancer: fix whitespace issue in doc files	Resolved	Anu Engineer
45.	DiskBalancer: fix issue of order dependency in iteration in ReportCommand test	Resolved	Xiaobing Zhou
46.	Fix handling of the -fs Generic option	Resolved	Arpit Agarwal
47.	o.a.h.h.s.diskbalancer.command.Command does not actually verify options as expected.	Resolved	Anu Engineer
48.	DiskBalancer "-query" results in NPE if no plan for the node	Resolved	Anu Engineer
49.	TestDiskBalancerCommand#testPlanNode failed with IllegalArgumentException	Resolved	Xiaobing Zhou
50.	DiskBalancer: Add missing package-info	Resolved	Anu Engineer

Activity

People

Assignee:: Anu Engineer

Reporter:: Travis Crawford

Votes:: 27 Vote for this issue

Watchers:: 107 Start watching this issue

Dates

Created:: 21/Jul/10 23:46

Updated:: 18/Jul/16 21:11

Resolved:: 24/Jun/16 21:19