[HDFS-11086] DataNode disk check improvements - ASF JIRA

XML

Word

Printable

JSON

This Jira tracks a few improvements to DataNode’s usage of DiskChecker to address the following problems:

Checks are serialized so a single slow disk can indefinitely delay checking the rest.
Related to 1, no detection of stalled checks.
Lack of granularity. A single IO error initiates checking all disks.
Inconsistent activation. Some DataNode IO failures trigger disk checks but not all.

1.	Support for running async disk checks in DataNode	Resolved	Arpit Agarwal
2.	Support for parallel checking of StorageLocations on DataNode startup	Resolved	Arpit Agarwal
3.	Update DataNode to use StorageLocationChecker at startup	Resolved	Arpit Agarwal
4.	Support for parallel checking of FsVolumes	Resolved	Arpit Agarwal
5.	Update DataNode to use DatasetVolumeChecker	Resolved	Arpit Agarwal
6.	Implement equals and hashcode in FsVolumeSpi implementations	Resolved	Manjunath Anand