[YARN-90] NodeManager should identify failed disks becoming good again - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Sub-task
Status: Closed
Priority: Major
Resolution: Fixed
Affects Version/s: None
Fix Version/s: 2.6.0
Component/s: nodemanager
Labels:
None

Target Version/s:

2.4.0
Hadoop Flags:

Reviewed

Description

~~MAPREDUCE-3121~~ makes NodeManager identify disk failures. But once a disk goes down, it is marked as failed forever. To reuse that disk (after it becomes good), NodeManager needs restart. This JIRA is to improve NodeManager to reuse good disks(which could be bad some time back).

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

apache-yarn-90.0.patch
10/Mar/14 16:33
48 kB
Varun Vasudev
apache-yarn-90.1.patch
12/Mar/14 20:53
93 kB
Varun Vasudev
apache-yarn-90.10.patch
17/Oct/14 15:29
109 kB
Varun Vasudev
apache-yarn-90.2.patch
13/Mar/14 06:45
93 kB
Varun Vasudev
apache-yarn-90.3.patch
19/Sep/14 13:19
95 kB
Varun Vasudev
apache-yarn-90.4.patch
19/Sep/14 14:07
95 kB
Varun Vasudev
apache-yarn-90.5.patch
24/Sep/14 21:13
99 kB
Varun Vasudev
apache-yarn-90.6.patch
24/Sep/14 23:00
99 kB
Varun Vasudev
apache-yarn-90.7.patch
30/Sep/14 20:24
108 kB
Varun Vasudev
apache-yarn-90.8.patch
01/Oct/14 22:28
109 kB
Varun Vasudev
apache-yarn-90.9.patch
14/Oct/14 08:35
109 kB
Varun Vasudev
YARN-90.1.patch
25/Sep/13 14:04
2 kB
nijel
YARN-90.patch
15/Nov/13 22:04
7 kB
Ravi Prakash
YARN-90.patch
06/Nov/13 02:49
7 kB
Hou Song
YARN-90.patch
04/Nov/13 02:30
11 kB
Hou Song
YARN-90.patch
24/Sep/13 08:19
2 kB
nijel

Issue Links

breaks

YARN-4393 TestResourceLocalizationService#testFailedDirsResourceRelease fails intermittently

Closed

duplicates

YARN-1196 LocalDirsHandlerService never change failedDirs back to normal even when these disks turn good

Resolved

YARN-1380 Enable NM to automatically reuse failed local dirs after they are available again

Resolved

is duplicated by

YARN-2473 YARN never cleans up container directories from a full disk

Resolved

YARN-4011 Jobs fail since nm-local-dir not cleaned up when rogue job fills up disk

Resolved

YARN-2488 Nodemanager should support check if bad disks have turned to good ones

Resolved

is related to

YARN-2839 YARN minicluster doesn't bail out if all the NM disks are dead

Open

YARN-2799 cleanup TestLogAggregationService based on the change in YARN-90

Closed

(1 is duplicated by, 2 is related to)

Activity

People

Assignee:: Varun Vasudev

Reporter:: Ravi Gummadi

Votes:: 1 Vote for this issue

Watchers:: 25 Start watching this issue

Dates

Created:: 21/Nov/11 11:53

Updated:: 25/Nov/15 04:11

Resolved:: 21/Oct/14 17:44