[MAPREDUCE-5028] Maps fail when io.sort.mb is set to high value - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Bug
Status: Closed
Priority: Critical
Resolution: Fixed
Affects Version/s: 1.1.1, 2.0.3-alpha, 0.23.5
Fix Version/s: 1.2.0, 2.4.0
Component/s: None
Labels:
None

Target Version/s:

0.23.11, 2.4.0
Hadoop Flags:

Reviewed

Description

Verified the problem exists on branch-1 with the following configuration:

Pseudo-dist mode: 2 maps/ 1 reduce, mapred.child.java.opts=-Xmx2048m, io.sort.mb=1280, dfs.block.size=2147483648

Run teragen to generate 4 GB data
Maps fail when you run wordcount on this configuration with the following error:

java.io.IOException: Spill failed
	at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.collect(MapTask.java:1031)
	at org.apache.hadoop.mapred.MapTask$NewOutputCollector.write(MapTask.java:692)
	at org.apache.hadoop.mapreduce.TaskInputOutputContext.write(TaskInputOutputContext.java:80)
	at org.apache.hadoop.examples.WordCount$TokenizerMapper.map(WordCount.java:45)
	at org.apache.hadoop.examples.WordCount$TokenizerMapper.map(WordCount.java:34)
	at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:144)
	at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:766)
	at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
	at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
	at java.security.AccessController.doPrivileged(Native Method)
	at javax.security.auth.Subject.doAs(Subject.java:396)
	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1149)
	at org.apache.hadoop.mapred.Child.main(Child.java:249)
Caused by: java.io.EOFException
	at java.io.DataInputStream.readInt(DataInputStream.java:375)
	at org.apache.hadoop.io.IntWritable.readFields(IntWritable.java:38)
	at org.apache.hadoop.io.serializer.WritableSerialization$WritableDeserializer.deserialize(WritableSerialization.java:67)
	at org.apache.hadoop.io.serializer.WritableSerialization$WritableDeserializer.deserialize(WritableSerialization.java:40)
	at org.apache.hadoop.mapreduce.ReduceContext.nextKeyValue(ReduceContext.java:116)
	at org.apache.hadoop.mapreduce.ReduceContext.nextKey(ReduceContext.java:92)
	at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:175)
	at org.apache.hadoop.mapred.Task$NewCombinerRunner.combine(Task.java:1505)
	at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.sortAndSpill(MapTask.java:1438)
	at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.access$1800(MapTask.java:855)
	at org.apache.hadoop.mapred.MapTask$MapOutputBuffer$SpillThread.run(MapTask.java:1346)

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

MR-5028_testapp.patch
14/May/13 17:36
11 kB
Arun Murthy
mr-5028-1.patch
06/Mar/14 02:28
16 kB
Karthik Kambatla
mr-5028-2.patch
06/Mar/14 06:18
16 kB
Karthik Kambatla
mr-5028-3.patch
10/Mar/14 21:37
20 kB
Karthik Kambatla
mr-5028-branch1.patch
02/Mar/13 02:22
2 kB
Karthik Kambatla
mr-5028-branch1.patch
26/Feb/13 23:40
3 kB
Karthik Kambatla
mr-5028-branch1.patch
26/Feb/13 04:11
3 kB
Karthik Kambatla
mr-5028-trunk.patch
20/Mar/13 05:26
5 kB
Karthik Kambatla
mr-5028-trunk.patch
19/Mar/13 20:40
4 kB
Karthik Kambatla
mr-5028-trunk.patch
05/Mar/13 00:19
4 kB
Karthik Kambatla
repro-mr-5028.patch
04/Apr/13 23:32
9 kB
Karthik Kambatla

Issue Links

is related to

MAPREDUCE-5031 Maps hitting IndexOutOfBoundsException for higher values of mapreduce.task.io.sort.mb

Resolved

relates to

MAPREDUCE-5032 MapTask.MapOutputBuffer contains arithmetic overflows

Open

Activity

People

Assignee:: Karthik Kambatla

Reporter:: Karthik Kambatla

Votes:: 0 Vote for this issue

Watchers:: 20 Start watching this issue

Dates

Created:: 26/Feb/13 03:54

Updated:: 03/Nov/14 18:34

Resolved:: 11/Mar/14 01:31