[HIVE-14707] ACID: Insert shuffle sort-merges on blank KEY - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Bug
Status: Resolved
Priority: Major
Resolution: Fixed
Affects Version/s: 2.2.0
Fix Version/s: 2.3.0
Component/s: Transactions
Labels:
None

Description

The ACID insert codepath uses a sorted shuffle, while they key used for shuffle is always 0 bytes long.

hive (sales_acid)> explain insert into sales values(1, 2, '3400-0000-0000-009', 1, null);

STAGE PLANS:
  Stage: Stage-1
    Tez
      DagId: gopal_20160906172626_80261c4c-79cc-4e02-87fe-3133be404e55:2
      Edges:
        Reducer 2 <- Map 1 (SIMPLE_EDGE)
...
      Vertices:
        Map 1 
            Map Operator Tree:
                TableScan
                  alias: values__tmp__table__2
                  Statistics: Num rows: 1 Data size: 28 Basic stats: COMPLETE Column stats: NONE
                  Select Operator
                    expressions: tmp_values_col1 (type: string), tmp_values_col2 (type: string), tmp_values_col3 (type: string), tmp_values_col4 (type: string), tmp_values_col5 (type: string)
                    outputColumnNames: _col0, _col1, _col2, _col3, _col4
                    Statistics: Num rows: 1 Data size: 28 Basic stats: COMPLETE Column stats: NONE
                    Reduce Output Operator
                      sort order: 
                      Map-reduce partition columns: UDFToLong(_col1) (type: bigint)
                      Statistics: Num rows: 1 Data size: 28 Basic stats: COMPLETE Column stats: NONE
                      value expressions: _col0 (type: string), _col1 (type: string), _col2 (type: string), _col3 (type: string), _col4 (type: string)
            Execution mode: vectorized, llap
            LLAP IO: no inputs

Note the missing "+" / "-" in the Sort Order fields.

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

HIVE-14707.26.patch
21/Jan/17 23:02
437 kB
Eugene Koifman
HIVE-14707.25.patch
21/Jan/17 17:50
392 kB
Eugene Koifman
HIVE-14707.24.patch
19/Jan/17 20:19
368 kB
Eugene Koifman
HIVE-14707.23.patch
18/Jan/17 21:01
368 kB
Eugene Koifman
HIVE-14707.22.patch
18/Jan/17 06:15
364 kB
Eugene Koifman
HIVE-14707.21.patch
18/Jan/17 00:45
351 kB
Eugene Koifman
HIVE-14707.20.patch
13/Jan/17 15:40
351 kB
Eugene Koifman
HIVE-14707.19.patch
11/Jan/17 23:27
342 kB
Eugene Koifman
HIVE-14707.19.patch
11/Jan/17 23:38
341 kB
Eugene Koifman
HIVE-14707.18.patch
10/Jan/17 02:06
341 kB
Eugene Koifman
HIVE-14707.17.patch
09/Jan/17 22:21
340 kB
Eugene Koifman
HIVE-14707.16.patch
09/Jan/17 19:50
340 kB
Eugene Koifman
HIVE-14707.14.patch
07/Jan/17 02:53
338 kB
Eugene Koifman
HIVE-14707.13.patch
06/Jan/17 23:41
328 kB
Eugene Koifman
HIVE-14707.11.patch
06/Jan/17 19:16
305 kB
Eugene Koifman
HIVE-14707.10.patch
06/Jan/17 02:46
291 kB
Eugene Koifman
HIVE-14707.09.patch
06/Jan/17 02:27
272 kB
Eugene Koifman
HIVE-14707.08.patch
05/Jan/17 23:21
78 kB
Eugene Koifman
HIVE-14707.06.patch
05/Jan/17 01:56
48 kB
Eugene Koifman
HIVE-14707.05.patch
05/Jan/17 01:49
41 kB
Eugene Koifman
HIVE-14707.04.patch
05/Jan/17 00:55
17 kB
Eugene Koifman
HIVE-14707.03.patch
04/Jan/17 17:29
5 kB
Eugene Koifman
HIVE-14707.02.patch
04/Jan/17 03:26
5 kB
Eugene Koifman
HIVE-14707.01.patch
22/Dec/16 01:59
4 kB
Eugene Koifman

Issue Links

Dependent

HIVE-15573 Vectorization: Non-Uniform shuffle ReduceSink is not specialized

Resolved

is related to

HIVE-11858 Hive DISTRIBUTE BY & CROSS PRODUCT should not sort output

Resolved

Activity

People

Assignee:: Eugene Koifman

Reporter:: Gopal Vijayaraghavan

Votes:: 0 Vote for this issue

Watchers:: 3 Start watching this issue

Dates

Created:: 06/Sep/16 17:29

Updated:: 21/Jul/17 18:12

Resolved:: 22/Jan/17 00:31