[HIVE-7390] Make single quote character optional and configurable in BeeLine CSV/TSV output - ASF JIRA

Details

Type: New Feature
Status: Closed
Priority: Major
Resolution: Fixed
Affects Version/s: 0.13.1
Fix Version/s: 0.14.0
Component/s: Clients
Labels:
None

Hadoop Flags:

Incompatible change
Release Note:

Hide
--outputformat=[table/vertical/csv/tsv/dsv]
Format mode for result display. Default is table.
Usage: beeline --outputformat=tsv

--delimiterForDSV=DELIMITER
specify the delimiter for delimiter-separated values output format (default: |)
Usage: beeline --outputformat=dsv --delimiterForDSV=,

beeline dsv and delimiterForDSV examples are as followings:
% bin/beeline
Hive version 0.11.0-SNAPSHOT by Apache
beeline> !connect jdbc:hive2://localhost:10000 scott tiger org.apache.hive.jdbc.HiveDriver
!connect jdbc:hive2://localhost:10000 scott tiger org.apache.hive.jdbc.HiveDriver
Connecting to jdbc:hive2://localhost:10000
Connected to: Hive (version 0.14.0-SNAPSHOT)
Driver: Hive (version 0.14.0-SNAPSHOT)
Transaction isolation: TRANSACTION_REPEATABLE_READ
HiveServer2 Clients – dsv Example
0: jdbc:hive2://localhost:10000> create table csv_table(id int, name string, info string) row format delimited fields terminated by '\t';
No rows affected (0.121 seconds)
0: jdbc:hive2://localhost:10000> load data local inpath '/root/names' overwrite into table csv_table;
No rows affected (0.245 seconds)
0: jdbc:hive2://localhost:10000> select * from csv_table;
+---------------+-----------------+-----------------+--+
| csv_table.id | csv_table.name | csv_table.info |
+---------------+-----------------+-----------------+--+
| 19630001 | "john" | lennon |
| 19630002 | peter,paul | mccartney |
| 19630003 | george | harrison |
| 19630004 | ringo | starr |
+---------------+-----------------+-----------------+--+
4 rows selected (0.09 seconds)
0: jdbc:hive2://localhost:10000> !outformat csv
Unknown command: outformat csv
0: jdbc:hive2://localhost:10000> !outputformat csv
0: jdbc:hive2://localhost:10000> select * from csv_table;
csv_table.id,csv_table.name,csv_table.info
19630001,"""john""",lennon
19630002,"peter,paul",mccartney
19630003,george,harrison
19630004,ringo,starr
4 rows selected (0.105 seconds)
0: jdbc:hive2://localhost:10000> !outputformat dsv
0: jdbc:hive2://localhost:10000> select * from csv_table;
csv_table.id|csv_table.name|csv_table.info
19630001|"""john"""|lennon
19630002|peter,paul|mccartney
19630003|george|harrison
19630004|ringo|starr
4 rows selected (0.123 seconds)
0: jdbc:hive2://localhost:10000> !set delimiterForDSV ',';
0: jdbc:hive2://localhost:10000> select * from csv_table;
csv_table.id'csv_table.name'csv_table.info
19630001'"""john"""'lennon
19630002'peter,paul'mccartney
19630003'george'harrison
19630004'ringo'starr
4 rows selected (0.11 seconds)

Show
--outputformat=[table/vertical/csv/tsv/dsv] Format mode for result display. Default is table. Usage: beeline --outputformat=tsv --delimiterForDSV=DELIMITER specify the delimiter for delimiter-separated values output format (default: |) Usage: beeline --outputformat=dsv --delimiterForDSV=, beeline dsv and delimiterForDSV examples are as followings: % bin/beeline Hive version 0.11.0-SNAPSHOT by Apache beeline> !connect jdbc: hive2://localhost:10000 scott tiger org.apache.hive.jdbc.HiveDriver !connect jdbc: hive2://localhost:10000 scott tiger org.apache.hive.jdbc.HiveDriver Connecting to jdbc: hive2://localhost:10000 Connected to: Hive (version 0.14.0-SNAPSHOT) Driver: Hive (version 0.14.0-SNAPSHOT) Transaction isolation: TRANSACTION_REPEATABLE_READ HiveServer2 Clients – dsv Example 0: jdbc: hive2://localhost:10000 > create table csv_table(id int, name string, info string) row format delimited fields terminated by '\t'; No rows affected (0.121 seconds) 0: jdbc: hive2://localhost:10000 > load data local inpath '/root/names' overwrite into table csv_table; No rows affected (0.245 seconds) 0: jdbc: hive2://localhost:10000 > select * from csv_table; +---------------+-----------------+-----------------+--+ | csv_table.id | csv_table.name | csv_table.info | +---------------+-----------------+-----------------+--+ | 19630001 | "john" | lennon | | 19630002 | peter,paul | mccartney | | 19630003 | george | harrison | | 19630004 | ringo | starr | +---------------+-----------------+-----------------+--+ 4 rows selected (0.09 seconds) 0: jdbc: hive2://localhost:10000 > !outformat csv Unknown command: outformat csv 0: jdbc: hive2://localhost:10000 > !outputformat csv 0: jdbc: hive2://localhost:10000 > select * from csv_table; csv_table.id,csv_table.name,csv_table.info 19630001,"""john""",lennon 19630002,"peter,paul",mccartney 19630003,george,harrison 19630004,ringo,starr 4 rows selected (0.105 seconds) 0: jdbc: hive2://localhost:10000 > !outputformat dsv 0: jdbc: hive2://localhost:10000 > select * from csv_table; csv_table.id|csv_table.name|csv_table.info 19630001|"""john"""|lennon 19630002|peter,paul|mccartney 19630003|george|harrison 19630004|ringo|starr 4 rows selected (0.123 seconds) 0: jdbc: hive2://localhost:10000 > !set delimiterForDSV ','; 0: jdbc: hive2://localhost:10000 > select * from csv_table; csv_table.id'csv_table.name'csv_table.info 19630001'"""john"""'lennon 19630002'peter,paul'mccartney 19630003'george'harrison 19630004'ringo'starr 4 rows selected (0.11 seconds)

Description

Currently when either the CSV or TSV output formats are used in beeline each column is wrapped in single quotes. Quote wrapping of columns should be optional and the user should be able to choose the character used to wrap the columns.

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

HIVE-7390.1.patch
22/Jul/14 08:49
7 kB
ferdinand xu
HIVE-7390.2.patch
29/Jul/14 01:29
7 kB
ferdinand xu
HIVE-7390.3.patch
29/Jul/14 02:06
7 kB
ferdinand xu
HIVE-7390.4.patch
30/Jul/14 08:39
8 kB
Ferdinand Xu
HIVE-7390.5.patch
31/Jul/14 05:41
9 kB
Ferdinand Xu
HIVE-7390.6.patch
01/Aug/14 02:34
9 kB
Ferdinand Xu
HIVE-7390.7.patch
01/Aug/14 16:18
9 kB
Ferdinand Xu
HIVE-7390.8.patch
04/Aug/14 01:55
9 kB
Ferdinand Xu
HIVE-7390.9.patch
11/Aug/14 02:01
9 kB
Ferdinand Xu
HIVE-7390.patch
11/Jul/14 12:46
4 kB
Jim Halfpenny

Issue Links

breaks

HIVE-8544 Beeline SeparatedValuesOutputFormat (csv/tsv/dsv) wraps the results with extra double quotes

Resolved

HIVE-8615 beeline csv,tsv outputformat needs backward compatibility mode

Closed

is duplicated by

HIVE-7434 beeline should not always enclose the output by default in CSV/TSV mode

Resolved

is related to

HIVE-9788 Make double quote optional in tsv/csv/dsv output

Closed

Make single quote character optional and configurable in BeeLine CSV/TSV output

Details

Description

Attachments

Attachments

Issue Links

Activity

People

Dates