[SPARK-5180] Data source API improvement (Spark 1.5) - ASF JIRA

XML

Word

Printable

JSON

is related to

SPARK-5166 Stabilize Spark SQL APIs

SPARK-9932 Data source API improvement (Spark 1.6)

1.	Adding support for defining schema in foreign DDL commands.	Resolved	Fei Wang
2.	Persistent data source tables	Resolved	Michael Armbrust
3.	Partitioning support for tables created by the data source API	Resolved	Cheng Lian
4.	Improve the performance of metadata operations	Resolved	Unassigned
5.	Document data source API	Resolved	Michael Armbrust
6.	Write support for the data source API	Resolved	Yin Huai
7.	Python API for the write support of the data source API	Resolved	Yin Huai
8.	In memory data cache should be invalidated after insert into/overwrite	Resolved	Yin Huai
9.	Preinsert casting and renaming rule is needed in the Analyzer	Resolved	Yin Huai
10.	Finalize DDL and write support APIs	Resolved	Yin Huai
11.	Add common string filters to data sources	Resolved	Reynold Xin
12.	FSBasedRelation interface tweaks	Resolved	Cheng Lian
13.	Do not use FloatType in partition column inference	Resolved	Reynold Xin
14.	Replace the hash map in DynamicPartitionWriterContainer.outputWriterForRow with java.util.HashMap	Resolved	Reynold Xin
15.	Reduce memory consumption for dynamic partition insert	Resolved	Michael Armbrust
16.	Move all internal data source related classes out of sources package	Resolved	Reynold Xin
17.	Speed up path construction in DynamicPartitionWriterContainer.outputWriterForRow	Resolved	Cheng Lian
18.	DataFrame partitionBy memory pressure scales extremely poorly	Closed	Unassigned
19.	Conversion is applied twice on partitioned data sources	Resolved	Cheng Lian