[SPARK-38615] SQL Error Attribution Framework - ASF JIRA

XML

Word

Printable

JSON

Details

Type: Improvement
Status: Resolved
Priority: Major
Resolution: Implemented
Affects Version/s: 3.3.0
Fix Version/s: None
Component/s: SQL
Labels:
None

Description

Currently, there is not enough error context for runtime ANSI failures.

In the following example, the error message only tells that there is a "divide by zero" error, without pointing out where the exact SQL statement is.

> SELECT
  ss1.ca_county,
  ss1.d_year,
  ws2.web_sales / ws1.web_sales web_q1_q2_increase,
  ss2.store_sales / ss1.store_sales store_q1_q2_increase,
  ws3.web_sales / ws2.web_sales web_q2_q3_increase,
  ss3.store_sales / ss2.store_sales store_q2_q3_increase
FROM
  ss ss1, ss ss2, ss ss3, ws ws1, ws ws2, ws ws3
WHERE
  ss1.d_qoy = 1
    AND ss1.d_year = 2000
    AND ss1.ca_county = ss2.ca_county
    AND ss2.d_qoy = 2
    AND ss2.d_year = 2000
    AND ss2.ca_county = ss3.ca_county
    AND ss3.d_qoy = 3
    AND ss3.d_year = 2000
    AND ss1.ca_county = ws1.ca_county
    AND ws1.d_qoy = 1
    AND ws1.d_year = 2000
    AND ws1.ca_county = ws2.ca_county
    AND ws2.d_qoy = 2
    AND ws2.d_year = 2000
    AND ws1.ca_county = ws3.ca_county
    AND ws3.d_qoy = 3
    AND ws3.d_year = 2000
    AND CASE WHEN ws1.web_sales > 0
    THEN ws2.web_sales / ws1.web_sales
        ELSE NULL END
    > CASE WHEN ss1.store_sales > 0
    THEN ss2.store_sales / ss1.store_sales
      ELSE NULL END
    AND CASE WHEN ws2.web_sales > 0
    THEN ws3.web_sales / ws2.web_sales
        ELSE NULL END
    > CASE WHEN ss2.store_sales > 0
    THEN ss3.store_sales / ss2.store_sales
      ELSE NULL END
ORDER BY ss1.ca_county

org.apache.spark.SparkArithmeticException: divide by zero at org.apache.spark.sql.errors.QueryExecutionErrors$.divideByZeroError(QueryExecutionErrors.scala:140) at org.apache.spark.sql.catalyst.expressions.DivModLike.eval(arithmetic.scala:437) at org.apache.spark.sql.catalyst.expressions.DivModLike.eval$(arithmetic.scala:425) at org.apache.spark.sql.catalyst.expressions.Divide.eval(arithmetic.scala:534)
...

I suggest that we provide details in the error message, including:

the problematic expression from the original SQL query, e.g. "ss3.store_sales / ss2.store_sales store_q2_q3_increase"
the line number and starting char position of the problematic expression, in case of queries like "select a + b from t1 union select a + b from t2"

So that the error message will be precise

org.apache.spark.SparkArithmeticException: divide by zero
SparkArithmeticException: divide by zero. To return NULL instead, use 'try_divide'. If necessary set spark.sql.ansi.enabled to false (except for ANSI interval type) to bypass this error.
== SQL(line 2, position 43) ==
ws2.web_sales / ws1.web_sales web_q1_q2, ss2.store_sales / ss1.store_sales store_q1_q2
                                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^

SQL Error Attribution Framework.pdf

Attachments

- Sort By Name
- Sort By Date
- Ascending
- Descending

SQL Error Attribution Framework.pdf
11/Dec/23 21:02
131 kB
Gengliang Wang

Issue Links

is a child of

SPARK-38781 Error Message Improvements in Spark 3.3

Open

Sub-Tasks

1.	Keep track of SQL query text in Catalyst TreeNode	Resolved	Gengliang Wang
2.	Provide query context in runtime error of Add/Subtract/Multiply	Resolved	Gengliang Wang
3.	Provide query context in runtime error of Divide/Div/Reminder/Pmod	Resolved	Gengliang Wang
4.	Provide query context in runtime error of map key not exists	Resolved	Gengliang Wang
5.	Provide query context in Decimal overflow errors	Resolved	Gengliang Wang
6.	Provide query context in runtime error of Casting from String to Number/Date/Timestamp/Boolean	Resolved	Gengliang Wang
7.	Return an empty context string if TreeNode.origin is wrongly set	Resolved	Gengliang Wang
8.	Provide runtime error query context for Binary Arithmetic when WSCG is off	Resolved	Gengliang Wang
9.	Provide runtime error query context for Cast when WSCG is off	Resolved	Gengliang Wang
10.	Provide query context on map key not exists error when WSCG is off	Resolved	Gengliang Wang
11.	Provide query context in runtime error of cast overflow	Open	Max Gekk
12.	Provide query context for decimal precision overflow error when WSCG is off	Resolved	Gengliang Wang
13.	Fix query context bugs in decimal overflow under codegen mode	Resolved	Gengliang Wang
14.	Provide query context of Decimal overflow in AVG when WSCG is off	Resolved	Gengliang Wang
15.	Separate query contexts from error-classes.json	Resolved	Gengliang Wang
16.	Increase the start position of query context by 1	Resolved	Apache Spark
17.	Provide runtime error query context when array index is out of bound	Resolved	Gengliang Wang
18.	Add query contexts to SparkException	Resolved	Unassigned
19.	Provide a query context of ELEMENT_AT_BY_INDEX_ZERO	Resolved	Max Gekk
20.	Provide a query context of ParseException	Resolved	Max Gekk
21.	Provide query context in AnalysisException	Resolved	Gengliang Wang
22.	Make query context as part of SparkThrowable	Resolved	Max Gekk

Activity

People

Assignee:: Apache Spark

Reporter:: Gengliang Wang

Votes:: 0 Vote for this issue

Watchers:: 1 Start watching this issue

Dates

Created:: 21/Mar/22 15:40

Updated:: 11/Dec/23 21:03

Resolved:: 11/Dec/23 21:03