Associate-Developer-Apache-Spark Exam Dumps | Which of the following code blocks returns a new DataFrame with only columns predError and values of

<< Prev Question Next Question >>

Question 18/63

Which of the following code blocks returns a new DataFrame with only columns predError and values of every second row of DataFrame transactionsDf?
Entire DataFrame transactionsDf:
1.+-------------+---------+-----+-------+---------+----+
2.|transactionId|predError|value|storeId|productId| f|
3.+-------------+---------+-----+-------+---------+----+
4.| 1| 3| 4| 25| 1|null|
5.| 2| 6| 7| 2| 2|null|
6.| 3| 3| null| 25| 3|null|
7.| 4| null| null| 3| 2|null|
8.| 5| null| null| null| 2|null|
9.| 6| 3| 2| 25| 2|null|
10.+-------------+---------+-----+-------+---------+----+

A. transactionsDf.filter(col("transactionId").isin([3,4,6])).select([predError, value])

B. transactionsDf.select(col("transactionId").isin([3,4,6]), "predError", "value")

C. transactionsDf.filter("transactionId" % 2 == 0).select("predError", "value")

D. transactionsDf.filter(col("transactionId") % 2 == 0).select("predError", "value") (Correct)

E. 1.transactionsDf.createOrReplaceTempView("transactionsDf")
2.spark.sql("FROM transactionsDf SELECT predError, value WHERE transactionId % 2 = 2")

F. transactionsDf.filter(col(transactionId).isin([3,4,6]))

Question 18/63

LEAVE A REPLY

Download PDF File