Я новичок в Spark! И я запутался в отношениях между Spark rdd и Spark sql . Должен ли Spark sql конвертироваться в Spark rdd в фоновом режиме?
какая связь между Spark rdd и Spark sql?
comment
обратитесь к руководству по программированию: spark.apache.org/docs/latest/programming -guide.html
- person mtoto   schedule 11.10.2016
comment
Возможный дубликат Разница между DataFrame и RDD в Spark
- person   schedule 11.10.2016
Ответы (1)
Насколько я знаю, они стоят на разных двигателях.
Spark SQL использует внутреннюю вещь под названием Catalyst, которая отвечает за создание логических планов работы и оптимизацию производительности по отношению к codegen.
Во-первых, поскольку API-интерфейсы DataFrame и Dataset созданы на основе механизма Spark SQL, он использует Catalyst для создания оптимизированного логического и физического плана запроса.
API RDD, с другой стороны, имеет низкий уровень и, по-видимому, не использует катализатор.
person
Kristian
schedule
11.10.2016
Очень благодарен за ваш ответ. Это разрешило мое замешательство.
- person liyong; 13.10.2016