Запланировать файл scala с помощью oozie?

Как мне запустить/запланировать файл .scala, который я запускаю с помощью команды spark-shell, используя oozie?

Я запускаю этот файл с помощью команды spark-shell -i Combined.scala
!

Мне было интересно, присутствует ли здесь что-то конкретное, например, как мы планируем работу свиней в oozie!

По предложению Дэвида я создал xml:

<workflow-app xmlns='uri:oozie:workflow:0.2' name='oozie-java-spark-wf'>
   <start to='java-spark' />

   <action name='java-spark'>
    <spark xmlns="uri:oozie:spark-action:0.1">
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <master>yarn-cluster</master>
            <name>Spark Patent Citation</name>
            <class>org.apache.spark.repl.Main</class>
            <jar></jar>
            <arg>-i</arg>
            <arg>${nameNode}/user/hdfs/scala_file/combined.scala</arg>
</spark>


    <ok to="end"/>
    <error to="fail"/>
    </action>

    <kill name="fail">
      <message>Spark Java PatentCitation failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <end name="end"/>
</workflow-app>

Я получаю сообщение об ошибке:

Код ошибки JA018 Сообщение об ошибке Основной класс [org.apache.oozie.action.hadoop.SparkMain], main() выдал исключение, ноль

Где я ошибаюсь?


person Ujjwal SIddharth    schedule 09.03.2016    source источник


Ответы (1)


Для Узи есть Spark Action:

Действие Oozie Spark

spark-shell — это просто оболочка вокруг org.apache.spark.repl.Main — просто укажите это как SPARK MAIN CLASS и передайте -i и combined.scala как значения <arg/>.

person David Griffin    schedule 09.03.2016
comment
Элемент jar указывает список файлов jar или python, разделенных запятыми. Не .scala файл - person Ujjwal SIddharth; 09.03.2016
comment
Я отредактировал свой ответ - spark-shell - это просто оболочка для базового класса Java. - person David Griffin; 09.03.2016
comment
Спасибо за быстрый ответ Дэвид :) - person Ujjwal SIddharth; 09.03.2016
comment
Не нужно благодарностей - просто проголосуйте и примите мой ответ. ;) - person David Griffin; 09.03.2016
comment
Привет, Дэвид, что будет в качестве этого параметра? ‹jar›[JAR ЗАВИСИМОСТИ SPARK/ФАЙЛ PYTHON]‹/jar› @David - person Ujjwal SIddharth; 22.03.2016
comment
У вас есть зависимости в вашем скрипте? Например, требуются ли для этого определенные файлы JAR — добавьте их туда. - person David Griffin; 22.03.2016