ImportError: Нет модуля с именем pandas в Zeppelin (EMR)

У меня есть кластер EMR со Spark/Hive/Zeppelin. В своем блокноте Zeppelin я попытался импортировать панд:

import pandas as pd

Но я получил эту ошибку:

ImportError: No module named pandas

Как я могу решить эту проблему? Это потому, что панды не установлены в EMR?


person kee    schedule 11.07.2018    source источник


Ответы (1)


Это было связано с установкой pandas в основной узел:

sudo pip install pandas
person kee    schedule 11.07.2018