Вопросы по теме 'sparkr'
Ошибка при установке пакета SparkR с помощью install_github
Я пытаюсь использовать пакет SparkR в R. У меня есть все зависимые пакеты, такие как devtools , Rtools.exe и т. д.
Когда я пытаюсь выполнить следующую команду:
install_github("amplab-extras/SparkR-pkg",subdir="pkg")
Я...
631 просмотров
schedule
28.11.2022
Как в SparkR 1.5.0 однозначно указать столбец после соединения с общим столбцом?
Я присоединил два фрейма данных к столбцу с одинаковым именем.
oe = join(orders, emp, orders$EmployeeID == emp$EmployeeID)
Результирующий фрейм данных имеет два столбца с одинаковыми именами EmployeeID
Теперь группа по имени столбца или...
547 просмотров
schedule
15.09.2022
java.lang.OutOfMemoryError: пространство кучи Java при сборе SparkR
Размер моих собранных данных составляет 1,3 г, а все конфигурации памяти драйвера установлены на 3 г.
Почему нехватка памяти все еще происходит??
Это моя подробная конфигурация сообщения об исключении sparkR и OOM....
1119 просмотров
schedule
23.12.2023
SparkR сбрасывает многострочный заголовок
Как удалить первые n строк (заголовок) файла CSV, прочитанного SparkR. Я знаю, что в Scala возможны некоторые вещи, например Как преобразовать файл csv в rdd или http://qnalist.com/questions/4849107/skip-lines-in-spark , но трудно применить его к...
45 просмотров
schedule
22.03.2024
Нелинейные регрессии на больших наборах данных с использованием SparkR (или других методов?)
Я пытаюсь запустить нелинейную регрессию (NLR) для очень большого набора данных. Для небольших тестовых наборов данных у меня есть рабочий код в R, и я пытаюсь перенести его в SparkR.
Я новичок в Spark(R и других).
R (мой рабочий код):...
166 просмотров
schedule
11.01.2024
Добавить столбец в DataFrame в sparkR
Я хотел бы добавить столбец, заполненный символом N в DataFrame в SparkR. Я бы сделал это с кодом, отличным от SparkR:
df$new_column <- "N"
Но с SparkR я получаю следующую ошибку:
Error: class(value) == "Column" || is.null(value) is...
4107 просмотров
schedule
07.03.2024
Цеппелин со искрой не отображает фрейм данных в виде таблицы
В документации интерпретатора zeppelin R указано:
If you return a data.frame, Zeppelin will attempt to display it using Zeppelin's built-in visualizations.
Это можно увидеть в примере документации:
Однако, когда я пытаюсь запустить...
1338 просмотров
schedule
06.02.2024
Повторное приведение типов всех столбцов в кадре данных SparkR в цикле и/или функция применения
С SparkR 1.4.1 при работе с фреймом данных структуры:
printSchema(dta)
root
|-- date: timestamp (nullable = true)
|-- valA: float (nullable = true)
|-- valB: float (nullable = true)
|-- ...
Я хочу преобразовать все существующие...
627 просмотров
schedule
23.03.2024
Как применить функцию к каждой строке в SparkR?
У меня есть файл в формате CSV, который содержит таблицу со столбцами «id», «timestamp», «action», «value» и «location». Я хочу применить функцию к каждой строке таблицы, и я уже написал код в R следующим образом:
user <-...
1621 просмотров
schedule
26.12.2023
sparkR: ошибка при создании экземпляра «org.apache.spark.sql.hive.HiveSessionState»:
Я пытаюсь решить эту проблему, когда пытаюсь использовать sparkR.
sparkR.session(master = "local[*]", sparkConfig = list(spark.driver.memory = "1g"))
Error in handleErrors(returnStatus, conn) :
java.lang.IllegalArgumentException: Error while...
8217 просмотров
schedule
20.02.2024
ИскраР. Преобразование UTC в местное время для всех наблюдений, несколько часовых поясов
Я новичок в SparkR, учусь на ходу, а в версии 2.2.0 — SNAPSHOT. У меня есть SparkDataFrame с одним столбцом временных меток UTC, одним столбцом часовых поясов. Например:
mydates<- c("2012-12-22 14:23:05", "2015-01-19 16:37:42", "2017-03-02...
150 просмотров
schedule
28.10.2023
Ошибка SparkR при записи кадра данных в csv и паркет
Я получаю сообщение об ошибке при записи искрового фрейма данных в csv и паркет. Я уже пытаюсь установить winutil, но до сих пор не устраняю ошибку.
мой код
INVALID_IMEI <- c("012345678901230","000000000000000")...
262 просмотров
schedule
05.11.2022
Как я могу написать выражение логического столбца с И и ИЛИ в SparkR?
Мне нужно добавить столбец в набор данных SparkR (spark версии 2.1.1) на основе некоторых логических критериев для нескольких других столбцов. Но очевидное решение (с использованием && или ||) не работает, я получаю сообщение об ошибке « invalid 'x'...
154 просмотров
schedule
07.03.2024
Как остановить Spark, не выходя из RStudio при использовании sparklyr?
Я могу легко остановить Spark, когда использую SparkR с помощью sparkR.stop(), как показано в блоке кода ниже:
library(SparkR)
sparkR.session(master = "local")
sparkR.conf(SPARK_HOME)
sparkR.stop()
detach("package:SparkR", unload=TRUE)
Как я...
809 просмотров
schedule
30.09.2022
Рекомендовать несколько предметов с помощью SparkR ALS
Я следую примеру sparkR для ALS:
# Load training data
data <- list(list(0, 0, 4.0), list(0, 1, 2.0), list(1, 1, 3.0),
list(1, 2, 4.0), list(2, 1, 1.0), list(2, 2, 5.0))
df <- createDataFrame(data, c("userId", "movieId",...
61 просмотров
schedule
11.05.2024