Вопросы по теме 'presto'

Пользовательские функции в Presto
В настоящее время я работаю с Presto 0.80. Мне нужно написать определяемую пользователем функцию для преобразования градусов Цельсия в градусы Фаренгейта во время запроса выбора. Я сделал то же самое, используя Hive QL, но мне было интересно, сможем...
12139 просмотров
schedule 01.05.2024

Ошибка при запуске Presto Server при попытке доступа к Hive
Я пытаюсь запустить Presto для запроса Hive ON RHEL Machine. Но при запуске Presto Server через "./launcher run" я получаю следующую ошибку: 3 errors com.google.inject.CreationException: Unable to create injector, see the following errors:...
1195 просмотров
schedule 23.11.2023

Престо и Улей
Я пытаюсь включить базовые запросы SQL к файлам CSV, расположенным в каталоге s3. Presto казался естественным (файлы размером 10 ГБ). Во время настройки в Presto я попытался создать таблицу с помощью коннектора Hive. Мне было непонятно, нужно ли...
1131 просмотров
schedule 09.10.2022

Исключение таблицы HIVE Presto Query: не удалось перечислить каталог
Я новичок в Престо. У меня есть две машины на presto 0.160, одна координаторская, другая рабочая. Я хочу запросить таблицу в улье. Теперь я могу «показать таблицы», «desc tablename», но когда я хочу «выбрать * из имени таблицы», возникает...
3333 просмотров
schedule 26.03.2024

AWS EMR Presto не находит правильные схемы Hive с помощью AWS Glue
Итак, у меня возникла проблема с выполнением запросов Presto через AWS EMR. Я запустил EMR с запущенным hive / presto и использую AWS Glue в качестве хранилища метаданных. Когда я подключаюсь по SSH к главному узлу и запускаю куст, я могу...
1596 просмотров
schedule 12.03.2024

Можно ли запросить в таблице стрелок памяти с помощью presto или есть способ использовать фрейм данных pandas в качестве источника данных для механизма запросов presto
Можно ли запросить в таблице стрелок памяти с помощью presto или есть ли способ использовать фрейм данных pandas в качестве источника данных для механизма запросов presto? На самом деле у меня есть паркетные файлы, которые я хочу преобразовать в...
553 просмотров
schedule 14.02.2024

Как объединить массивы, сгруппированные по другому столбцу в Presto?
Возможно ли это в SQL (желательно Presto): Я хочу изменить эту таблицу: id, array 1, ['something'] 1, ['something else'] 2, ['something'] К этой таблице: id, array 1, ['something', 'something else'] 2, ['something']
7672 просмотров
schedule 11.12.2023

Строка в формате даты ГГГГ-ММ-ДД в Афине
Итак, я просмотрел документацию и предыдущие ответы здесь, но, похоже, не могу понять этого. У меня есть STRING , обозначающий дату. Нормальный вывод выглядит так: 2018-09-19 17:47:12 Если я сделаю это, я верну его в следующем формате...
11794 просмотров

Сравнение производительности между сопоставлением имен файлов и сопоставлением имени файла. Обрезка разделов
У меня проблема, когда файлы создаются каждые 15 минут, поэтому через месяц у меня будет ~ 2880 файлов. Через год у меня будет 35 000 файлов! Уплотнение может быть вариантом, что будет означать, что у меня 1 паркетный файл в час = 8760 файлов!...
42 просмотров
schedule 24.10.2022

Power BI — как использовать DirectQuery с Presto ODBC
Проблема ODBC с режимом импорта требует много времени для загрузки данных из кластера Presto и еще много времени для загрузки .pbix (с целыми наборами данных) на сервер Power BI. Следовательно У меня есть собственный Presto Cluster. Есть...
370 просмотров
schedule 07.01.2024

Могу ли я использовать Athena / Presto для сортировки таблицы перед записью?
Я хочу заархивировать свои журналы в формате Parquet. Перед написанием таблицы я хочу отсортировать ее по столбцу c , чтобы каждый файл Parquet имел только небольшой диапазон c . Это позволит Athena / Presto эффективно сканировать таблицу, когда...
504 просмотров
schedule 02.04.2024

Невозможно получить записи из mongodb с помощью presto
У меня есть каталог mongodb в etc / catalog с именем mongodb.properties. Когда я запускаю оболочку presto и выполняю команду: Показать таблицы; Я показываю коллекции mongodb, но когда я запускаю запрос выбора, он дает мне ошибки. presto>...
754 просмотров
schedule 07.04.2024

LEFT JOIN Дублирование строк
В таблице 1 поле соединения (поле Y) многократно дублируется в этой таблице, хотя каждая строка в целом уникальна. Когда я пытаюсь запустить left join , я получаю в 20 раз больше строк, чем ожидалось. Я безуспешно пытался использовать решения...
627 просмотров
schedule 12.12.2022

Presto не возвращает 0 при подсчете
У меня есть следующий запрос: with dates as (SELECT CAST(date_column AS DATE) DAY FROM ( VALUES (SEQUENCE(cast('2019-10-29' AS date), current_date, INTERVAL '1' DAY))) AS t1(date_array) CROSS JOIN UNNEST(date_array) AS t2(date_column))...
229 просмотров
schedule 05.06.2024

Как использовать диапазон дат в presto
Мне нужно выбирать DS (datetimestamp) из года в год. Пример: SELECT id_product, code, substr(ds_date, 1,10) as date, product_type, from Table A where 1=1 AND ds <='2019-12-31' AND (ds_date BETWEEN '2017-01-01' AND '2019-12-31') groupby...
63 просмотров
schedule 22.03.2024

Как взять максимум между двумя значениями в presto?
У меня такой запрос: select id, table1.date1, table2.date2, table1.name from table1 join table2 using (id) Я также хочу иметь еще один столбец с MAX(table1.date1, table2.date2) , но я не нахожу для этого подходящего синтаксиса. Я не хочу,...
3365 просмотров
schedule 30.10.2022

создание таблицы куста с помощью udf
У меня есть кусок данных на s3 в формате orc. мое требование состоит в том, чтобы замаскировать определенные столбцы. Какой будет лучший подход с минимальными изменениями? Могу ли я определить udf на уровне таблицы куста, и всякий раз, когда...
66 просмотров
schedule 26.02.2024

presto + Конфигурация безопасности Hive
у нас есть кластер presto с кластером Hadoop, когда все рабочие серверы presto установлены на машинах узлов данных Ниже приведен пример файла конфигурации коннектора Hive, который настроен на presto worker в папке каталога....
285 просмотров
schedule 14.11.2023

Как вычислить медиану в PrestoSQL?
Похоже, что в Presto SQL для этой цели нет собственной функции. Знаете ли вы, как эффективно объединить группу и вернуть ее медианное значение?
4470 просмотров

Операторы вызовов Presto JDBC
Можно ли выполнить CALL system.sync_partition_metadata('dummy','dummy','FULL') с помощью JDBC, поскольку драйвер Presto JDBC не поддерживает CallableStatements?
81 просмотров
schedule 21.12.2023