Вопросы по теме 'amazon-athena'

Есть ли способ указать настраиваемые параметры подключения к scalikejdbc?
При подключении к AWS Athena обязательным параметром является s3_staging_dir для указания выходного каталога запроса. Есть ли способ указать этот параметр в scalikejdbc? Я пытался просмотреть всю документацию scalikejdbc, но ничего подобного не...
289 просмотров

Боковой вид улья не работает AWS Athena
Я работаю над процессом анализа журнала AWS Cloudtrail , я застрял в извлечении JSON из строки, Это мое определение таблицы. CREATE EXTERNAL TABLE cloudtrail_logs ( eventversion STRING, eventName STRING, awsRegion STRING, requestParameters...
1681 просмотров

Запросы к Amazon Athena с разделами
Скажем, я хочу иметь разделы по какому-то атрибуту, и в каждом разделе у меня есть пара файлов с записями в JSON (в каждом файле больше записей). Я хочу запросить их по некоторому атрибуту, который указывает, когда создается запись для...
9087 просмотров

Как обрабатывать разрывы строк в AWS Athena
Я создал в AWS Athena такую ​​таблицу: CREATE EXTERNAL TABLE IF NOT EXISTS default.test_line_breaks ( col1 string, col2 string ) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES ( 'separatorChar' = ',',...
5035 просмотров
schedule 11.04.2024

HIVE_UNKNOWN_ERROR при выполнении запроса AWS Athena в таблице Glue (RDS)
Я получаю сообщение об ошибке при выполнении запроса Athena к таблице Glue, созданной из базы данных RDS: HIVE_UNKNOWN_ERROR: невозможно создать формат ввода Таблицы создаются с помощью поискового робота. Таблицы правильно отображаются в...
2229 просмотров

Как решить SQL-инъекцию для Athena?
Я работаю над написанием программы Spring Java для доступа к данным из Athena, но обнаружил, что драйвер Athena JDBC не поддерживает PreparedStatement. Кто-нибудь знает, как избежать SQL-инъекций в Athena?
2307 просмотров
schedule 05.12.2022

Строка в формате даты ГГГГ-ММ-ДД в Афине
Итак, я просмотрел документацию и предыдущие ответы здесь, но, похоже, не могу понять этого. У меня есть STRING , обозначающий дату. Нормальный вывод выглядит так: 2018-09-19 17:47:12 Если я сделаю это, я верну его в следующем формате...
11794 просмотров

Сравнение производительности между сопоставлением имен файлов и сопоставлением имени файла. Обрезка разделов
У меня проблема, когда файлы создаются каждые 15 минут, поэтому через месяц у меня будет ~ 2880 файлов. Через год у меня будет 35 000 файлов! Уплотнение может быть вариантом, что будет означать, что у меня 1 паркетный файл в час = 8760 файлов!...
42 просмотров
schedule 24.10.2022

Создание JDBC-соединения с Athena не работает
У меня есть БД на Афине, и теперь я пытаюсь подключиться к ней с помощью SQLWorkbenchJ. Я загрузил драйверы JDBC , предоставленные AWS. , добавил его в мои настройки рабочего места, но он просто не подключается. Точное сообщение об ошибке...
403 просмотров

Могу ли я использовать Athena / Presto для сортировки таблицы перед записью?
Я хочу заархивировать свои журналы в формате Parquet. Перед написанием таблицы я хочу отсортировать ее по столбцу c , чтобы каждый файл Parquet имел только небольшой диапазон c . Это позволит Athena / Presto эффективно сканировать таблицу, когда...
504 просмотров
schedule 02.04.2024

Политика корзины S3 не позволяет Athena выполнять запрос
Я выполняю запросы Amazon Athena в корзине S3. Назовем это athena-bucket . Сегодня у меня есть требование ограничить этот сегмент VPC Enpoints. Итак, я попробовал эту политику ведра S3: { "Version": "2012-10-17", "Statement": [...
891 просмотров

Ошибка отказа в доступе при выполнении запроса athena из учетной записи root
Я получаю сообщение об ошибке отказа в доступе, когда пытаюсь выполнить athena запрос из учетной записи root. Что я делаю неправильно? Я пытался создать IAM user roles , но не уверен, правильно ли я поступаю. Я просто хотел провести быстрый...
169 просмотров
schedule 15.01.2024

Преобразование папки данных S3 в секционированное и секционированное хранилище данных
У меня есть папка с ТБ структурированных данных, и все они придерживаются фиксированной схемы. Структура папок такая: s3://main-bucket/ folder-1/ <= One folder will only contain data from one algorithm...
1447 просмотров

Как правильно использовать case в SQL
Я получаю небольшую ошибку со следующим кодом SQL, причину которого я не понимаю. Я использую AWS Athena. SELECT icustay_id, itemid, date_diff('second', TIMESTAMP '1970-01-01 00:00:00', starttime) AS starttime,...
96 просмотров
schedule 30.04.2024

Amazon athena не может читать файлы журнала доступа S3, а запрос выбора Athena возвращает пустые наборы результатов для каждого столбца
Я успешно создал таблицу базы данных в Афине. См. Запрос ниже. CREATE EXTERNAL TABLE IF NOT EXISTS s3_access_logs_db.wafbucket_logs( BucketOwner STRING, Bucket STRING, RequestDateTime STRING, RemoteIP STRING,...
476 просмотров
schedule 01.11.2023

Транспонирование данных с помощью pyspark и aws Glue
Я новичок в pyspark и столкнулся с некоторыми проблемами, связанными с переносом данных. Я использую клей aws для запуска задания. В настоящее время данные выглядят так: +-----------------+-----+------+-----+ | Country |Code |1969 |1979...
116 просмотров

Афина Запрос занимает очень много времени
У меня есть большой текстовый файл, разделенный вертикальной чертой, вероятно, с более чем миллионом записей. Копирую в s3, а потом загружаю в athena: CREATE EXTERNAL TABLE IF NOT EXISTS main ( `pin` string,...
48 просмотров
schedule 13.11.2023

Может ли Amazon Athena работать без каталога Glue?
Могу ли я использовать Informatica EDC вместо каталога Glue в AWS. тесно связан ли AWS Athena с каталогом Glue?
330 просмотров

Создать таблицу в Athena из вложенного JSON
У меня есть вложенный JSON типа [{ "emails": [{ "label": "", "primary": "", "relationdef_id": "", "type": "",...
73 просмотров
schedule 26.09.2022

Таблица Athena, отображающая "в значениях столбца"
У меня есть файл csv в s3 со следующей структурой "name1"|"tmc International"|"123, link2" Я использую ниже шаблон CF для чтения этого файла в Афину T1Table: Type: AWS::Glue::Table Properties:...
185 просмотров