БД AWS Timestream - AWS IOT

Я создаю простой датчик, который отправляет 5 данных телеметрии в AWS IoT Core. Я запутался между AWS Timestream DB и Elastic Search для хранения этой телеметрии.

  1. На данный момент я экспериментирую с Timestream и хочу знать, правильный ли это выбор? Любые предложения экспертов.
  2. Во-вторых, я хочу хранить записи db навсегда, так как это будет использоваться в моих прогнозах машинного обучения в будущем. Timestream удаляет записи через некоторое время или возможно никогда не удалить его
  3. Я буду создавать настраиваемую веб-страницу, чтобы показать эту телеметрию для каждого клиента - любая помощь в том, как я могу это сделать. Должен ли я напрямую запрашивать базу данных временного потока через api или должен создавать резервную копию в другой базе данных, например динамической и т. Д.?

Мы будем благодарны за вашу помощь. Спасибо.


person KPCoders    schedule 27.02.2021    source источник


Ответы (1)


На данный момент я экспериментирую с Timestream и хочу знать, правильный ли это выбор? Любые предложения экспертов.

Я бы не назвал себя экспертом, но Timestream DB выглядит как хорошее решение для данных телеметрии. Я думаю, что ElasticSearch будет излишним, если каждый из ваших данных телеметрии представляет собой какое-то числовое значение. Если ваши данные телеметрии более сложные (например, объекты JSON с множеством ключей) или вам нужен полнотекстовый поиск, ElasticSearch будет лучшим выбором. БД Timestream, вероятно, также проще и дешевле в управлении.

Во-вторых, я хочу хранить записи db навсегда, так как это будет использоваться в моих прогнозах машинного обучения в будущем. Timestream удаляет записи через некоторое время или возможно никогда не удалить его

Похоже, срок хранения ограничен 4 неделями по умолчанию . Вероятно, вы можете увеличить это, обратившись в службу поддержки AWS. Но я сомневаюсь, что они позволят бесконечное удержание.

Мы используем Amazon Kinesis Data Firehose с AWS Glue, чтобы хранить данные наших датчиков на AWS S3. Когда нам нужен доступ к данным для анализа, мы используем AWS Athena для запроса данных на S3.

Я буду создавать настраиваемую веб-страницу, чтобы показать эту телеметрию для каждого клиента - любая помощь в том, как я могу это сделать. Должен ли я напрямую запрашивать базу данных временного потока через api или должен создавать резервную копию в другой базе данных, например динамической и т. Д.?

Это зависит от того, насколько динамичны и сложны запросы, которые вы хотите отображать. Я бы начал с прямого запроса Timestream и представил DynamoDB там, где имеет смысл оптимизировать затраты.

person linuxbasic    schedule 23.03.2021