Kafka: чтение с SQL-сервера с включенным отслеживанием изменений

Я пытался загрузить данные с SQL-сервера (с включенным отслеживанием изменений) в Kafka, чтобы их можно было использовать в одной или нескольких системах (отчеты, другие БД и т. Д.)

Мне удалось настроить плагин подключения Kafka для сервера sql (confluentinc / kafka-connect-cdc-mssql: 1.0.0-preview), и мне также удалось запустить его на машине kafka.

Я искал документацию (не могу найти ее), которая помогает ответить на следующие вопросы

  1. Как связать тему кафки с этим подключением?
  2. Основываясь на информации, которую я нашел (на форумах debezium), тема будет создана для каждой отдельной таблицы -> работает ли она таким же образом с коннектором kafka sql server?
  3. Я настроил соединение в распределенном режиме, у нас кафка работает на нескольких серверах, нужно ли нам запускать соединение на каждом сервере?
  4. Кто-нибудь использовал Debezium с отслеживанием изменений сервера sql и кафкой? веб-сайт Debezium описал соединение на «альфа-стадиях», и мне было интересно, есть ли какие-нибудь активные пользователи.

PS: Я также открыт для других вариантов загрузки данных в реальном времени с сервера sql в Kafka (соединение jdbc с отметкой времени / числовым полем - это мой вариант резервного копирования. Вариант резервного копирования, поскольку в моей исходной базе данных есть несколько таблиц, которые не содержат таких поля [изменения не отслеживаются и не могут быть отслежены с помощью числовых полей / полей с отметками времени]).


person Nithya    schedule 08.11.2018    source источник
comment
docs.confluent.io/current/connect/userguide.html   -  person pvy4917    schedule 08.11.2018
comment
В идеале вы не должны запускать Kafka Connect на реальном сервере Kafka Broker.   -  person OneCricketeer    schedule 15.11.2018
comment
На 4 коннектор Debezium SQL Server основан не на отслеживании изменений, а на функции CDC.   -  person Gunnar    schedule 15.11.2018


Ответы (1)


1 и 2 - Как связать тему кафки с этим подключением

Я бы поверил, что это для каждой таблицы, но вы могли бы использовать преобразование RegexRouter Connect для объединения нескольких таблиц в одну тему.

3 - настроил соединение в распределенном режиме, у нас кафка работает на нескольких серверах, нужно ли нам запускать соединение на каждом сервере

Kafka Connect должен работать за пределами ваших серверов Kafka. Это независимо масштабируемое.

4 - Debezium с отслеживанием изменений сервера sql

Я нет. Вероятно, лучше задать вопрос спискам рассылки Debezium или тикетам JIRA, работающим над этими функциями.

person OneCricketeer    schedule 14.11.2018