В чем разница между мини-пакетом и потоковой передачей в реальном времени на практике (не в теории)? Теоретически я понимаю, что мини-пакет - это то, что пакетируется в заданном временном интервале, тогда как потоковая передача в реальном времени больше похожа на что-то по мере поступления данных, но мой самый большой вопрос заключается в том, почему бы не иметь мини-пакет с временным интервалом эпсилон (скажем, одна миллисекунда) или я хотели бы понять причину, по которой одно решение будет более эффективным, чем другое?
Недавно я наткнулся на один пример, в котором мини-пакет (Apache Spark) используется для обнаружения мошенничества и потоковой передачи в реальном времени (Apache Flink), используемой для предотвращения мошенничества. Кто-то также прокомментировал, что мини-пакеты не будут эффективным решением для предотвращения мошенничества (поскольку цель состоит в том, чтобы предотвратить транзакцию в том виде, в каком она произошла). Теперь мне интересно, почему это не так эффективно с мини-пакетом (Spark)? Почему неэффективно запускать мини-пакет с задержкой в 1 миллисекунду? Пакетная обработка - это метод, который используется повсюду, включая ОС и стек TCP / IP ядра, где данные на диск или в сеть действительно буферизуются, поэтому Какой здесь убедительный фактор, чтобы сказать, что один более эффективен, чем другой?