Создание нескольких наборов случайных неперекрывающихся интервалов в пределах диапазона

В пределах определенного диапазона целых чисел [a, b] я хотел бы создать n списки, каждый из которых состоит из z неперекрывающихся случайных интервалов с минимальной шириной интервала w. Условие неперекрытия следует понимать в рамках одного такого списка.

Пример для a=0, b=100, n=4, z=3, w=5:

1. [ [1, 17], [57, 83], [89, 98] ]
2. [ [5, 23], [42, 49], [60, 78] ]
3. [ [70, 76], [80, 89], [93, 99] ]
4. [ [20, 62], [67, 81], [82, 93] ]

В настоящий момент я использую numpy.linspace, чтобы возвращать равномерно распределенные значения в [a,b] интервале для левых границ интервала, затем вводю небольшое случайное изменение для каждого из этих значений. Затем внутри двух таких границ я пытаюсь разместить правильные границы интервала, соблюдая требования минимальной ширины. Однако мой подход требует больших вычислительных ресурсов.

Каков наиболее эффективный способ достижения моей цели в Python?

AlexGuevara 11.02.2020 источник

comment

Разве не было бы лучше определить правильные границы (между w и пробелом до начала следующего интервала) и затем добавить вариацию, так как вы будете знать предел того, сколько добавить с введением перекрытия? - Scott Hunter 11.02.2020

comment

Или еще лучше: сначала выберите размеры интервалов, затем разместите их по порядку, случайным образом выбирая из неиспользуемого пространства то, что находится между ними. - Scott Hunter 11.02.2020

comment

@ScottHunter, спасибо за хорошее предложение! - AlexGuevara 11.02.2020

Ответы (4)

arrow_upward
3
arrow_downward

Вот набросок предлагаемого алгоритма:

Сгенерируйте z неотрицательные целые числа (целые числа 0 или больше) с суммой ((b-a)+1) - z*w. Я написал псевдокод для этого алгоритма, основанный на "Равномерной выборке из модуля" Смита и Тромбла. Симплекс ».
Добавьте w к каждому числу, сгенерированному таким образом. Это приводит к размеру z непрерывных интервалов кандидатов.
Создайте случайный подинтервал с минимальной длиной w внутри каждого интервала кандидата. Эти подинтервалы являются фактическим результатом работы алгоритма. Каждый подынтервал сдвигается соответственно на a и начало своего предполагаемого интервала.

Peter O. 11.02.2020

comment

Гарантирует ли это, что a всегда будет начинать первый интервал? Или что a + 1 будет? - Scott Hunter; 11.02.2020

arrow_upward
2
arrow_downward

Подход 1 - Наивная случайная генерация

Это неэффективный, но простой подход - возьмите z*2 случайные целые числа из range(a, b), отсортируйте их, объедините в пары и проверьте, все ли интервалы больше или равны w. Повторите это n раз.

Обратите внимание, что это будет неэффективно, когда z*w близко к len(range(a, b)). Я подумал о смягчении этого, добавив вспомогательную функцию для генерации случайного nth интервала, который позволил бы создать оставшиеся z-n интервалов - путем выбора индексов из range(a, b-w*(z-n)), но это сталкивается с проблемой, что интервалы, выбранные первыми, будут смещены в сторону более длинных .

Код:

def list_to_pairs(l):
    return [l[i:i+2] for i in range(0, len(l), 2)]

def f(z, w, a, b):
    intervals = [(0,0)]
    while not all(x[1]-x[0] >= w for x in intervals):
        intervals = list_to_pairs(sorted(random.sample(range(a, b), z*2)))
    return intervals

def get_lists(n, z, w, a, b):
    return [f(z, w, a, b) for _ in range(n)]

Вывод:

>>> get_lists(4, 3, 5, 0, 100)
[[[0, 17], [22, 46], [62, 98]],
 [[10, 32], [61, 66], [72, 81]],
 [[2, 31], [63, 68], [77, 87]],
 [[5, 20], [34, 55], [58, 86]]]

Подход 2

@Peter O. изложил лучший алгоритм, который не полагается на интервалы случайного выбора, которые я закодировал ниже с несколькими незначительными логика меняется.

Код:

def positive_integers_with_sum(n, total):
    ls = [0]
    rv = []
    while len(ls) < n:
        c = random.randint(0, total)
        ls.append(c)
    ls = sorted(ls)
    ls.append(total)
    for i in range(1, len(ls)):
        rv.append(ls[i] - ls[i-1])
    return rv

def f(z, w, a, b):
    rv = []
    indices = [x+w for x in positive_integers_with_sum(z, (b-a)-z*w)]
    start = a
    for i in indices:
        i_start = random.randint(start, i+start-w)
        i_end = random.randint(max(i_start+w, i+start-w), i+start)
        rv.append([i_start, i_end - 1])
        start+=i
    return rv

def get_lists(n, z, w, a, b):
    return [f(z, w, a, b) for _ in range(n)]

Вывод:

>>> get_lists(5, 3, 5, 0, 15)
[[[0, 4], [5, 9], [10, 14]],
 [[0, 4], [5, 9], [10, 14]],
 [[0, 4], [5, 9], [10, 14]],
 [[0, 4], [5, 9], [10, 14]],
 [[0, 4], [5, 9], [10, 14]]]

>>> get_lists(4, 3, 5, 0, 100)
[[[45, 72], [74, 79], [92, 97]],
 [[18, 23], [39, 44], [77, 97]],
 [[12, 31], [37, 53], [83, 95]],
 [[13, 46], [62, 87], [94, 100]]]

Средние размеры за интервал:

rv = [[],[],[]]

for i in range(100000):
    t = f(3,5,0,100)
    for i in range(3):
        rv[i].append(abs(t[i][1] - t[i][0]))

Вывод:

>>> np.mean(rv, axis=1)
array([16.10771, 16.35467, 16.21329])

CDJB 11.02.2020

arrow_upward
0
arrow_downward

Один из вариантов для одного набора интервалов (остальные генерируются аналогично). Просто, но не очень эффективно: 1. Создайте набор значений z между a и b. В вашем случае это [x1, x2, x3] (отсортировано по возрастанию) 2. Преобразуйте его в список интервалов: [[x1, x1], [x2, x2], [x3, x3]]] 3. Цикл по каждому интервалу: если его нижняя граница на 1 больше верхней границы предыдущего интервала - увеличьте его верхнюю границу. Иначе, если его верхняя граница на 1 меньше нижней границы следующего интервала - уменьшите его нижний интервал. Если ни одно из этих условий не соблюдается - раздвиньте интервал в любую сторону. Если оба соблюдены - ой, неудача, попробуйте еще раз с пункта 1. 4. Повторяйте шаг 3, пока все интервалы не станут минимальной шириной W, и несколько (случайное число) раз после

Hyyudu 11.02.2020

arrow_upward
0
arrow_downward

Вот версия, которая строит интервалы таким образом, чтобы они соответствовали спецификациям (так что никогда не нужно «продолжать выбирать случайные значения, пока вам не повезет»):

from random import randint
def one_list( a, b, z, w ):
    # How many numbers we have to work with
    nums = b - a - 1 
    # Minimum number of values that will be in some interval
    used = w*z
    # Number of additional values in some interval
    extra = randint( 0, nums - used )
    # Number of values not in any interval
    unused = nums - used - extra
    ans = []
    for _ in range(z):
        # How many values to skip over
        skip = randint(0,unused)
        a += skip
        unused -= skip
        # How many more than minimum to put in next interval
        plus = randint(0,extra)
        ans.append([a,a+w-1+plus])
        a += (w+plus)
        extra -= plus
    return ans

Scott Hunter 11.02.2020

comment

Этот подход попадает в ловушку, которую я пытался избежать путем случайной генерации интервалов - средний размер интервалов искажается так, что более ранние интервалы будут больше. В течение 100000 тестов с использованием примера в OP средние размеры сгенерированных интервалов составили ~ [25.05, 14.53, 9.24]. - CDJB; 11.02.2020

comment

Настройте генераторы случайных чисел по своему вкусу. - Scott Hunter; 11.02.2020

Создание нескольких наборов случайных неперекрывающихся интервалов в пределах диапазона

Ответы (4)

Подход 1 - Наивная случайная генерация

Подход 2

Похожие вопросы