Во-первых, я не совсем уверен, что это правильное место для публикации этого сообщения, поскольку, возможно, его следует разместить на форуме, более ориентированном на статистику. Однако, поскольку я планирую реализовать это с помощью R, я подумал, что лучше всего разместить это здесь. Прошу прощения, если я ошибаюсь.
Итак, я пытаюсь сделать следующее. Я хочу смоделировать данные для всего 250 000 наблюдений, присвоив непрерывное (нецелочисленное) значение в соответствии с оценкой плотности ядра, полученной из эмпирических данных (дискретных), с исходными значениями в диапазоне от -5 до +5. Вот график распределения, который я хочу использовать.
Для меня очень важно, чтобы я моделировал новые данные не на основе дискретных вероятностей, а на основе непрерывных, поскольку действительно важно, чтобы значение могло быть, скажем, 2,89, а не 3 или 2. Таким образом, новые значения будут назначаться на основе вероятности, изображенные на сюжете. Наиболее частое значение в смоделированных данных будет где-то около +2, тогда как значения около -4 и +5 будут довольно редкими.
Я довольно много читал о моделировании данных в R и о том, как работают оценки плотности ядра, но на самом деле я вообще не двигаюсь вперед. Итак, мой вопрос в основном состоит из двух шагов - как мне даже смоделировать данные (1) и, кроме того, как мне смоделировать данные, используя это конкретное распределение вероятностей (2)?
Заранее спасибо, я надеюсь, что вы, ребята, можете мне с этим помочь.