Я работаю с данными, состоящими из числовых и категориальных признаков, где каждый ввод состоит из группы признаков переменного размера. Например: спрогнозируйте цену дома, используя характеристики каждой комнаты в доме, и в каждом доме может быть разное количество комнат. Признаками могут быть размер в метрах, тип (например, гостиная/ванная/спальня), цвет, пол... Некоторые из категориальных признаков имеют большое количество элементов, и я могу использовать много признаков. Я бы хотел использовать функции из n комнат, чтобы предсказать цену каждого дома. Как бы я структурировал свою модель inputs/nn, чтобы получать группы входов переменного размера?
Я думал об использовании горячего кодирования, но тогда у меня будут большие входные векторы, и я потеряю связи между функциями для каждой комнаты. Я также думал об использовании вложений, но я не уверен, как лучше всего объединить функции/образцы, чтобы правильно ввести все данные, не теряя информации о том, какие функции взяты из каких образцов и т. д.