Tensorflow: когда я загружаю сохраненную модель и использую прогноз, это дает действительно плохие результаты. Почему? (Я использую API оценщика)

Я использую API-интерфейс оценщика для обучения CNN, который классифицирует изображения фигур.

Я могу успешно обучать CNN с помощью пользовательского input_fn (), который обучается из файла tfrecord. Затем я могу предсказать, используя model.predict (pred_input_fn). Точность через несколько эпох составляет> 80%, а затем, когда я использую model.predict () для некоторых тестовых данных. Я тоже получаю> 80%. Так что, похоже, все работает нормально.

Я хотел сохранить модель, а затем загрузить модель и прогнозировать, используя это, потому что это моя цель. Итак, в основном вывод. Когда я делаю это и прогнозирую на основе своих тестовых данных, я получаю ужасные результаты. Я удалил всю предварительную обработку из моего input_fn () и переучился. Так что я, по сути, передаю необработанные данные при прогнозировании. Проблема не устранена. Я хотел бы знать, почему это происходит или я что-то делаю не так. Спасибо за любые идеи.

Свяжу соответствующий код My model_fn

def model_fn(features, labels, mode, params):

    x = features['image_raw']  
    net = tf.reshape(x, [-1, 824, 463, num_channels])
    net = tf.layers.conv2d(inputs=net, name='layer_conv1',
                           filters=32, kernel_size=11, strides=4,
                           padding='same', activation=tf.nn.relu)
    net = tf.layers.conv2d(inputs=net, name='layer_conv2',
                           filters=32, kernel_size=11, strides=4,
                           padding='same', activation=tf.nn.relu)
    net = tf.layers.conv2d(inputs=net, name='layer_conv3',
                           filters=32, kernel_size=5, strides=2,
                           padding='same', activation=tf.nn.relu)
    net = tf.layers.max_pooling2d(inputs=net, pool_size=2, strides=2,padding='SAME')    
    net = tf.layers.conv2d(inputs=net, name='layer_conv4',
                           filters=32, kernel_size=3,
                           padding='same', activation=tf.nn.relu)
    net = tf.contrib.layers.flatten(net)
    net = tf.layers.dense(inputs=net, name='layer_fc1',
                          units=256, activation=tf.nn.relu)
    net = tf.nn.dropout(net, 0.5)
    net = tf.layers.dense(inputs=net, name='layer_fc_2',
                          units=num_classes)
    logits = net
    y_pred = tf.nn.softmax(logits=logits)
    y_pred_cls = tf.argmax(y_pred, axis=1)
    if mode == tf.estimator.ModeKeys.PREDICT:
        export_outputs = {'classes': tf.estimator.export.PredictOutput({"classes": y_pred_cls})}

        spec = tf.estimator.EstimatorSpec(mode=mode,predictions=y_pred_cls,export_outputs=export_outputs)
    else:

        cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=labels,logits=logits)

        loss = tf.reduce_mean(cross_entropy)

        optimizer = tf.train.AdamOptimizer(learning_rate=0.001,beta1=0.9,beta2=0.999,epsilon=1e-8,name="Adam")

        train_op = optimizer.minimize(loss=loss, global_step=tf.train.get_global_step())

        metrics = {"accuracy": tf.metrics.accuracy(labels, y_pred_cls)}     
        # Wrap all of this in an EstimatorSpec.
        spec = tf.estimator.EstimatorSpec(
            mode=mode,
            loss=loss,
            train_op=train_op,
            eval_metric_ops=metrics
            )      
    return spec

Моя функция обслуживания:

def serving_input_receiver_fn(): 
  inputs = {"image_raw": tf.placeholder(shape=[824, 463], dtype=tf.float32)}
  return tf.estimator.export.ServingInputReceiver(inputs, inputs)

Как я сохраняю свою обученную модель:

export_dir = model.export_savedmodel(
    export_dir_base="./saved_model/",
    serving_input_receiver_fn=serving_input_receiver_fn,
    as_text=True) 

Как я предсказываю по сохраненной модели:

from tensorflow.contrib import predictor
predict_fn = predictor.from_saved_model('./saved_model/1518601120/')
a = np.ones(shape=(824,463),dtype=np.float32)    
image = Image.open((os.path.join(prediction_dir,subdir,file)))
image = np.array(image)
image=image.swapaxes(0,1)
a[:,:]=image[:,:,0]  #The input is an RGBa PNG. only 1 channel is populated #with data from our shape.
prediction = predict_fn({"image_raw": a})
predictions.append((prediction['classes'][0]))

person D. Rusk    schedule 14.02.2018    source источник


Ответы (1)


Оказывается, я передавал функции прогнозирования тензор с замененной высотой шириной. Это было нормально, потому что мой заполнитель был той же формы. Но как только тензор вошел в мою модель_fn (), он был преобразован в размер ширины высоты. Заставить изображение "сжаться" перед тем, как пропустить его через модель. Это приводило к плохим результатам прогнозов, которые у меня были.

person D. Rusk    schedule 26.02.2018