Вопросы по теме 'conv-neural-network'

Caffe, как предсказывать по предварительно обученной сети
Я использую этот код для загрузки своей сети: net = caffe.Classifier(MODEL_FILE, PRETRAINED, mean=np.load(caffe_root + 'python/caffe/imagenet/ilsvrc_2012_mean.npy').mean(1).mean(1), channel_swap=(2,1,0),...
5156 просмотров

Что такое допустимый диапазон ввода для сверточной нейронной сети?
Я использую архитектуру CONV-maxpool-CONV-maxpool-CONV-maxpool-CONV-maxpool-hidden-logistic для приложения обнаружения изображений. Хотя большинство примеров нормализуют интенсивность изображения до диапазона [0,1]. Но это кажется нехорошим, потому...
699 просмотров

Как создать обучающие данные CaffeDB для сиамских сетей из каталога изображений
Мне нужна помощь, чтобы создать CaffeDB для сиамского CNN из простого каталога с изображениями и текстовым файлом метки. Лучше всего это сделать с помощью python. Проблема не в том, чтобы пройтись по каталогу и составить пары изображений. Моя...
3933 просмотров

torch7: установка переменной скорости обучения для разных слоев Conv-net
Я пытаюсь настроить конвенцию. Он имеет следующую структуру (адаптировано из OverFeat ): net:add(SpatialConvolution(3, 96, 7, 7, 2, 2)) net:add(nn.ReLU(true)) net:add(SpatialMaxPooling(3, 3, 3, 3)) net:add(SpatialConvolutionMM(96,...
535 просмотров

Использование слоя softmax внутри самой целевой функции
Это будет долго и сложно описывать, поэтому заранее приношу свои извинения. У меня есть обычная сеть типа CNN со стандартными слоями MLP поверх нее. На вершине MLP у меня также есть слой softmax, однако, в отличие от обычных сетей, он НЕ полностью...
250 просмотров

Реализация совместного обучения в keras
Я пытаюсь реализовать модель, состоящую из двух слоев, чтобы сегментировать объекты-кандидаты в керасах. Итак, в основном эта модель имеет следующую архитектуру Изображение (канал, ширина, высота) -> несколько слоев свертки и объединения -> вывод...
967 просмотров

Почему в примере тензорного потока cifar10 на сверточных слоях вес не снижается?
Похоже, что на сверточных слоях в cifar10 пример на тензорном потоке. На самом деле ни на каких слоях, кроме двух полносвязных слоев, вес не уменьшается. Это обычная практика? Я думал, что снижение веса применяется ко всем весам (кроме смещений)....
1361 просмотров
schedule 24.11.2023

Как выполнить обнаружение объектов с использованием функций CNN в тензорном потоке?
Я пытаюсь создать непрерывную унифицированную модель, которая обнаруживает (локализует) объект на изображении. Сам объект может быть многих типов, например «текст в дикой природе», но окружающие его особенности должны определять, где находится...
6747 просмотров

Caffe classifocation.cpp всегда возвращает 100% вероятность
Я пытаюсь использовать пример классификации Caffe C++ (вот code ), чтобы классифицировать изображение с помощью рукописной цифры (я тренирую свой модель в базе данных MNIST), но всегда возвращает такие вероятности, как [0, 0, 0, 1.000, 0, 0,...
309 просмотров

Несколько простых вопросов, касающихся обучения CNN
Я читал, что при использовании CNN у нас должно быть примерно одинаковое количество выборок на класс. Я выполняю бинарную классификацию, обнаруживая пешеходов на заднем плане, поэтому 2 класса - это пешеходы и фон (на самом деле все, что не является...
44 просмотров

Каковы наиболее важные шаги в построении нейронных сетей для обнаружения объектов? (НЕ КЛАССИФИКАЦИЯ)
Я работаю с машинным обучением уже несколько месяцев. Я использовал кафе и даркнет и теперь начну с теано. В машинном обучении есть две основные задачи: 1. Обнаружение и 2. Классификация. Хотя я понимаю, как создается или проектируется большинство...
127 просмотров

Обучение CNN с использованием решателя cifar10
Я пытаюсь обучить CNN с помощью собственных данных, используя cifar10. сетевые слои. но когда я запускаю эту команду: roishik@roishik-System-Product-Name:~/Desktop/caffe/caffe$ /home/roishik/Desktop/caffe/caffe/build/tools/caffe train --solver...
224 просмотров

Заказ пакетной нормализации и отсева?
Первоначальный вопрос касался конкретно реализаций TensorFlow. Однако ответы относятся к реализациям в целом. Этот общий ответ также является правильным ответом для TensorFlow. При использовании пакетной нормализации и выпадения в TensorFlow (в...
102475 просмотров

Чем заменить слой softmax, если можно активировать более одного выхода?
Например, у меня есть CNN, который пытается предсказать числа из набора данных MNIST (код, написанный с использованием Keras). Он имеет 10 выходов, которые образуют слой softmax. Только один из выходов может быть верным (независимо для каждого...
4173 просмотров
schedule 14.06.2024

Как ограничить/округлить элементы тензора до 4 знаков после запятой на GPU в Torch?
Интересно, как я могу урезать точность тензоров на GPU до желаемых знаков после запятой? Я хочу ограничить элементы в тензоре 4 знаками после запятой, но кажется, что в Torch нет встроенной функции, чтобы сделать это эффективно и действенно....
1418 просмотров

Можно ли реализовать градиентный спуск, как оптимизаторы, только с примером кода из обработки градиентов в TensorFlow?
Я смотрел пример кода для обработки градиентов, который есть в TensorFlow: # Create an optimizer. opt = GradientDescentOptimizer(learning_rate=0.1) # Compute the gradients for a list of variables. grads_and_vars = opt.compute_gradients(loss,...
995 просмотров

что означает `control_flow_ops.with_dependencies` для tensoflow?
Я читаю код модели тензорного потока: https://github.com/tensorflow/models/blob/master/slim/train_image_classifier.py Я очень смущен этой частью кода: train_tensor = control_flow_ops.with_dependencies([update_op], total_loss,...
1503 просмотров

Как совместно выучить две задачи на уровне предсказания?
Я обучил сеть двум разным модальным изображениям. Я передаю данные вместе в одном слое, но после этого это почти две параллельные сети, они не разделяют слой, и две задачи имеют разные наборы меток, поэтому у меня есть два разных уровня потерь и...
102 просмотров

Странная схема проигрыша при использовании двух проигрышей в кафе
Я тренирую CNN в кафе и получаю следующую странную картину потерь: I0425 16:38:58.305482 23335 solver.cpp:398] Test net output #0: loss = nan (* 1 = nan loss) I0425 16:38:58.305524 23335 solver.cpp:398] Test net output #1:...
78 просмотров

ValueError: Вход в `.fit()` должен иметь ранг 4. Получен массив с формой: (10, 20, 50, 50, 1)
Моя модель model.add(Conv3D(nb_filters[0], kernel_dim1=nb_conv[0], kernel_dim2=nb_conv[0], kernel_dim3=nb_conv[0], input_shape=(20, 50, 50,1), activation='relu')) model.add(MaxPooling3D(pool_size=(nb_pool[0], nb_pool[0], nb_pool[0])))...
5809 просмотров