Вопросы по теме 'conv-neural-network'
Caffe, как предсказывать по предварительно обученной сети
Я использую этот код для загрузки своей сети:
net = caffe.Classifier(MODEL_FILE, PRETRAINED,
mean=np.load(caffe_root + 'python/caffe/imagenet/ilsvrc_2012_mean.npy').mean(1).mean(1),
channel_swap=(2,1,0),...
5156 просмотров
schedule
07.11.2023
Что такое допустимый диапазон ввода для сверточной нейронной сети?
Я использую архитектуру CONV-maxpool-CONV-maxpool-CONV-maxpool-CONV-maxpool-hidden-logistic для приложения обнаружения изображений. Хотя большинство примеров нормализуют интенсивность изображения до диапазона [0,1]. Но это кажется нехорошим, потому...
699 просмотров
schedule
23.12.2023
Как создать обучающие данные CaffeDB для сиамских сетей из каталога изображений
Мне нужна помощь, чтобы создать CaffeDB для сиамского CNN из простого каталога с изображениями и текстовым файлом метки. Лучше всего это сделать с помощью python. Проблема не в том, чтобы пройтись по каталогу и составить пары изображений. Моя...
3933 просмотров
schedule
31.10.2023
torch7: установка переменной скорости обучения для разных слоев Conv-net
Я пытаюсь настроить конвенцию. Он имеет следующую структуру (адаптировано из OverFeat ):
net:add(SpatialConvolution(3, 96, 7, 7, 2, 2))
net:add(nn.ReLU(true))
net:add(SpatialMaxPooling(3, 3, 3, 3))
net:add(SpatialConvolutionMM(96,...
535 просмотров
schedule
04.04.2024
Использование слоя softmax внутри самой целевой функции
Это будет долго и сложно описывать, поэтому заранее приношу свои извинения.
У меня есть обычная сеть типа CNN со стандартными слоями MLP поверх нее. На вершине MLP у меня также есть слой softmax, однако, в отличие от обычных сетей, он НЕ полностью...
250 просмотров
schedule
29.01.2024
Реализация совместного обучения в keras
Я пытаюсь реализовать модель, состоящую из двух слоев, чтобы сегментировать объекты-кандидаты в керасах. Итак, в основном эта модель имеет следующую архитектуру
Изображение (канал, ширина, высота) -> несколько слоев свертки и объединения -> вывод...
967 просмотров
schedule
07.11.2023
Почему в примере тензорного потока cifar10 на сверточных слоях вес не снижается?
Похоже, что на сверточных слоях в cifar10 пример на тензорном потоке. На самом деле ни на каких слоях, кроме двух полносвязных слоев, вес не уменьшается. Это обычная практика? Я думал, что снижение веса применяется ко всем весам (кроме смещений)....
1361 просмотров
schedule
24.11.2023
Как выполнить обнаружение объектов с использованием функций CNN в тензорном потоке?
Я пытаюсь создать непрерывную унифицированную модель, которая обнаруживает (локализует) объект на изображении. Сам объект может быть многих типов, например «текст в дикой природе», но окружающие его особенности должны определять, где находится...
6747 просмотров
schedule
22.04.2024
Caffe classifocation.cpp всегда возвращает 100% вероятность
Я пытаюсь использовать пример классификации Caffe C++ (вот code ), чтобы классифицировать изображение с помощью рукописной цифры (я тренирую свой модель в базе данных MNIST), но всегда возвращает такие вероятности, как
[0, 0, 0, 1.000, 0, 0,...
309 просмотров
schedule
14.02.2024
Несколько простых вопросов, касающихся обучения CNN
Я читал, что при использовании CNN у нас должно быть примерно одинаковое количество выборок на класс. Я выполняю бинарную классификацию, обнаруживая пешеходов на заднем плане, поэтому 2 класса - это пешеходы и фон (на самом деле все, что не является...
44 просмотров
schedule
28.12.2023
Каковы наиболее важные шаги в построении нейронных сетей для обнаружения объектов? (НЕ КЛАССИФИКАЦИЯ)
Я работаю с машинным обучением уже несколько месяцев. Я использовал кафе и даркнет и теперь начну с теано. В машинном обучении есть две основные задачи: 1. Обнаружение и 2. Классификация. Хотя я понимаю, как создается или проектируется большинство...
127 просмотров
schedule
20.11.2022
Обучение CNN с использованием решателя cifar10
Я пытаюсь обучить CNN с помощью собственных данных, используя cifar10. сетевые слои. но когда я запускаю эту команду:
roishik@roishik-System-Product-Name:~/Desktop/caffe/caffe$ /home/roishik/Desktop/caffe/caffe/build/tools/caffe train --solver...
224 просмотров
schedule
22.11.2022
Заказ пакетной нормализации и отсева?
Первоначальный вопрос касался конкретно реализаций TensorFlow. Однако ответы относятся к реализациям в целом. Этот общий ответ также является правильным ответом для TensorFlow.
При использовании пакетной нормализации и выпадения в TensorFlow (в...
102475 просмотров
schedule
24.10.2022
Чем заменить слой softmax, если можно активировать более одного выхода?
Например, у меня есть CNN, который пытается предсказать числа из набора данных MNIST (код, написанный с использованием Keras). Он имеет 10 выходов, которые образуют слой softmax. Только один из выходов может быть верным (независимо для каждого...
4173 просмотров
schedule
14.06.2024
Как ограничить/округлить элементы тензора до 4 знаков после запятой на GPU в Torch?
Интересно, как я могу урезать точность тензоров на GPU до желаемых знаков после запятой? Я хочу ограничить элементы в тензоре 4 знаками после запятой, но кажется, что в Torch нет встроенной функции, чтобы сделать это эффективно и действенно....
1418 просмотров
schedule
09.04.2024
Можно ли реализовать градиентный спуск, как оптимизаторы, только с примером кода из обработки градиентов в TensorFlow?
Я смотрел пример кода для обработки градиентов, который есть в TensorFlow:
# Create an optimizer.
opt = GradientDescentOptimizer(learning_rate=0.1)
# Compute the gradients for a list of variables.
grads_and_vars = opt.compute_gradients(loss,...
995 просмотров
schedule
04.01.2024
что означает `control_flow_ops.with_dependencies` для tensoflow?
Я читаю код модели тензорного потока: https://github.com/tensorflow/models/blob/master/slim/train_image_classifier.py
Я очень смущен этой частью кода:
train_tensor = control_flow_ops.with_dependencies([update_op], total_loss,...
1503 просмотров
schedule
26.02.2024
Как совместно выучить две задачи на уровне предсказания?
Я обучил сеть двум разным модальным изображениям. Я передаю данные вместе в одном слое, но после этого это почти две параллельные сети, они не разделяют слой, и две задачи имеют разные наборы меток, поэтому у меня есть два разных уровня потерь и...
102 просмотров
schedule
19.11.2022
Странная схема проигрыша при использовании двух проигрышей в кафе
Я тренирую CNN в кафе и получаю следующую странную картину потерь:
I0425 16:38:58.305482 23335 solver.cpp:398] Test net output #0: loss = nan (* 1 = nan loss)
I0425 16:38:58.305524 23335 solver.cpp:398] Test net output #1:...
78 просмотров
schedule
28.11.2022
ValueError: Вход в `.fit()` должен иметь ранг 4. Получен массив с формой: (10, 20, 50, 50, 1)
Моя модель
model.add(Conv3D(nb_filters[0], kernel_dim1=nb_conv[0],
kernel_dim2=nb_conv[0], kernel_dim3=nb_conv[0],
input_shape=(20, 50, 50,1), activation='relu'))
model.add(MaxPooling3D(pool_size=(nb_pool[0], nb_pool[0], nb_pool[0])))...
5809 просмотров
schedule
25.11.2022