Вопросы по теме 'similarity'

Вычисление сходства -> код Python с кодом php — что не так?
Я пытаюсь преобразовать следующий код Python в код PHP. Не могли бы вы объяснить мне, что не так в моем PHP-коде, потому что я не получаю таких же результатов. Если вам нужны примеры данных, пожалуйста, дайте мне знать. # Returns a...
378 просмотров
schedule 26.11.2023

Сравнение расстояния между массивами?
Как сравнить сходство между двумя массивами? Скажем, у меня есть: Base Array: [.5,0,0,0,.25,0,0,.25,0,0,0,0] Array 1: [1,0,0,0,1,0,0,1,0,0,0,0] Array 2: [0,0,1,0,0,0,1,0,0,1,0,0] Array 3: [1,0,0,0,0,0,0,0,0,0,0,0] Что касается приведенных...
2428 просмотров
schedule 24.01.2024

Надлежащая мера подобия для кластеризации
У меня проблемы с поиском правильной меры сходства для кластеризации. У меня есть около 3000 массивов наборов, где каждый набор содержит функции определенного домена (например, число, цвет, дни, алфавиты и т. д.). Я объясню свою проблему на примере....
483 просмотров

Вычислить сходство между двумя списками
Я хотел бы вычислить сходство между двумя списками разной длины. eg: listA = ['apple', 'orange', 'apple', 'apple', 'banana', 'orange'] # (length = 6) listB = ['apple', 'orange', 'grapefruit', 'apple'] # (length = 4) как видите, один и тот...
22150 просмотров
schedule 01.02.2024

Реализация Левенштейна на записях базы данных с использованием python
Как реализовать расстояние Левенштейна для записей в таблице базы данных с помощью python? Я знаю, как связать python с базой данных, кодирование на python может не быть проблемой, и у меня также есть записи в таблице базы данных. Я понимаю теорию и...
405 просмотров
schedule 14.11.2022

Сравните сходство сущностей разной длины в IDL
Итак, у меня есть массив объектов. Каждый объект имеет вектор координат x и y в пикселях. Мне нужно эффективно пройти и сравнить их друг с другом и сказать, что это одно и то же. (Они распределены по нескольким временным рамкам, поэтому...
137 просмотров

Более быстрая кластеризация подобия в python
У меня есть коллекция из нескольких тысяч строк (последовательностей ДНК). Я хочу сократить это число до пары сотен (точное число не критично), исключив очень похожие последовательности. Я могу сделать это с помощью сопоставления с помощью модуля...
907 просмотров
schedule 14.02.2024

Быстрая оценка схожести изображений
Я хочу сравнить изображения, чтобы дать своего рода оценку сходства с целевым изображением, как в приведенном ниже примере (оценки просто выбраны, чтобы дать представление о том, какое сходство мне нужно). Оценки представляют собой своего рода...
757 просмотров
schedule 01.01.2024

Создание матрицы сходства с использованием пустой таблицы и функции R
Заранее благодарю вас за то, что нашли время, чтобы помочь мне с этим вопросом. Я использую пакет R, который содержит функцию, которая вычисляет показатель сходства между двумя терминами. В терминале R это легко. Я просто загружаю библиотеку и...
330 просмотров
schedule 29.01.2024

R Попарное сравнение столбцов матрицы без учета пустых значений
У меня есть массив, для которого я хотел бы получить меру сходства между значениями в каждом столбце. Под этим я подразумеваю, что хочу сравнить строки между попарными столбцами массива и увеличить меру, когда их значения совпадают. Тогда...
215 просмотров
schedule 07.12.2023

SQLite объединяет значения похожих записей в одну
В моей базе данных SQLite у меня есть таблица Tracks, которая состоит из следующих столбцов: исполнитель, трек, жанр1, жанр2, жанр3. Таблица содержит много значений, которые имеют одинаковые значения исполнителя и трека с разными значениями жанра1,...
115 просмотров
schedule 10.12.2022

jaccard (или любой аналогичный) индекс в строках data.frame в R
Я надеюсь, что вы можете помочь мне в проблеме, над которой я ломаю голову. У меня есть data.frame с тремя столбцами: appl , cod , ipc . Этот набор данных имеет несколько строк с одним и тем же appl , каждая строка соответствует одному cod ,...
846 просмотров
schedule 12.02.2024

хеширование больших последовательностей чисел, создание наборов хэшей, хранение и сравнение сходства наборов с использованием python
Я пытаюсь найти лучший способ сравнить большие наборы числовых последовательностей с другими большими наборами, чтобы ранжировать их друг против друга. Может быть, следующий игрушечный пример проясняет проблему, где списки a, b и c представляют...
92 просмотров
schedule 13.01.2024

Чем минхеш выгоднее симхэша?
Я работаю с simhash, но также вижу, что minhash более эффективен. Но я не понимаю. Пожалуйста, объясните мне: что более выгодно minhash по сравнению с simhash?
951 просмотров

Как вычислить сходство жаккарда из кадра данных pandas
У меня есть кадр данных следующим образом: форма кадра (1510, 1399). Столбцы представляют продукты, строки представляют значения (0 или 1), назначенные пользователем для данного продукта. Как я могу вычислить jaccard_similarity_score? Я...
26921 просмотров
schedule 27.02.2024

Рекомендуемые алгоритмы подобия слов
Я изучаю жизнеспособные алгоритмы/решения для реализации и решения следующей проблемы: подбор пользователей на основе их общих интересов Пример: U1: лыжи, азиатская культура, медитация, java, крипто U2: йога, медитация, менеджмент, советы...
584 просмотров
schedule 02.11.2022

Есть ли альтернатива `difflib.get_close_matches()`, которая возвращает индексы (позиции в списке) вместо списка строк?
Я хочу использовать что-то вроде difflib.get_close_matches , но вместо наиболее похожие строки, я хотел бы получить индексы (т.е. позицию в списке). Индексы списка более гибкие, потому что можно связать индекс с другими структурами данных...
3987 просмотров
schedule 23.02.2024

Как сгенерировать оценку сходства для двух документов
Я хотел бы сравнить два документа семантически и получить оценку сходства. Следующие документы взяты из Википедии, и при их сравнении я ожидаю увидеть более высокий балл для world_1 и world_2, поскольку они имеют схожий контекст. Будет ли хорошим...
28 просмотров

R: Извлечь синтаксически похожие записи набора данных [дубликаты]
У меня есть большой набор данных, который включает несколько сотен названий компаний и выглядит примерно так: Name: Earth Ltd. Rocket International LLC Space Corp LLC Space Corporation LLc Space International Corporation Ltd Satellite Global...
29 просмотров
schedule 17.04.2024