Вопросы по теме 'similarity'
Вычисление сходства -> код Python с кодом php — что не так?
Я пытаюсь преобразовать следующий код Python в код PHP. Не могли бы вы объяснить мне, что не так в моем PHP-коде, потому что я не получаю таких же результатов. Если вам нужны примеры данных, пожалуйста, дайте мне знать.
# Returns a...
378 просмотров
schedule
26.11.2023
Сравнение расстояния между массивами?
Как сравнить сходство между двумя массивами? Скажем, у меня есть:
Base Array: [.5,0,0,0,.25,0,0,.25,0,0,0,0]
Array 1: [1,0,0,0,1,0,0,1,0,0,0,0]
Array 2: [0,0,1,0,0,0,1,0,0,1,0,0]
Array 3: [1,0,0,0,0,0,0,0,0,0,0,0]
Что касается приведенных...
2428 просмотров
schedule
24.01.2024
Надлежащая мера подобия для кластеризации
У меня проблемы с поиском правильной меры сходства для кластеризации. У меня есть около 3000 массивов наборов, где каждый набор содержит функции определенного домена (например, число, цвет, дни, алфавиты и т. д.). Я объясню свою проблему на примере....
483 просмотров
schedule
16.12.2023
Вычислить сходство между двумя списками
Я хотел бы вычислить сходство между двумя списками разной длины.
eg:
listA = ['apple', 'orange', 'apple', 'apple', 'banana', 'orange'] # (length = 6)
listB = ['apple', 'orange', 'grapefruit', 'apple'] # (length = 4)
как видите, один и тот...
22150 просмотров
schedule
01.02.2024
Реализация Левенштейна на записях базы данных с использованием python
Как реализовать расстояние Левенштейна для записей в таблице базы данных с помощью python? Я знаю, как связать python с базой данных, кодирование на python может не быть проблемой, и у меня также есть записи в таблице базы данных. Я понимаю теорию и...
405 просмотров
schedule
14.11.2022
Сравните сходство сущностей разной длины в IDL
Итак, у меня есть массив объектов. Каждый объект имеет вектор координат x и y в пикселях.
Мне нужно эффективно пройти и сравнить их друг с другом и сказать, что это одно и то же. (Они распределены по нескольким временным рамкам, поэтому...
137 просмотров
schedule
02.01.2024
Более быстрая кластеризация подобия в python
У меня есть коллекция из нескольких тысяч строк (последовательностей ДНК). Я хочу сократить это число до пары сотен (точное число не критично), исключив очень похожие последовательности.
Я могу сделать это с помощью сопоставления с помощью модуля...
907 просмотров
schedule
14.02.2024
Быстрая оценка схожести изображений
Я хочу сравнить изображения, чтобы дать своего рода оценку сходства с целевым изображением, как в приведенном ниже примере (оценки просто выбраны, чтобы дать представление о том, какое сходство мне нужно). Оценки представляют собой своего рода...
757 просмотров
schedule
01.01.2024
Создание матрицы сходства с использованием пустой таблицы и функции R
Заранее благодарю вас за то, что нашли время, чтобы помочь мне с этим вопросом.
Я использую пакет R, который содержит функцию, которая вычисляет показатель сходства между двумя терминами. В терминале R это легко. Я просто загружаю библиотеку и...
330 просмотров
schedule
29.01.2024
R Попарное сравнение столбцов матрицы без учета пустых значений
У меня есть массив, для которого я хотел бы получить меру сходства между значениями в каждом столбце. Под этим я подразумеваю, что хочу сравнить строки между попарными столбцами массива и увеличить меру, когда их значения совпадают. Тогда...
215 просмотров
schedule
07.12.2023
SQLite объединяет значения похожих записей в одну
В моей базе данных SQLite у меня есть таблица Tracks, которая состоит из следующих столбцов: исполнитель, трек, жанр1, жанр2, жанр3. Таблица содержит много значений, которые имеют одинаковые значения исполнителя и трека с разными значениями жанра1,...
115 просмотров
schedule
10.12.2022
jaccard (или любой аналогичный) индекс в строках data.frame в R
Я надеюсь, что вы можете помочь мне в проблеме, над которой я ломаю голову.
У меня есть data.frame с тремя столбцами: appl , cod , ipc . Этот набор данных имеет несколько строк с одним и тем же appl , каждая строка соответствует одному cod ,...
846 просмотров
schedule
12.02.2024
хеширование больших последовательностей чисел, создание наборов хэшей, хранение и сравнение сходства наборов с использованием python
Я пытаюсь найти лучший способ сравнить большие наборы числовых последовательностей с другими большими наборами, чтобы ранжировать их друг против друга. Может быть, следующий игрушечный пример проясняет проблему, где списки a, b и c представляют...
92 просмотров
schedule
13.01.2024
Чем минхеш выгоднее симхэша?
Я работаю с simhash, но также вижу, что minhash более эффективен. Но я не понимаю. Пожалуйста, объясните мне: что более выгодно minhash по сравнению с simhash?
951 просмотров
schedule
13.10.2022
Как вычислить сходство жаккарда из кадра данных pandas
У меня есть кадр данных следующим образом: форма кадра (1510, 1399). Столбцы представляют продукты, строки представляют значения (0 или 1), назначенные пользователем для данного продукта. Как я могу вычислить jaccard_similarity_score?
Я...
26921 просмотров
schedule
27.02.2024
Рекомендуемые алгоритмы подобия слов
Я изучаю жизнеспособные алгоритмы/решения для реализации и решения следующей проблемы: подбор пользователей на основе их общих интересов
Пример: U1: лыжи, азиатская культура, медитация, java, крипто U2: йога, медитация, менеджмент, советы...
584 просмотров
schedule
02.11.2022
Есть ли альтернатива `difflib.get_close_matches()`, которая возвращает индексы (позиции в списке) вместо списка строк?
Я хочу использовать что-то вроде difflib.get_close_matches , но вместо наиболее похожие строки, я хотел бы получить индексы (т.е. позицию в списке).
Индексы списка более гибкие, потому что можно связать индекс с другими структурами данных...
3987 просмотров
schedule
23.02.2024
Как сгенерировать оценку сходства для двух документов
Я хотел бы сравнить два документа семантически и получить оценку сходства. Следующие документы взяты из Википедии, и при их сравнении я ожидаю увидеть более высокий балл для world_1 и world_2, поскольку они имеют схожий контекст.
Будет ли хорошим...
28 просмотров
schedule
18.12.2023
R: Извлечь синтаксически похожие записи набора данных [дубликаты]
У меня есть большой набор данных, который включает несколько сотен названий компаний и выглядит примерно так:
Name:
Earth Ltd.
Rocket International LLC
Space Corp LLC
Space Corporation LLc
Space International Corporation Ltd
Satellite Global...
29 просмотров
schedule
17.04.2024