Перекрестные ссылки на два источника данных для совпадений в Excel 2010

Во-первых, спасибо, что проверили мой вопрос. Я новичок в том, чтобы делать что-то продвинутое в Excel, поэтому я немного потерялся.

Я пытаюсь сопоставить имена из двух разных источников с одинаковой структурой данных. Есть 3 столбца: LastName, FirstName, MiddleName. Я добавил четвертую строку, чтобы обозначить, из какой организации была получена запись, и поместил оба источника в одну таблицу и сделал из нее сводку, которая работает достаточно хорошо, но мне трудно генерировать из нее какие-либо полезные данные.

Есть две основные цели, как только я их сопоставил. Мне нужен процент совпадения. Мне нужно иметь возможность отфильтровывать те, которые совпали, чтобы я мог исследовать те, которые не совпали.

Вот небольшой пример.

+-------------+-----------+------------+------+
|  LastName   | FirstName | MiddleName | Org. |
+-------------+-----------+------------+------+
| Jones       | Mike      | Anthony    | Org1 |
| Black       | Marry     |            | Org1 |
| Zeek        | Winston   | E          | Org1 |
| Jones       | Mike      | A          | Org2 |
| Black-Smith | Marry     |            | Org2 |
| Zeek        | Winston   | E          | Org2 |
+-------------+-----------+------------+------+

Как вы можете видеть из списка, только Winston E Zeek действительно подходит, потому что все три имени абсолютно одинаковы. Майк Джонс не будет совпадать, потому что перечисленные средние имена неверны, а Блэк и Блэк-Смит не совпадут, потому что это технически разные фамилии. Эти проблемы с данными на данном этапе в порядке, потому что это именно то, что я пытаюсь идентифицировать с большим набором данных.

Может быть, Excel не лучший вариант для решения этой проблемы без использования VBA? Я не знаком с VBA, поэтому я еще не пробовал, и, к сожалению, у меня мало времени.

Как я могу решить эту проблему соответствия? Любая помощь и руководство будут оценены.


person Dre    schedule 07.01.2014    source источник


Ответы (1)


Вот быстрая идея:

  1. Отсортируйте данные по фамилии, имени, отчеству. Это должно ставить одинаковые/похожие имена рядом друг с другом.
  2. Добавьте столбец, который для каждой строки имеет функцию рабочего листа, например =IF(A3=A2,1,0). Это укажет, соответствует ли эта строка строке выше.
  3. Суммируйте новый столбец... Это покажет вам количество совпадений. Разделите на общее количество строк, чтобы получить свой процент.

Вы можете изменить функцию на шаге 2, чтобы указать желаемое совпадение.

Преимущество: не требуется VBA. Недостаток: требуется ручная работа и интерпретация.

person jeffrey_t_b    schedule 07.01.2014
comment
Спасибо за отзыв. Попробовав его, я решил, что в этой ситуации для меня на самом деле полезнее будет разворот. Я скопировал данные из сводки после того, как внес некоторые изменения и отфильтровал части результатов. Это все еще громоздко, но не хватает более продвинутого программирования, я думаю, что это лучшее, что я могу сделать. Спасибо еще раз. - person Dre; 08.01.2014