Azure Cognitive Services Content Monitor не может обнаружить телефонные номера в Великобритании

Как поясняется в заголовке, я хочу использовать API-интерфейс модератора контента Azure Cognitive Services для обнаружения персональных данных, однако эта служба не будет обнаруживать телефонные номера в Великобритании.

Например, все допустимые форматы телефонных номеров в Великобритании не распознаются как PII:

  • 01хх ххх хххх
  • 020 хххх хххх
  • +44 хх ххх хххх
  • ххх хххх
  • 077xx хххххх

NB x — любое число [0–9], пробелы предназначены только для удобства чтения, их можно полностью опустить или использовать в произвольных местах.

Для репликации перейдите в консоль Content Moderator и введите номера телефонов в указанном выше формате, и они не будут обнаружены. Однако номер телефона в США, указанный в качестве примера, обнаруживается.

Есть ли какой-то параметр локализации, который мне не хватает, или он настроен только для телефонных номеров в США?


person Nick    schedule 15.10.2017    source источник
comment
Ник, я из команды Content Moderator. Поддержка определения номеров в Великобритании на самом деле находится в стадии тестирования и должна быть развернута на следующей неделе. Я обновлю эту тему, когда это произойдет. Из перечисленных вами примеров xxx xxxx не будет обнаружен, но другие будут. Кроме того, 020 xxx xxxx неверно. 020 xxxx xxxx является правильным форматом и будет обнаружен. Спасибо!   -  person Sanjeev Jagtap    schedule 10.01.2018


Ответы (2)


Ник,

Мы только что развернули обновление службы Content Moderator. Теперь он обнаруживает возможные телефонные номера в Великобритании.

См. обновленный обзор API и .NET quickstart для примера ввода и ответа JSON.

Также обратитесь к моему предыдущему комментарию к вашим примерам.

Дайте нам знать, если это соответствует вашим требованиям.

person Sanjeev Jagtap    schedule 24.01.2018

Я провел небольшой тест, чтобы увидеть, возможно ли это, и, по-видимому, это не так.

Я создал пользовательский список терминов со случайным номер телефона в нем. Затем я обновил поисковый индекс списка, а затем Я попытался сопоставить номер телефона в Великобритании с этим список.

Операция не вернула исходный телефон в качестве совпадения.

Однако я знаю, что соответствие нечеткое, поэтому, возможно, стоит попробовать добавить больше телефонных номеров в настраиваемый список. Поскольку для добавления N терминов в список требуется N вызовов API, я решил, что это не стоит затрат.

Код теста можно посмотреть здесь< /а>.

person Maria Ines Parnisari    schedule 24.10.2017
comment
Я отправил запрос на улучшение в команду Azure, и они сказали, что передали его соответствующей команде. Ваше решение будет работать, но, как вы говорите, заполнение и поддержка пользовательского списка потребует значительных затрат. Я просто хочу вернуть строки, которые выглядят как номера телефонов в Великобритании. Тот факт, что это уже сделано для телефонных номеров в США, означает, что технология уже существует, и кажется бессмысленным изобретать велосипед. - person Nick; 24.10.2017