Есть ли способ оценить сложность произношения слова?

Я пытаюсь собрать коллекцию английских слов, которые трудно произносить.

Мне было интересно, есть ли какой-то алгоритм или теория, которые можно использовать, чтобы показать, насколько сложно произнести слово.

Вам кажется, что это можно вычислить?

Поскольку это кажется очень субъективным, позвольте мне сделать это более объективным, скажем, самые трудные слова для произнесения с помощью технологий преобразования текста в речь.


person Yasser1984    schedule 02.05.2012    source источник
comment
Кому сложнее?   -  person dweiss    schedule 03.05.2012
comment
Многие слова трудны для произношения программистам на Лиспе.   -  person Chris Taylor    schedule 03.05.2012
comment
Хотя решить эту проблему было бы очень интересно, тот факт, что в английском языке много слов-признаков... должно быть много жестко запрограммированных ожиданий.   -  person afuzzyllama    schedule 03.05.2012
comment
Из-за огромного количества слов в английском языке с огромным количеством источников я бы сказал, что вычислить это практически невозможно. Сравните ритм с Вустерширом или даже Фезерстоунво. Последнее произносится как Fanshaw. Тогда есть segue, который произносится как segway. Легко произносится, не очевидно из написания.   -  person    schedule 03.05.2012
comment
Подкупите местного логопеда, чтобы он дал вам список. Я уверен, что он или она справится лучше любого алгоритма.   -  person Sergey Kalinichenko    schedule 03.05.2012
comment
Я сделал вопрос немного более объективным, скажем, самые трудные слова для произнесения компьютером.   -  person Yasser1984    schedule 03.05.2012
comment
Это будет полностью зависеть от правил, встроенных в речевой алгоритм, если вы имеете в виду трудное правильное произношение. Или ты имеешь в виду, что произношение трудно произнести на языке, привязанном к языку?   -  person hatchet - done with SOverflow    schedule 03.05.2012
comment
Если вы найдете алгоритм для определения сложности произношения с помощью компьютера, этот же алгоритм, вероятно, будет применим для исправления компьютерного произношения, поэтому я не уверен, что такой алгоритм будет иметь смысл.   -  person Brian    schedule 03.05.2012
comment
См. stackoverflow.com/questions/11874274/pronounceability-algorithm/   -  person user7660047    schedule 25.04.2020


Ответы (4)


Одним из подходов было бы создание списка с двумя версиями каждого слова. Одно правильное написание, а другое - слово, написанное с использованием простейшего фонетического написания. Примените функцию расстояния к двум словам (например, расстояние Левенштейна http://en.wikipedia.org/wiki/Levenshtein_distance ). Чем больше расстояние между двумя словами, тем труднее слово будет произнести.

person hatchet - done with SOverflow    schedule 02.05.2012
comment
Это очень умно, мой друг! - person Yasser1984; 03.05.2012

Отличная проблема! Внезапно вы можете создать систему, которая содержит все буквы из фонетического алфавита и связанные веса между каждой комбинацией в зависимости от сложности (очень специфичная, поэтому может потребоваться тестирование нескольких людей и получение средних значений и т. д.), а затем список всех слов из словаря английского языка, хранящегося на диске, и вызывает сценарий, который циклически перебирает каждую запись и выполняет веб-скрапинг в Википедии на предмет фонетического правописания и ранжирует их сложность. Это может учитывать длину слова, а также сложность присоединения фонетики, а затем упорядочивать список в зависимости от сложности.

Вот что я бы попробовал сделать :P

person rflood89    schedule 02.05.2012

В некоторой степени...

Например, речевые программы используют систему фонетики, чтобы пытаться произносить слова.

Например, «хватка» будет разделена на:

Gr-A-Sp

Однако для иностранных слов (или слов, которые не соответствуют этому шаблону) необходимо вести списки исключений, например. Яхта

person Robbie Dee    schedule 02.05.2012
comment
Хорошо, какие слова трудно произнести большинству программ для преобразования текста в речь? - person Yasser1984; 03.05.2012

Предложение

К счастью, произношение как процесс зависит от двух факторов, в том числе:

  1. телефоны, составляющие слова, и расположение гласных и полугласных, т.е.

/a/,/ae/,/e/,/i/,/o/,/u/,/w/,/j/...

  1. длина слова.

первый относится к механике воспроизведения звука телефона, поскольку небная занавеска, щеки, язык должны быть изменены для воспроизведения различных звуков, связанных с отдельными телефонами, например, носовых и т. д. это затрудняет произношение некоторых слов, поскольку может потребоваться много движений. Обратитесь к книгам по фонетике, чтобы найти позиции произношения каждого телефона.

Алгоритм

a weighted spanning tree with weight being the difficulty of pronouncing two consecutive phones i.e l and r or /sh/ and /s/

удачи.

person Shadrack Kimutai    schedule 21.02.2013