У меня есть файл с ~ 10 000 строк, содержащий 2 столбца:
org_string1 \t replacement_string1
org_string2 \t replacement_string2
Каков наилучший способ (скорость/удобство) заменить все эти org_string на соответствующие им replace_string в другом текстовом файле (выполнив замену 10k во втором файле)?
Я планирую преобразовать их в команду подстановки sed, но не уверен в скорости работы и в том, превысит ли она максимальный предел командной строки в Linux.
Предположение:
- Все org_string и replace_string уникальны.
- org_string — это одно слово (окруженное пробелом) во входном файле.
sed
будет очень медленным, даже если вы дадите ему файл с 10ks/org_string1/replacement_string1/
строк. Я не пробовал Perl или Python с 10-тысячным словарем регулярных выражений и замен. - person   schedule 12.07.2016