У меня есть два файла, первый (file1) содержит несколько rexeges, а другой (file2) содержит последовательности FASTA. Мое намерение состоит в том, чтобы использовать регулярное выражение в файле1, чтобы проверить, соответствуют ли они каким-либо последовательностям Fasta в файле2, и вывести все регулярные выражения, которые соответствуют хотя бы одной последовательности, с количеством последовательностей, которым они соответствуют. Я хотел бы предоставить свой пример кода, но я даже не мог начать. Пожалуйста помоги.
file1 структурирован таким образом, что каждая строка имеет идентификатор, за которым следует '>>', а затем регулярное выражение;
e.g FGER_HWW_PRT >> ..DW[ALK]..[^P]..[VI]{2,4}
TKAR_GLW_NQW >> [^VKR]{0,2}..FP[D].T.N.Q.
etc...
file2 имеет идентификатор последовательности в одной строке и последовательности в следующей строке;
e.g >lac9_B: details details
GFVTSDRWPALKMSRWSLEMVWASRGYPLVNDRMWSWSDDDP
>serP_A: otherdetails details2
GFVLSDPPPPALKMSRWSLEMVWASRGYPLVNDPWQRTKRKRKDRTCWASNYIHDRP
etc...
Заранее спасибо.