У меня есть несколько больших текстовых файлов *.cvs, которые выглядят так:
Word,Tag,Lemma
Off,aa,off
short,aa,short
and,sfg3eþ,and
tall,sþghen,tall
deers,aþ,deer
in,never,in
Africa,nc,Africa
frv.,aa,frv.
---,ta,---
,,
All,nhfn,all
allowed,lhfnsf,allow
personell,c,personell
aggr.,lheþsf,aggr.
with,aþ,with
23,ta,23
as.,nvfn,as.
sillable.,lheþsf,sillable.
,,
Á,aþ,á
Мне нужно обработать этот файл так, чтобы первый столбец был помещен в список следующим образом:
{[Off short and tall deers in Africa frv],[All allowed personnel aggr. with 23 as syllable.],[Á......],...n]}
В самом конце должно быть: ]}
Что я пробовал:
awk 'BEGIN {FS=",";print"{["} /",,"/ {print"],["} END {print"]}"}' 079.cvs
Который просто печатает: {[ ]}
Я также нашел это:
cat 080.csv | cut -d ',' -f3 >>D.txt
Что на самом деле весьма полезно:
Off
short
and
tall
....
Но на самом деле это «глубокий» файл и отсутствуют элементы списка.