Заден план
Създайте вероятен лексикон въз основа на CSV файл с думи и суми. Това е прелюдия към проблем със сегментиране на текст, а не проблем с домашна работа.
проблем
Даден е CSV файл със следните думи и суми:
aardvark,10
aardwolf,9
armadillo,9
platypus,5
zebra,1
Създайте файл с вероятности спрямо най-големия резултат във файла:
aardvark,1
aardwolf,0.9
armadillo,0.9
platypus,0.5
zebra,0.1
Където например aardvark,1
се изчислява като aardvark,10/10
, а platypus,0.5
се изчислява като platypus,5/10
.
Въпрос
Кой е най-ефективният начин за внедряване на шел скрипт за създаване на файл с относителни вероятности?
Ограничения
- Нито думите, нито числата са в някакъв ред.
- Няма основни езици за програмиране (като Perl, Ruby, Python, Java, C, Fortran или Cobol).
- Стандартните Unix инструменти като
awk
,sed
илиsort
са добре дошли. - Всички вероятности трябва да са относителни към най-високата вероятност във файла.
- Думите са уникални, числата не са.
- Резултатите са естествени числа.
Благодаря ти!
bc
не е bashcalc, това е настолен калкулатор, тъй катоdc
е настолен калкулатор. - person Dennis Williamson   schedule 07.02.2011