Как да изградите termdocumentmatrix в R

Чудех се дали е възможно да се изгради TermdocumentMatrix без да се използва пакетът tm.

Мислех да използвам два for цикъла в комбинация с grep, но за съжаление не успях да създам нещо полезно.

    matrix <- matrix(, nrow=length(lvector), ncol=length(lvector))



for(i in 1:length(lvector))
{
  for(j in 1:length(l))
  {
    lijst <- grep(lvector[i],l[j])
    if (length(lijst)==0)
    {
      matrix[i,j] == 0
    }
    else 
    {
      matrix[i,j] == 1
    }

  }
}

Thx предварително


person Olivier Thierie    schedule 16.03.2015    source източник
comment
Защо бихте искали да направите това? Предполагам, че пакетът qdap също е забранен?   -  person lawyeR    schedule 16.03.2015


Отговори (1)


FWIW, ето един начин:

get.dtm <- function(txts) {
  require(plyr)
  dtm <- do.call(rbind.fill.matrix, lapply(txts, function(txt) t(table(scan(file = textConnection(txt), what = "character", quiet = TRUE)))))
  dtm[is.na(dtm)] <- 0
  return(dtm)
}
get.dtm(c("this is a text text", "this is just another text"))
#      a is text this another just
# [1,] 1  1    2    1       0    0
# [2,] 0  1    1    1       1    1
person lukeA    schedule 16.03.2015