Комбинатори за анализатор на Scala: анализирайте по редове

Използването на библиотека с комбинатори на парсер на Scala възможно ли е да се анализира по редове, а не по знаци? Бих искал персонализираните ми анализатори да имат подпис

(in: Reader[String]) => ParserResult[T]

така че String in.first ще бъде ред текст, а in.rest - останалите редове.

Предполагам, че трябва да подкласифицирам Parsers и да дефинирам типа Elem като String. След това имплементирайте Reader[String], за да разделите входа на редове. Чудя се правилният подход ли е? Има ли други решения?


person Tvaroh    schedule 12.10.2013    source източник


Отговори (1)


Следният код прави това:

import scala.util.parsing.combinator.Parsers
import scala.util.parsing.input.{Position, Reader}

object Main {
  def main(args: Array[String]): Unit = CVParser("one\ntwo\nthree")
}

object CVParser {
  def apply(in: String): Any = impl.parse(in)

  private object impl extends Parsers {
    override type Elem = String

    def parse(in: String): ParseResult[String~String~String] = {
      val reader = new ByLineReader(in.split(System.lineSeparator).toList, 1)
      grammar(reader)
    }

    // private

    private val grammar = SampleParser ~ SampleParser ~ SampleParser

    private class ByLineReader(lines: List[String], lineNo: Int) extends Reader[String] {
      override def first: String = lines.headOption getOrElse ""
      override def rest: Reader[String] =
        if (!lines.isEmpty) new ByLineReader(lines.tail, lineNo + 1)
        else new ByLineReader(lines, lineNo)
      override def pos: Position = new Position {
        def line: Int = lineNo
        def column: Int = 0
        def lineContents: String = first
      }
      override def atEnd: Boolean = lines.size == 1
    }

    private object SampleParser extends Parser[String] {
      def apply(in: Input): ParseResult[String] = {
        println(in.first + "\n---------")
        Success(in.first, in.rest)
      }
    }
  }
}

Изходи:

one
---------
two
---------
three
---------

Сега нови парсери, които приемат ред текст, могат да бъдат написани и комбинирани с помощта на обичайните комбинатори на парсери, като ~, ~>, ‹~, |, rep и т.н.

person Tvaroh    schedule 14.10.2013