Почему «необязательно» в синтаксическом анализаторе может привести к ошибке

#parsec #parser-combinators #attoparsec #megaparsec

#parsec #синтаксический анализатор-комбинаторы #attoparsec #мегапарсек

Вопрос:

https://github.com/complyue/dcp это минимальный рабочий пример для повторения этой ошибки

 $ cabal run dcp:dcp < samples/basic.txt 
Up to date
dcp: 10:1:
   |
10 | method doXXX() pass
   | ^
unexpected 'm'
expecting ';'

CallStack (from HasCallStack):
  error, called at src/Parser.hs:149:14 in main:Parser
$ 
  

Я считаю, что это optionalSemicolon вызывает сбой:

https://github.com/complyue/dcp/blob/1df7ad590d78d4fa9a017eb53f9f265e291bdfa7/src/Parser.hs#L50-L54

   findIt = do
    -- ignore leading whitespaces and an optional semicolon in between
    nbsc >> optionalSemicolon >> nbsc
    -- try get a doc comment block
    getIt >>= case
  

И это определяется следующим образом:
https://github.com/complyue/dcp/blob/1df7ad590d78d4fa9a017eb53f9f265e291bdfa7/src/Parser.hs#L31-L32

 optionalSemicolon :: Parser Bool
optionalSemicolon = fromMaybe False <$> optional (True <$ symbol ";")
  

Я не могу объяснить, почему это может привести к сбою.

Ответ №1:

Оказывается, это потому symbol , что in optionalSemicolon ссылается sc , хотя этого не должно быть. Решается следующим образом:

https://github.com/complyue/dcp/commit/fd2df02f7218e59db2a732d5de74acedfefefaa2?branch=fd2df02f7218e59db2a732d5de74acedfefefaa2amp;diff=unified#diff-1785501875711a0bda12ba99505aa188659de4e35ad27d7fb819993bd8ec95bdL26-R145

  optionalComma :: Parser Bool
-optionalComma = fromMaybe False <$> optional (True <$ symbol ",")
 optionalComma = fromMaybe False <$> optional (True <$ string ",")
 
 optionalSemicolon :: Parser Bool
-optionalSemicolon = fromMaybe False <$> optional (True <$ symbol ";")
 optionalSemicolon = fromMaybe False <$> optional (True <$ string ";")