Разница между операторами Unicode и ASCII

#utf-8 #operators #ascii #raku

#utf-8 #операторы #ascii #raku

Вопрос:

Я обнаружил, что операторы Unicode и ASCII иногда работают по-разному при интерполяции кавычек.

Рассмотрим это:

 $ perl6 -e'my $a = BagHash.new: <a a a a b b b c c c c c d>;for $a.keys -> $k { say "$k => $a<<$k>>" }'

d => 1
b => 3
c => 5
a => 4
  

и это:

 $ perl6 -e'my $a = BagHash.new: <a a a a b b b c c c c c d>;for $a.keys -> $k { say "$k => $a«$k»" }'

c => c(5) a(4) b(3) d«c»
a => c(5) a(4) b(3) d«a»
b => c(5) a(4) b(3) d«b»
d => c(5) a(4) b(3) d«d»
  

Но это работает даже при использовании оператора Unicode:

 $ perl6 -e'my $a = BagHash.new: <a a a a b b b c c c c c d>;for $a.keys -> $k { say "$k => {$a«$k»}" }'
d => 1
b => 3
a => 4
c => 5
  

Это ошибка или есть объяснение, которого я не вижу?

Комментарии:

1. Для меня это похоже на ошибку.

2. Кроме того, в настоящее время мы называем их операторами «Unicode» и «ASCII», afaik.

3. Спасибо @ElizabethMattijsen: s / UTF-8/Unicode/

4. Проблема Rakduo по этому вопросу: 2825

Ответ №1:

Кажется, исправлено с помощью фиксации 2835 из MasterDuke17:

   sub bracket_ending($matches) {
      my $check     := $matches[ $matches - 1];
      my str $str   := $check.Str;
      my $last  := nqp::substr($str, nqp::chars($check) - 1, 1);
-     $last eq ')' || $last eq '}' || $last eq ']' || $last eq '>'
      $last eq ')' || $last eq '}' || $last eq ']' || $last eq '>' || $last eq '»'
  }