Что означает контекст в языковой модели?

#language-model

Вопрос:

Когда я читаю статьи, в которых упоминается языковая модель, я путаюсь с понятием «контекст». Я прочитал код модели языка transformer. Я думаю, это просто длина последовательности или размер bptt, я прав? Например, в этом случае он использует контекст длины 2.

Изменить: добавьте функцию get_batch:

 bptt = 35
def get_batch(source: Tensor, i: int) -> Tuple[Tensor, Tensor]:
    """
    Args:
        source: Tensor, shape [full_seq_len, batch_size]
        i: int
    Returns:
        tuple (data, target), where data has shape [seq_len, batch_size] and
        target has shape [seq_len * batch_size]
    """
    seq_len = min(bptt, len(source) - 1 - i)
    data = source[i:i seq_len]
    target = source[i 1:i 1 seq_len].reshape(-1)
    return data, target
 

Комментарии:

1. Я думаю, что этот вопрос лучше подходит для науки о данных