Постройте модель, которая отвечает на вопрос из набора данных, используя GPT3

#nlp #chatbot #gpt #openai

#nlp #nlp-вопрос-ответ #gpt-3

Вопрос:

Я пытаюсь создать чат-бота, который, учитывая некоторый текстовый корпус, будет отвечать на вопросы, когда мы задаем что-то из этого текста. Я слышал, что GPT3 — зверь и требует минимальной подготовки. Есть ли какие-либо ссылки / учебные пособия / репозитории github, которые помогут мне начать работу с этим?

Комментарии:

1. Ничего страшного, если мне придется платить за вызовы API. Я видел проекты онлайн-обучения GPT, чтобы научиться писать операторы SQL

2. Вы должны искать RASA, вот пример — github.com/RasaHQ/rasa-demo

3. я считаю, что теперь она общедоступна

Ответ №1:

Конечно, если у вас есть бета-доступ к OpenAI GPT-3 API, вы легко сможете это сделать. В случае, если вы этого не сделаете, вы можете подать заявку — вас должны принять довольно быстро (в моем конкретном случае это заняло около 24 часов).

В зависимости от того, ищете ли вы скорость или точность, вам следует выбирать между Davinci, Cushman или Curie (список движков), тогда как Davinci является лучшим (с точки зрения точности).

Вы можете использовать игровую площадку для ввода корпуса текста и вопроса — вот пример: Пример изображения
Я использовал davinci-instruct-beta с температурой 0.25 и длиной ответа 10 . Довольно простая настройка.

Для демонстрационных целей вот запрос API, выполненный через Python. response возвращает «Анна больше всего ненавидит проводить исследования».

 import openai

openai.api_key = 'KEY'

response = openai.Completion.create(
  engine="davinci-instruct-beta",
  prompt="Anna loves programming in Python and C  , though she absolutely despises doing research.nWhat does Anna hate the most?nnAnna hates doing research the most.Example",
  temperature=0.25,
  max_tokens=10,
  top_p=1
)
  

Комментарии:

1. Спасибо, но для OpenAI существует ли верхний предел длины корпуса, например, 512 для ответа на вопрос с использованием BERT?

2. @Nidutt Насколько мне известно, максимальная продолжительность завершения составляет 2048 токенов, что примерно соответствует (в зависимости от различных факторов) 8000 символов — хотя я не совсем уверен. Имейте в виду, что это верхний предел .. 😉

3. Также обратите внимание, что эти ограничения не распространяются на поиск и классификацию.