- Описание :
Набор данных, описанный в статье: Неестественные инструкции: настройка языковых моделей с (почти) отсутствием человеческого труда (2022 г.). Содержит наборы инструкций на естественном языке с необязательными ограничениями / переформулировками, созданными LLM.
Домашняя страница : https://github.com/orhonovich/unnatural-instructions
Исходный код :
tfds.text.unnatural_instructions.UnnaturalInstructionsВерсии :
-
0.0.1(по умолчанию): Первоначальный выпуск. Опустите инструкции/вводы, так как они требуют дополнительной обработки. Instruction_with_inputs и переформулировки содержат инструкции и контексты.
-
Размер загрузки :
17.48 MiBРазмер набора данных :
154.71 MiB.Автокэширование ( документация ): только когда
shuffle_files=False(поезд)Сплиты :
| Расколоть | Примеры |
|---|---|
'train' | 66 010 |
- Структура функции :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Документация по функциям :
| Характерная черта | Класс | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| я бы | Текст | нить | Уникальный идентификатор, например. | |
| экземпляры | Последовательность | |||
| экземпляры/ограничения | Текст | нить | Ограничения, специфичные для задачи. | |
| экземпляры/ввод | Текст | нить | Входные данные для ввода в заполнители для данной инструкции. | |
| экземпляры/instruction_with_input | Текст | нить | Инструкции с входными данными для заполнителей. | |
| экземпляры/вывод | Текст | нить | Целевой результат для данной задачи. | |
| инструкция | Текст | нить | Инструкция с заполнителем для входных данных. | |
| переформулировки | Последовательность | |||
| переформулировки/ввод | Текст | нить | Входные данные для ввода в заполнители для данной инструкции. | |
| переформулировка/инструкция | Текст | нить | Инструкция с заполнителем для входных данных. | |
| переформулировки/instruction_with_input | Текст | нить | Инструкции с входными данными для заполнителей. | |
| переформулировка/вывод | Текст | нить | Целевой результат для данной задачи. |
Ключи под наблюдением (см . документ
as_supervised):NoneРисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}