unnatural_instructions

  • 説明:

論文で説明されているデータセット: Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor (2022)。オプションの制約 / LLM によって生成された再定式化を含む、自然言語命令のセットが含まれています。

スプリット
'train' 66,010
  • 機能構造:
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'instances': Sequence({
        'constraints': Text(shape=(), dtype=string),
        'input': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
    'instruction': Text(shape=(), dtype=string),
    'reformulations': Sequence({
        'input': Text(shape=(), dtype=string),
        'instruction': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
ID文章ストリングたとえば、一意の識別子。
インスタンス順序
インスタンス/制約文章ストリングタスク固有の制約。
インスタンス/入力文章ストリング指定された命令のプレースホルダーに入力される入力。
インスタンス/instruction_with_input文章ストリングプレースホルダーに提供される入力を含む命令。
インスタンス/出力文章ストリング特定のタスクのターゲット出力。
命令文章ストリング入力用のプレースホルダー付きの命令。
再定式化順序
再定式化/入力文章ストリング指定された命令のプレースホルダーに入力される入力。
再定式化/指示文章ストリング入力用のプレースホルダー付きの命令。
再定式化/instruction_with_input文章ストリングプレースホルダーに提供される入力を含む命令。
再定式化/出力文章ストリング特定のタスクのターゲット出力。
  • 引用
@misc{honovich2022unnatural,
      title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
      author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
      url = {https://arxiv.org/abs/2212.09689},
      publisher = {arXiv},
      year={2022}
}