ucsd_pick_and_place_dataset_converted_externally_to_rlds

  • Descrição :

xArm escolhendo e colocando objetos com distratores

Dividir Exemplos
'train' 1.355
  • Estrutura de recursos :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'disclaimer': Text(shape=(), dtype=string),
        'file_path': Text(shape=(), dtype=string),
        'n_transitions': Scalar(shape=(), dtype=int32),
        'success': Scalar(shape=(), dtype=bool),
        'success_labeled_by': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(4,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(224, 224, 3), dtype=uint8),
            'state': Tensor(shape=(7,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
episódio_metadados RecursosDict
episódio_metadata/isenção de responsabilidade Texto corda Isenção de responsabilidade sobre o episódio específico.
episódio_metadados/caminho_do_arquivo Texto corda Caminho para o arquivo de dados original.
episódio_metadata/n_transitions Escalar int32 Número de transições no episódio.
episódio_metadata/sucesso Escalar bool Verdadeiro se o último estado de um episódio for um estado de sucesso; caso contrário, será falso.
episódio_metadata/success_labeled_by Texto corda Quem rotulou o sucesso (e, portanto, a recompensa) do episódio. Pode ser um dos seguintes: [humano, classificador].
passos Conjunto de dados
etapas/ação Tensor (4,) float32 A ação do robô consiste em [3x velocidades da garra, 1x torque de abertura/fechamento da garra].
passos/desconto Escalar float32 Desconto, se fornecido, o padrão é 1.
passos/é_primeiro Tensor bool
passos/é_último Tensor bool
etapas/is_terminal Tensor bool
etapas/idioma_incorporação Tensor (512,) float32 Incorporação da linguagem Kona. Consulte https://tfhub.dev/google/universal-sentence-encoder-large/5
etapas/instrução_idioma Texto corda Instrução de Idiomas.
etapas/observação RecursosDict
passos/observação/imagem Imagem (224, 224, 3) uint8 Observação RGB da câmera.
etapas/observação/estado Tensor (7,) float32 O estado do robô consiste em [3x posição da garra, 3x orientação da garra, 1x distância do dedo].
passos/recompensa Escalar float32 Recompensa, se fornecida, 1 na etapa final para demonstrações.
@preprint{Feng2023Finetuning,
    title={Finetuning Offline World Models in the Real World},
    author={Yunhai Feng, Nicklas Hansen, Ziyan Xiong, Chandramouli Rajagopalan, Xiaolong Wang},
    year={2023}
}