- Descrição :
Franka explorando cozinhas de brinquedo
Página inicial : https://human-world-model.github.io/
Código fonte :
tfds.robotics.rtx.CmuFrankaExplorationDatasetConvertedExternallyToRlds
Versões :
-
0.1.0
(padrão): versão inicial.
-
Tamanho do download :
Unknown size
Tamanho do conjunto de dados :
602.24 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 199 |
- Estrutura de recursos :
FeaturesDict({
'episode_metadata': FeaturesDict({
'file_path': Text(shape=(), dtype=string),
}),
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32),
'discount': Scalar(shape=(), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'language_embedding': Tensor(shape=(512,), dtype=float32),
'language_instruction': Text(shape=(), dtype=string),
'observation': FeaturesDict({
'highres_image': Image(shape=(480, 640, 3), dtype=uint8),
'image': Image(shape=(64, 64, 3), dtype=uint8),
}),
'reward': Scalar(shape=(), dtype=float32),
'structured_action': Tensor(shape=(8,), dtype=float32),
}),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
episódio_metadados | RecursosDict | |||
episódio_metadados/caminho_do_arquivo | Texto | corda | Caminho para o arquivo de dados original. | |
passos | Conjunto de dados | |||
etapas/ação | Tensor | (8,) | float32 | A ação do robô consiste em [posição do efetor final3x, orientação do efetor final3x, ação da garra1x, finalização do episódio1x]. |
passos/desconto | Escalar | float32 | Desconto, se fornecido, o padrão é 1. | |
passos/é_primeiro | Tensor | bool | ||
passos/é_último | Tensor | bool | ||
etapas/is_terminal | Tensor | bool | ||
etapas/idioma_incorporação | Tensor | (512,) | float32 | Incorporação da linguagem Kona. Consulte https://tfhub.dev/google/universal-sentence-encoder-large/5 |
etapas/instrução_idioma | Texto | corda | Instrução de Idiomas. | |
etapas/observação | RecursosDict | |||
etapas/observação/highres_image | Imagem | (480, 640, 3) | uint8 | Observação da câmera principal de alta resolução |
passos/observação/imagem | Imagem | (64, 64, 3) | uint8 | Observação RGB da câmera principal. |
passos/recompensa | Escalar | float32 | Recompensa, se fornecida, 1 na etapa final para demonstrações. | |
etapas/ação_estruturada | Tensor | (8,) | float32 | Ação estruturada, consistindo em affordance híbrida e controle de efetores finais, descrita em Modelos de mundo estruturados de vídeos humanos. |
Chaves supervisionadas (consulte o documento
as_supervised
):None
Figura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{mendonca2023structured,
title={Structured World Models from Human Videos},
author={Mendonca, Russell and Bahl, Shikhar and Pathak, Deepak},
journal={RSS},
year={2023}
}