viola

  • Descrizione :

Robot Franka che interagisce con compiti di cucina stilizzati

Diviso Esempi
'test' 15
'train' 135
  • Struttura delle caratteristiche :
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'gripper_closedness_action': float32,
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': float32,
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_rgb': Image(shape=(224, 224, 3), dtype=uint8),
            'ee_states': Tensor(shape=(16,), dtype=float32),
            'eye_in_hand_rgb': Image(shape=(224, 224, 3), dtype=uint8),
            'gripper_states': Tensor(shape=(1,), dtype=float32),
            'joint_states': Tensor(shape=(7,), dtype=float32),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
passi Set di dati
passi/azione CaratteristicheDict
passi/azione/gripper_closedness_action Tensore float32
passi/azione/rotazione_delta Tensore (3,) float32
passaggi/azione/termina_episodio Tensore float32
passi/azione/vettore_mondo Tensore (3,) float32
passi/è_primo Tensore bool
passi/è_ultimo Tensore bool
passi/è_terminale Tensore bool
passi/osservazione CaratteristicheDict
passi/osservazione/agentview_rgb Immagine (224, 224, 3) uint8 RGB catturato dalla fotocamera dell'area di lavoro
passi/osservazione/ee_stati Tensore (16,) float32 Posa dell'effettore finale specificato come matrice omogenea.
passi/osservazione/eye_in_hand_rgb Immagine (224, 224, 3) uint8 RGB catturato dalla fotocamera in mano
passi/osservazione/gripper_states Tensore (1,) float32 gripper_states = 0 significa che la pinza è completamente chiusa. Il valore rappresenta la larghezza della pinza di Franka Panda Gripper.
passi/osservazione/stati_giunti Tensore (7,) float32 valori congiunti
passaggi/osservazione/incorporamento_linguaggio_naturale Tensore (512,) float32
passi/osservazione/istruzione_linguaggio_naturale Tensore corda
passi/ricompensa Scalare float32
@article{zhu2022viola,
  title={VIOLA: Imitation Learning for Vision-Based Manipulation with Object Proposal Priors},
  author={Zhu, Yifeng and Joshi, Abhishek and Stone, Peter and Zhu, Yuke},
  journal={6th Annual Conference on Robot Learning (CoRL)},
  year={2022}
}