Effectuez une multiplication matricielle quantifiée de « a » par la matrice « b » avec ajout de biais et fusion relu.
Les entrées doivent être des matrices bidimensionnelles et un vecteur de biais 1D. Et la dimension intérieure de « a » (après avoir été transposée si « transpose_a » est non nul) doit correspondre à la dimension extérieure de « b » (après avoir été transposée si « transposed_b » est non nul). Ensuite, effectuez une opération d'ajout de diffusion avec des valeurs de biais sur le résultat de la multiplication matricielle. La taille du biais doit correspondre à la dimension intérieure de « b ». Ensuite, activez relu pour obtenir un résultat non négatif.
Classes imbriquées
| classe | QuantizedMatMulWithBiasAndRelu.Options | Attributs facultatifs pour QuantizedMatMulWithBiasAndRelu | |
Méthodes publiques
| statique <V, T, U> QuantizedMatMulWithBiasAndRelu <V> | créer ( Portée portée , Opérande <T> a, Opérande <U> b, Opérande <Float> biais, Opérande <Float> minA, Opérande <Float> maxA, Opérande <Float> minB, Opérande <Float> maxB, Classe<V > Sortie, Options... (options) Méthode d'usine pour créer une classe encapsulant une nouvelle opération QuantizedMatMulWithBiasAndRelu. |
| statique QuantizedMatMulWithBiasAndRelu.Options | inputQuantMode (chaîne inputQuantMode) |
| Sortie <Flottant> | sortie max () La valeur flottante que représente la valeur de sortie quantifiée la plus élevée. |
| Sortie <Flottant> | minSortie () La valeur flottante que représente la valeur de sortie quantifiée la plus basse. |
| Sortie <V> | dehors () |
| statique QuantizedMatMulWithBiasAndRelu.Options | transposeA (transposeA booléenne) |
| statique QuantizedMatMulWithBiasAndRelu.Options | transposeB (transposeB booléenne) |
Méthodes héritées
Méthodes publiques
public static QuantizedMatMulWithBiasAndRelu <V> créer ( Portée de la portée , Opérande <T> a, Opérande <U> b, Opérande <Float> biais, Opérande <Float> minA, Opérande <Float> maxA, Opérande <Float> minB, Opérande <Float > maxB, Classe<V> Toutput, Options... options)
Méthode d'usine pour créer une classe encapsulant une nouvelle opération QuantizedMatMulWithBiasAndRelu.
Paramètres
| portée | portée actuelle |
|---|---|
| un | Une matrice à multiplier. Doit être un tenseur bidimensionnel de type « quint8 ». |
| b | Une matrice à multiplier et doit être un tenseur bidimensionnel de type « qint8 ». |
| biais | Un tenseur de biais 1D dont la taille correspond à la dimension intérieure de « b » (après avoir été transposé si « transposed_b » est non nul). |
| minA | La valeur flottante que représente la valeur « a » quantifiée la plus basse. |
| maxA | La valeur flottante que représente la valeur « a » quantifiée la plus élevée. |
| minB | La valeur flottante que représente la valeur « b » quantifiée la plus basse. |
| maxB | La valeur flottante que représente la valeur « b » quantifiée la plus élevée. |
| choix | porte des valeurs d'attributs facultatifs |
Retour
- une nouvelle instance de QuantizedMatMulWithBiasAndRelu
public statique QuantizedMatMulWithBiasAndRelu.Options inputQuantMode (String inputQuantMode)
Paramètres
| inputQuantMode | Mode de quantification des données d’entrée. Soit MIN_FIRST (par défaut) soit SCALED. |
|---|
sortie publique <Float> maxOut ()
La valeur flottante que représente la valeur de sortie quantifiée la plus élevée.
sortie publique <Float> minOut ()
La valeur flottante que représente la valeur de sortie quantifiée la plus basse.
public static QuantizedMatMulWithBiasAndRelu.Options transposeA (Boolean transposeA)
Paramètres
| transposerA | Si c'est vrai, `a` est transposé avant la multiplication. |
|---|
public static QuantizedMatMulWithBiasAndRelu.Options transposeB (booléen transposeB)
Paramètres
| transposerB | Si c'est vrai, `b` est transposé avant la multiplication. |
|---|