סיווג תנוחת האדם עם MoveNet ו- TensorFlow Lite

מחברת זו מלמדת אותך כיצד לאמן מודל סיווג תנוחות באמצעות MoveNet ו- TensorFlow Lite. התוצאה היא דגם חדש של TensorFlow Lite שמקבל את הפלט ממודל MoveNet כקלט שלו, ומוציא סיווג תנוחות, כמו שם של תנוחת יוגה.

ההליך במחברת זו מורכבת משלושה חלקים:

  • חלק 1: עבד מראש את נתוני האימון של סיווג התנוחה לקובץ CSV המפרט את ציוני הדרך (נקודות המפתח של הגוף) שזוהו על ידי מודל MoveNet, יחד עם תוויות תנוחות הקרקע.
  • חלק 2: בנה ואימון מודל סיווג תנוחות שלוקח את קואורדינטות ציון הדרך מקובץ ה-CSV כקלט, ומוציא את התוויות החזויות.
  • חלק 3: המר את מודל סיווג התנוחות ל- TFLite.

כברירת מחדל, מחברת זו משתמשת במערך נתונים עם תנוחות יוגה מסומנות, אך כללנו גם קטע בחלק 1 שבו אתה יכול להעלות מערך תמונות משלך של תנוחות.

הצג באתר TensorFlow.org הפעל בגוגל קולאב צפה במקור ב-GitHub הורד מחברת ראה דגם TF Hub


בסעיף זה, תייבא את הספריות הדרושות ותגדיר מספר פונקציות לעיבוד מקדים של תמונות האימון לקובץ CSV המכיל את קואורדינטות ציון הדרך ותוויות האמת הבסיסית.

שום דבר שניתן לצפייה לא קורה כאן, אבל אתה יכול להרחיב את תאי הקוד המוסתרים כדי לראות את היישום של חלק מהפונקציות שאליו נתקשר בהמשך.

אם אתה רק רוצה ליצור את קובץ ה-CSV מבלי לדעת את כל הפרטים, פשוט הפעל את הקטע הזה והמשיך לחלק 1.

pip install -q opencv-python
import csv
import cv2
import itertools
import numpy as np
import pandas as pd
import os
import sys
import tempfile
import tqdm

from matplotlib import pyplot as plt
from matplotlib.collections import LineCollection

import tensorflow as tf
import tensorflow_hub as hub
from tensorflow import keras

from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

קוד להפעלת הערכת תנוחה באמצעות MoveNet

פונקציות להפעלת הערכת פוזות עם MoveNet

חלק 1: עיבוד מקדים של תמונות הקלט

מכיוון קלט עבור מסווג התנוחה שלנו הוא ציוני דרך פלט מהמודל MoveNet, אנחנו צריכים ליצור במערך ההדרכה שלנו על ידי הפעלת תמונות המתויגות דרך MoveNet ואז לוכד את כל הנתונים ציון דרך ותוויות האמת הקרקע לקובץ CSV.

מערך הנתונים שסיפקנו עבור הדרכה זו הוא מערך תנוחות יוגה שנוצר על ידי CG. הוא מכיל תמונות של דגמים מרובים שנוצרו ב-CG העושים 5 תנוחות יוגה שונות. הספרייה מפוצלת כבר לתוך train במערך וכן test נתון.

אז בקטע הזה, נצטרך להוריד את הנתונים יוגה ולהפעיל אותו באמצעות MoveNet כדי שנוכל ללכוד כל ציוני לקובץ CSV ... עם זאת, זה לוקח בערך 15 דקות כדי להאכיל במערך יוגה שלנו MoveNet וליצור קובץ CSV זה . אז כחלופה, אתה יכול להוריד קובץ CSV קיים מראש עבור הנתונים יוגה על ידי הגדרת is_skip_step_1 פרמטר מתחת ל- True. בדרך זו, תדלג על שלב זה ובמקום זאת תוריד את אותו קובץ CSV שייווצר בשלב זה של עיבוד מקדים.

מצד השני, אם אתה רוצה לאמן את מסווג התנוחה עם נתון תמונה משלכם, אתה צריך להעלות את התמונות שלך ולהפעיל הצעד המקדים הזה (חופשת is_skip_step_1 False) -follow ההוראות הבאות כדי להעלות במערך התנוחה שלך.

(אופציונלי) העלה את מערך הנתונים של תנוחות משלך

אם ברצונך לאמן את מסווג התנוחות עם תנוחות המסומנות שלך (הן יכולות להיות כל תנוחות, לא רק תנוחות יוגה), בצע את השלבים הבאים:

  1. גדר לעיל use_custom_dataset האפשרות אמיתית.

  2. הכן קובץ ארכיון (ZIP, TAR או אחר) הכולל תיקיה עם מערך הנתונים של התמונות שלך. התיקיה חייבת לכלול תמונות ממוינות של התנוחות שלך כדלקמן.

    אם כבר לפצל את מערך הנתונים לתוך למערכי רכבות מבחן, ולאחר מכן קבע dataset_is_split כ- True. כלומר, תיקיית התמונות שלך חייבת לכלול ספריות "רכבת" ו"בדיקה" כמו זו:

    |__ train/
        |__ downdog/
            |______ 00000128.jpg
            |______ ...
    |__ test/
        |__ downdog/
            |______ 00000181.jpg
            |______ ...

    לחלופין, אם הנתונים שלך אינו לפצל עדיין, אז להגדיר dataset_is_split כ- False ונתחלק אותו מבוסס על שבריר פיצול שצוין. כלומר, תיקיית התמונות שהעלית צריכה להיראות כך:

    |__ downdog/
        |______ 00000128.jpg
        |______ 00000181.jpg
        |______ ...
    |__ goddess/
        |______ 00000243.jpg
        |______ 00000306.jpg
        |______ ...
  3. לחץ על הכרטיסייה קבצים בצד שמאל (סמל התיקייה) ולאחר מכן לחץ על העלה כדי אחסון הפעלה (סמל הקובץ).

  4. בחר את קובץ הארכיון שלך והמתן עד שיסיים להעלות לפני שתמשיך.

  5. ערוך את גוש הקוד הבא כדי לציין את השם של קובץ הארכיון וספריית התמונות שלך. (כברירת מחדל, אנו מצפים לקובץ ZIP, אז תצטרך לשנות גם את החלק הזה אם הארכיון שלך הוא פורמט אחר.)

  6. כעת הפעל את שאר המחברת.

if use_custom_dataset:
  # You must edit these two lines to match your archive and images folder name:
  dataset_in = 'YOUR_DATASET_DIR_NAME'

  # You can leave the rest alone:
  if not os.path.isdir(dataset_in):
    raise Exception("dataset_in is not a valid directory")
  if dataset_is_split:
    IMAGES_ROOT = dataset_in
    dataset_out = 'split_' + dataset_in
    split_into_train_test(dataset_in, dataset_out, test_split=0.2)
    IMAGES_ROOT = dataset_out

הורד את מערך היוגה

if not is_skip_step_1 and not use_custom_dataset:
  !wget -O yoga_poses.zip http://download.tensorflow.org/data/pose_classification/yoga_poses.zip
  !unzip -q yoga_poses.zip -d yoga_cg
  IMAGES_ROOT = "yoga_cg"
Preprocess TRAIN הנתונים

if not is_skip_step_1:
  images_in_train_folder = os.path.join(IMAGES_ROOT, 'train')
  images_out_train_folder = 'poses_images_out_train'
  csvs_out_train_path = 'train_data.csv'

  preprocessor = MoveNetPreprocessor(

Preprocess TEST הנתונים

if not is_skip_step_1:
  images_in_test_folder = os.path.join(IMAGES_ROOT, 'test')
  images_out_test_folder = 'poses_images_out_test'
  csvs_out_test_path = 'test_data.csv'

  preprocessor = MoveNetPreprocessor(

חלק 2: אימון מודל סיווג תנוחות שלוקח את קואורדינטות ציון הדרך כקלט, והפקת התוויות החזויות.

אתה תבנה מודל TensorFlow שלוקח את קואורדינטות ציון הדרך ומנבא את מעמד התנוחה שהאדם בתמונת הקלט מבצע. המודל מורכב משני תת-דגמים:

  • תת-מודל 1 מחשב הטבעת תנוחה (המכונה וקטור תכונה) מקואורדינטות ציון הדרך שזוהו.
  • דגם משנה 2 הזנות פוזת הטבעה באמצעות מספר Dense שכבה לחזות את מעמד התנוחה.

לאחר מכן תאמן את המודל על סמך מערך הנתונים שעובדו מראש בחלק 1.

(אופציונלי) הורד את מערך הנתונים המעובד מראש אם לא הפעלת את חלק 1

# Download the preprocessed CSV files which are the same as the output of step 1
if is_skip_step_1:
  !wget -O train_data.csv http://download.tensorflow.org/data/pose_classification/yoga_train_data.csv
  !wget -O test_data.csv http://download.tensorflow.org/data/pose_classification/yoga_test_data.csv

  csvs_out_train_path = 'train_data.csv'
  csvs_out_test_path = 'test_data.csv'
  is_skipped_step_1 = True

טען את קובצי CSV מעובד לתוך TRAIN ואת TEST מערכי נתונים.

def load_pose_landmarks(csv_path):
  """Loads a CSV created by MoveNetPreprocessor.

    X: Detected landmark coordinates and scores of shape (N, 17 * 3)
    y: Ground truth labels of shape (N, label_count)
    classes: The list of all class names found in the dataset
    dataframe: The CSV loaded as a Pandas dataframe features (X) and ground
      truth labels (y) to use later to train a pose classification model.

  # Load the CSV file
  dataframe = pd.read_csv(csv_path)
  df_to_process = dataframe.copy()

  # Drop the file_name columns as you don't need it during training.
  df_to_process.drop(columns=['file_name'], inplace=True)

  # Extract the list of class names
  classes = df_to_process.pop('class_name').unique()

  # Extract the labels
  y = df_to_process.pop('class_no')

  # Convert the input features and labels into the correct format for training.
  X = df_to_process.astype('float64')
  y = keras.utils.to_categorical(y)

  return X, y, classes, dataframe

טען ולפצל את המקורי TRAIN הנתונים לתוך TRAIN (85% של נתונים) ו VALIDATE (15% הנותרים).

# Load the train data
X, y, class_names, _ = load_pose_landmarks(csvs_out_train_path)

# Split training data (X, y) into (X_train, y_train) and (X_val, y_val)
X_train, X_val, y_train, y_val = train_test_split(X, y,
# Load the test data
X_test, y_test, _, df_test = load_pose_landmarks(csvs_out_test_path)

הגדר פונקציות להמרת ציוני הדרך של התנוחה להטמעת תנוחה (המכונה גם וקטור תכונה) לסיווג התנוחה

לאחר מכן, המר את קואורדינטות ציון הדרך לוקטור תכונה על ידי:

  1. הזזת מרכז התנוחה למקור.
  2. שינוי קנה המידה של התנוחה כך שגודל התנוחה יהפוך ל-1
  3. שיטוח הקואורדינטות הללו לוקטור תכונה

לאחר מכן השתמש בוקטור תכונה זה כדי לאמן מסווג תנוחות מבוסס רשת עצבית.

def get_center_point(landmarks, left_bodypart, right_bodypart):
  """Calculates the center point of the two given landmarks."""

  left = tf.gather(landmarks, left_bodypart.value, axis=1)
  right = tf.gather(landmarks, right_bodypart.value, axis=1)
  center = left * 0.5 + right * 0.5
  return center

def get_pose_size(landmarks, torso_size_multiplier=2.5):
  """Calculates pose size.

  It is the maximum of two values:
    * Torso size multiplied by `torso_size_multiplier`
    * Maximum distance from pose center to any pose landmark
  # Hips center
  hips_center = get_center_point(landmarks, BodyPart.LEFT_HIP, 

  # Shoulders center
  shoulders_center = get_center_point(landmarks, BodyPart.LEFT_SHOULDER,

  # Torso size as the minimum body size
  torso_size = tf.linalg.norm(shoulders_center - hips_center)

  # Pose center
  pose_center_new = get_center_point(landmarks, BodyPart.LEFT_HIP, 
  pose_center_new = tf.expand_dims(pose_center_new, axis=1)
  # Broadcast the pose center to the same size as the landmark vector to
  # perform substraction
  pose_center_new = tf.broadcast_to(pose_center_new,
                                    [tf.size(landmarks) // (17*2), 17, 2])

  # Dist to pose center
  d = tf.gather(landmarks - pose_center_new, 0, axis=0,
  # Max dist to pose center
  max_dist = tf.reduce_max(tf.linalg.norm(d, axis=0))

  # Normalize scale
  pose_size = tf.maximum(torso_size * torso_size_multiplier, max_dist)

  return pose_size

def normalize_pose_landmarks(landmarks):
  """Normalizes the landmarks translation by moving the pose center to (0,0) and
  scaling it to a constant pose size.
  # Move landmarks so that the pose center becomes (0,0)
  pose_center = get_center_point(landmarks, BodyPart.LEFT_HIP, 
  pose_center = tf.expand_dims(pose_center, axis=1)
  # Broadcast the pose center to the same size as the landmark vector to perform
  # substraction
  pose_center = tf.broadcast_to(pose_center, 
                                [tf.size(landmarks) // (17*2), 17, 2])
  landmarks = landmarks - pose_center

  # Scale the landmarks to a constant pose size
  pose_size = get_pose_size(landmarks)
  landmarks /= pose_size

  return landmarks

def landmarks_to_embedding(landmarks_and_scores):
  """Converts the input landmarks into a pose embedding."""
  # Reshape the flat input into a matrix with shape=(17, 3)
  reshaped_inputs = keras.layers.Reshape((17, 3))(landmarks_and_scores)

  # Normalize landmarks 2D
  landmarks = normalize_pose_landmarks(reshaped_inputs[:, :, :2])

  # Flatten the normalized landmark coordinates into a vector
  embedding = keras.layers.Flatten()(landmarks)

  return embedding

הגדירו מודל של קרס לסיווג התנוחה

מודל Keras שלנו לוקח את ציוני הדרך של התנוחה שזוהו, ואז מחשב את הטבעת התנוחה ומנבא את מעמד התנוחה.

# Define the model
inputs = tf.keras.Input(shape=(51))
embedding = landmarks_to_embedding(inputs)

layer = keras.layers.Dense(128, activation=tf.nn.relu6)(embedding)
layer = keras.layers.Dropout(0.5)(layer)
layer = keras.layers.Dense(64, activation=tf.nn.relu6)(layer)
layer = keras.layers.Dropout(0.5)(layer)
outputs = keras.layers.Dense(len(class_names), activation="softmax")(layer)

model = keras.Model(inputs, outputs)
Model: "model"
 Layer (type)                   Output Shape         Param #     Connected to                     
 input_1 (InputLayer)           [(None, 51)]         0           []                               
 reshape (Reshape)              (None, 17, 3)        0           ['input_1[0][0]']                
 tf.__operators__.getitem (Slic  (None, 17, 2)       0           ['reshape[0][0]']                
 tf.compat.v1.gather (TFOpLambd  (None, 2)           0           ['tf.__operators__.getitem[0][0]'
 a)                                                              ]                                
 tf.compat.v1.gather_1 (TFOpLam  (None, 2)           0           ['tf.__operators__.getitem[0][0]'
 bda)                                                            ]                                
 tf.math.multiply (TFOpLambda)  (None, 2)            0           ['tf.compat.v1.gather[0][0]']    
 tf.math.multiply_1 (TFOpLambda  (None, 2)           0           ['tf.compat.v1.gather_1[0][0]']  
 tf.__operators__.add (TFOpLamb  (None, 2)           0           ['tf.math.multiply[0][0]',       
 da)                                                              'tf.math.multiply_1[0][0]']     
 tf.compat.v1.size (TFOpLambda)  ()                  0           ['tf.__operators__.getitem[0][0]'
 tf.expand_dims (TFOpLambda)    (None, 1, 2)         0           ['tf.__operators__.add[0][0]']   
 tf.compat.v1.floor_div (TFOpLa  ()                  0           ['tf.compat.v1.size[0][0]']      
 tf.broadcast_to (TFOpLambda)   (None, 17, 2)        0           ['tf.expand_dims[0][0]',         
 tf.math.subtract (TFOpLambda)  (None, 17, 2)        0           ['tf.__operators__.getitem[0][0]'
                                                                 , 'tf.broadcast_to[0][0]']       
 tf.compat.v1.gather_6 (TFOpLam  (None, 2)           0           ['tf.math.subtract[0][0]']       
 tf.compat.v1.gather_7 (TFOpLam  (None, 2)           0           ['tf.math.subtract[0][0]']       
 tf.math.multiply_6 (TFOpLambda  (None, 2)           0           ['tf.compat.v1.gather_6[0][0]']  
 tf.math.multiply_7 (TFOpLambda  (None, 2)           0           ['tf.compat.v1.gather_7[0][0]']  
 tf.__operators__.add_3 (TFOpLa  (None, 2)           0           ['tf.math.multiply_6[0][0]',     
 mbda)                                                            'tf.math.multiply_7[0][0]']     
 tf.compat.v1.size_1 (TFOpLambd  ()                  0           ['tf.math.subtract[0][0]']       
 tf.compat.v1.gather_4 (TFOpLam  (None, 2)           0           ['tf.math.subtract[0][0]']       
 tf.compat.v1.gather_5 (TFOpLam  (None, 2)           0           ['tf.math.subtract[0][0]']       
 tf.compat.v1.gather_2 (TFOpLam  (None, 2)           0           ['tf.math.subtract[0][0]']       
 tf.compat.v1.gather_3 (TFOpLam  (None, 2)           0           ['tf.math.subtract[0][0]']       
 tf.expand_dims_1 (TFOpLambda)  (None, 1, 2)         0           ['tf.__operators__.add_3[0][0]'] 
 tf.compat.v1.floor_div_1 (TFOp  ()                  0           ['tf.compat.v1.size_1[0][0]']    
 tf.math.multiply_4 (TFOpLambda  (None, 2)           0           ['tf.compat.v1.gather_4[0][0]']  
 tf.math.multiply_5 (TFOpLambda  (None, 2)           0           ['tf.compat.v1.gather_5[0][0]']  
 tf.math.multiply_2 (TFOpLambda  (None, 2)           0           ['tf.compat.v1.gather_2[0][0]']  
 tf.math.multiply_3 (TFOpLambda  (None, 2)           0           ['tf.compat.v1.gather_3[0][0]']  
 tf.broadcast_to_1 (TFOpLambda)  (None, 17, 2)       0           ['tf.expand_dims_1[0][0]',       
 tf.__operators__.add_2 (TFOpLa  (None, 2)           0           ['tf.math.multiply_4[0][0]',     
 mbda)                                                            'tf.math.multiply_5[0][0]']     
 tf.__operators__.add_1 (TFOpLa  (None, 2)           0           ['tf.math.multiply_2[0][0]',     
 mbda)                                                            'tf.math.multiply_3[0][0]']     
 tf.math.subtract_2 (TFOpLambda  (None, 17, 2)       0           ['tf.math.subtract[0][0]',       
 )                                                                'tf.broadcast_to_1[0][0]']      
 tf.math.subtract_1 (TFOpLambda  (None, 2)           0           ['tf.__operators__.add_2[0][0]', 
 )                                                                'tf.__operators__.add_1[0][0]'] 
 tf.compat.v1.gather_8 (TFOpLam  (17, 2)             0           ['tf.math.subtract_2[0][0]']     
 tf.compat.v1.norm (TFOpLambda)  ()                  0           ['tf.math.subtract_1[0][0]']     
 tf.compat.v1.norm_1 (TFOpLambd  (2,)                0           ['tf.compat.v1.gather_8[0][0]']  
 tf.math.multiply_8 (TFOpLambda  ()                  0           ['tf.compat.v1.norm[0][0]']      
 tf.math.reduce_max (TFOpLambda  ()                  0           ['tf.compat.v1.norm_1[0][0]']    
 tf.math.maximum (TFOpLambda)   ()                   0           ['tf.math.multiply_8[0][0]',     
 tf.math.truediv (TFOpLambda)   (None, 17, 2)        0           ['tf.math.subtract[0][0]',       
 flatten (Flatten)              (None, 34)           0           ['tf.math.truediv[0][0]']        
 dense (Dense)                  (None, 128)          4480        ['flatten[0][0]']                
 dropout (Dropout)              (None, 128)          0           ['dense[0][0]']                  
 dense_1 (Dense)                (None, 64)           8256        ['dropout[0][0]']                
 dropout_1 (Dropout)            (None, 64)           0           ['dense_1[0][0]']                
 dense_2 (Dense)                (None, 5)            325         ['dropout_1[0][0]']              
Total params: 13,061
Trainable params: 13,061
Non-trainable params: 0

# Add a checkpoint callback to store the checkpoint that has the highest
# validation accuracy.
checkpoint_path = "weights.best.hdf5"
checkpoint = keras.callbacks.ModelCheckpoint(checkpoint_path,
earlystopping = keras.callbacks.EarlyStopping(monitor='val_accuracy', 

# Start training
history = model.fit(X_train, y_train,
                    validation_data=(X_val, y_val),
                    callbacks=[checkpoint, earlystopping])
# Visualize the training history to see whether you're overfitting.
plt.title('Model accuracy')
plt.legend(['TRAIN', 'VAL'], loc='lower right')


# Evaluate the model using the TEST dataset
loss, accuracy = model.evaluate(X_test, y_test)
14/14 [==============================] - 0s 2ms/step - loss: 0.0612 - accuracy: 0.9976

צייר את מטריצת הבלבול כדי להבין טוב יותר את ביצועי המודל

def plot_confusion_matrix(cm, classes,
                          title='Confusion matrix',
  """Plots the confusion matrix."""
  if normalize:
    cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
    print("Normalized confusion matrix")
    print('Confusion matrix, without normalization')

  plt.imshow(cm, interpolation='nearest', cmap=cmap)
  tick_marks = np.arange(len(classes))
  plt.xticks(tick_marks, classes, rotation=55)
  plt.yticks(tick_marks, classes)
  fmt = '.2f' if normalize else 'd'
  thresh = cm.max() / 2.
  for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
    plt.text(j, i, format(cm[i, j], fmt),
              color="white" if cm[i, j] > thresh else "black")

  plt.ylabel('True label')
  plt.xlabel('Predicted label')

# Classify pose in the TEST dataset using the trained model
y_pred = model.predict(X_test)

# Convert the prediction result to class name
y_pred_label = [class_names[i] for i in np.argmax(y_pred, axis=1)]
y_true_label = [class_names[i] for i in np.argmax(y_test, axis=1)]

# Plot the confusion matrix
cm = confusion_matrix(np.argmax(y_test, axis=1), np.argmax(y_pred, axis=1))
                      title ='Confusion Matrix of Pose Classification Model')

# Print the classification report
print('\nClassification Report:\n', classification_report(y_true_label,
Confusion matrix, without normalization

Classification Report:
               precision    recall  f1-score   support

       chair       1.00      1.00      1.00        84
       cobra       0.99      1.00      0.99        93
         dog       1.00      1.00      1.00        84
        tree       1.00      1.00      1.00        96
     warrior       1.00      0.99      0.99        68

    accuracy                           1.00       425
   macro avg       1.00      1.00      1.00       425
weighted avg       1.00      1.00      1.00       425


(אופציונלי) חקור תחזיות שגויות

אתה יכול להסתכל תנוחות מן TEST מערך נתונים נחזו שגוי כדי לראות אם דיוק המודל ניתן לשפר.

if is_skip_step_1:
  raise RuntimeError('You must have run step 1 to run this cell.')

# If step 1 was skipped, skip this step.

# Extract the list of incorrectly predicted poses
false_predict = [id_in_df for id_in_df in range(len(y_test)) \
                if y_pred_label[id_in_df] != y_true_label[id_in_df]]
if len(false_predict) > MAX_NO_OF_IMAGE_TO_PLOT:
  false_predict = false_predict[:MAX_NO_OF_IMAGE_TO_PLOT]

# Plot the incorrectly predicted images
row_count = len(false_predict) // IMAGE_PER_ROW + 1
fig = plt.figure(figsize=(10 * IMAGE_PER_ROW, 10 * row_count))
for i, id_in_df in enumerate(false_predict):
  ax = fig.add_subplot(row_count, IMAGE_PER_ROW, i + 1)
  image_path = os.path.join(images_out_test_folder,

  image = cv2.imread(image_path)
  plt.title("Predict: %s; Actual: %s"
            % (y_pred_label[id_in_df], y_true_label[id_in_df]))
  plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))


חלק 3: המר את מודל סיווג התנוחות ל-TensorFlow Lite

אתה תמיר את מודל סיווג התנוחות של Keras לפורמט TensorFlow Lite כך שתוכל לפרוס אותו לאפליקציות ניידות, דפדפני אינטרנט ומכשירי IoT. בעת המרת המודל, תוכל להחיל קוונטיזציה טווח דינמית כדי להקטין את גודל מודל תנוחת סיווג TensorFlow לייט בכ 4 פעמים עם אובדן דיוק חסר חשיבות.

converter = tf.lite.TFLiteConverter.from_keras_model(model)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
tflite_model = converter.convert()

print('Model size: %dKB' % (len(tflite_model) / 1024))

with open('pose_classifier.tflite', 'wb') as f:
Model size: 26KB

לאחר מכן תכתוב את קובץ התווית שמכיל מיפוי מאינדקסי המחלקות לשמות המחלקות הניתנות לקריאה.

with open('pose_labels.txt', 'w') as f:

ככל שיישמת קוונטיזציה כדי להקטין את גודל המודל, הבה נעריך את מודל TFLite המקוונטי כדי לבדוק אם ירידת הדיוק מקובלת.

def evaluate_model(interpreter, X, y_true):
  """Evaluates the given TFLite model and return its accuracy."""
  input_index = interpreter.get_input_details()[0]["index"]
  output_index = interpreter.get_output_details()[0]["index"]

  # Run predictions on all given poses.
  y_pred = []
  for i in range(len(y_true)):
    # Pre-processing: add batch dimension and convert to float32 to match with
    # the model's input data format.
    test_image = X[i: i + 1].astype('float32')
    interpreter.set_tensor(input_index, test_image)

    # Run inference.

    # Post-processing: remove batch dimension and find the class with highest
    # probability.
    output = interpreter.tensor(output_index)
    predicted_label = np.argmax(output()[0])

  # Compare prediction results with ground truth labels to calculate accuracy.
  y_pred = keras.utils.to_categorical(y_pred)
  return accuracy_score(y_true, y_pred)

# Evaluate the accuracy of the converted TFLite model
classifier_interpreter = tf.lite.Interpreter(model_content=tflite_model)
print('Accuracy of TFLite model: %s' %
      evaluate_model(classifier_interpreter, X_test, y_test))
Accuracy of TFLite model: 1.0

עכשיו אתה יכול להוריד את מודל TFLite ( pose_classifier.tflite ) ואת קובץ התווית ( pose_labels.txt ) כדי תנוחות מנהג לסווג. עיין אנדרואיד ו- Python / פטל Pi אפליקציה לדוגמה עבור דוגמה מקצה לקצה של אופן השימוש מודל סיווג התנוחה TFLite.

zip pose_classifier.zip pose_labels.txt pose_classifier.tflite
adding: pose_labels.txt (stored 0%)
  adding: pose_classifier.tflite (deflated 35%)
# Download the zip archive if running on Colab.
  from google.colab import files