このページは Cloud Translation API によって翻訳されました。
Switch to English

tff.simulation.datasets.shakespeare.load_data

GitHubの上のソースを表示

ロード連合シェイクスピアデータセット。

ノートPCで使用されます

チュートリアルで使用されます

ダウンロードしてローカルにデータセットをキャッシュします。以前にダウンロードした場合は、キャッシュからデータセットをロードしようとします。

このデータセットは、リーフ・リポジトリ(由来するhttps://github.com/TalwalkarLab/leafで公開されているシェイクスピアの作品に)前処理「LEAF:フェデレーション設定のベンチマーク」 https://arxiv.org /abs/1812.01097

データセットは、各実施例は、所与のプレイ中に文字が話すラインの隣接セットに対応する715人のユーザー(シェークスピア演劇の文字)、から成ります。

データは、サイズを設定します。

  • 電車:16068例
  • テスト:2,356例

むしろ特定のユーザーを保持するよりも、各ユーザの例は、列車全体で分割し、 テストされているので、すべてのユーザーが電車の中で少なくとも一つの例とテストの1例を持っていること。以下の2例を持っていた文字は、データセットから除外されています。

tf.data.Datasetsによって返さtff.simulation.ClientData.create_tf_dataset_for_clientもたらすcollections.OrderedDict次のキーと値と、各反復でオブジェクトを:

  • 'snippets'tf.Tensordtype=tf.string 、連続したテキストの抜粋。

cache_dir ダウンロードしたファイルをキャッシュするディレクトリ(任意)。場合None 、Kerasのデフォルトのキャッシュディレクトリにキャッシュしません。

タプル要素は(列車、テスト)のタプルtff.simulation.ClientDataオブジェクト。