สร้างชุดข้อมูลที่แบ่งส่วนชุดข้อมูลอินพุต
สร้างชุดข้อมูลที่แบ่งส่วนชุดข้อมูลอินพุตตาม num_workers โดยส่งคืนชุดข้อมูลที่แบ่งส่วนสำหรับผู้ปฏิบัติงานที่ดัชนี การดำเนินการนี้จะพยายามแบ่งชุดข้อมูลโดยอัตโนมัติโดยตรวจสอบกราฟชุดข้อมูลและแทรก shard op ก่อนอินพุตไปยังชุดข้อมูลของผู้อ่าน (เช่น CSVDataset, TFRecordDataset)
ชุดข้อมูลนี้จะทำให้เกิดข้อผิดพลาด NotFound หากเราไม่สามารถแบ่งชุดข้อมูลได้โดยอัตโนมัติ
คลาสที่ซ้อนกัน
ระดับ | AutoShardDataset ตัวเลือก | แอตทริบิวต์เพิ่มเติมสำหรับ AutoShardDataset |
วิธีการสาธารณะ
เอาต์พุต <วัตถุ> | เป็นเอาท์พุต () ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์ |
AutoShardDataset.Options แบบคงที่ | autoShardPolicy (autoShardPolicy แบบยาว) |
ชุดข้อมูล AutoShard แบบคงที่ | สร้าง ( ขอบเขต ขอบเขต ตัวดำเนินการ <?> ชุดข้อมูลอินพุต ตัวดำเนินการ <ยาว> numWorkers ตัวดำเนินการ <Long> ดัชนี รายการ<Class<?>> ประเภทเอาต์พุต รายการ< รูปร่าง > รูปร่างเอาต์พุต ตัวเลือก... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ AutoShardDataset ใหม่ |
เอาท์พุต <?> | รับมือ () |
AutoShardDataset.Options แบบคงที่ | numReplicas (ยาว numReplicas) |
วิธีการสืบทอด
วิธีการสาธารณะ
เอาท์ พุท สาธารณะ <Object> asOutput ()
ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์
อินพุตสำหรับการดำเนินการ TensorFlow คือเอาต์พุตของการดำเนินการ TensorFlow อื่น วิธีการนี้ใช้เพื่อรับหมายเลขอ้างอิงสัญลักษณ์ที่แสดงถึงการคำนวณอินพุต
การสร้าง AutoShardDataset แบบคงที่สาธารณะ (ขอบเขต ขอบเขต , ตัวดำเนินการ <?> ชุดข้อมูลอินพุต, ตัวดำเนินการ <Long> numWorkers, ตัวดำเนิน การ <Long> ดัชนี, รายการ <Class<?>> ประเภทเอาต์พุต, รายการ < รูปร่าง > รูปร่างเอาต์พุต, ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ AutoShardDataset ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
ชุดข้อมูลอินพุต | เทนเซอร์ตัวแปรที่แสดงถึงชุดข้อมูลอินพุต |
numWorkers | สเกลาร์ที่แสดงจำนวนคนทำงานเพื่อกระจายชุดข้อมูลนี้ไป |
ดัชนี | สเกลาร์ที่แสดงดัชนีของผู้ปฏิบัติงานปัจจุบันจาก num_workers |
ตัวเลือก | มีค่าแอตทริบิวต์ทางเลือก |
การส่งคืน
- อินสแตนซ์ใหม่ของ AutoShardDataset