1 মি

বর্ণনা :

ইউক্লিডীয় দূরত্ব ব্যবহার করে আনুমানিক নিকটতম প্রতিবেশী অনুসন্ধানের জন্য প্রাক-প্রশিক্ষিত এম্বেডিং। এই ডেটাসেট দুটি বিভাজন নিয়ে গঠিত:

'ডাটাবেস': 1,000,000 ডেটা পয়েন্ট নিয়ে গঠিত, প্রতিটিতে বৈশিষ্ট্য রয়েছে: 'এমবেডিং' (128 ফ্লোটস), 'ইনডেক্স' (int64), 'প্রতিবেশী' (খালি তালিকা)।
'পরীক্ষা': 10,000 ডেটা পয়েন্ট নিয়ে গঠিত, প্রতিটিতে বৈশিষ্ট্য রয়েছে: 'এমবেডিং' (128 ফ্লোটস), 'সূচক' (int64), 'প্রতিবেশী' ('সূচক' তালিকা এবং ডাটাবেসের নিকটতম প্রতিবেশীদের 'দূরত্ব'। )

হোমপেজ : http://corpus-texmex.irisa.fr/
সোর্স কোড : tfds.datasets.sift1m.Builder
সংস্করণ :
- 1.0.0 (ডিফল্ট): প্রাথমিক প্রকাশ।
ডাউনলোডের আকার : 500.80 MiB
ডেটাসেটের আকার : 589.49 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :

বিভক্ত	উদাহরণ
`'database'`	1,000,000
`'test'`	10,000

বৈশিষ্ট্য গঠন :

FeaturesDict({
    'embedding': Tensor(shape=(128,), dtype=float32),
    'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
    'neighbors': Sequence({
        'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
        'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
    }),
})

বৈশিষ্ট্য ডকুমেন্টেশন :

বৈশিষ্ট্য	ক্লাস	আকৃতি	ডিটাইপ	বর্ণনা
	ফিচারসডিক্ট
এমবেডিং	টেনসর	(128,)	float32
সূচক	স্কেলার		int64	বিভাজনের মধ্যে সূচক।
প্রতিবেশী	সিকোয়েন্স			গণনা করা প্রতিবেশী, যা শুধুমাত্র পরীক্ষা বিভাজনের জন্য উপলব্ধ।
প্রতিবেশী/দূরত্ব	স্কেলার		float32	প্রতিবেশীর দূরত্ব।
প্রতিবেশী/সূচক	স্কেলার		int64	প্রতিবেশী সূচক।

তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):

উদ্ধৃতি :

@article{jegou2010product,
  title={Product quantization for nearest neighbor search},
  author={Jegou, Herve and Douze, Matthijs and Schmid, Cordelia},
  journal={IEEE transactions on pattern analysis and machine intelligence},
  volume={33},
  number={1},
  pages={117--128},
  year={2010},
  publisher={IEEE}
}

1 মি সেভ করা পৃষ্ঠা গুছিয়ে রাখতে 'সংগ্রহ' ব্যবহার করুন আপনার পছন্দ অনুযায়ী কন্টেন্ট সেভ করুন ও সঠিক বিভাগে রাখুন।

1 মি