Google I/O में ट्यूनिंग के लिए धन्यवाद। मांग पर सभी सत्र देखें मांग पर देखें

बड़ा पेटेंट

  • विवरण :

बिगपैटेंट, मानव लिखित अमूर्त सारांश के साथ यूएस पेटेंट दस्तावेजों के 1.3 मिलियन रिकॉर्ड से युक्त है। प्रत्येक अमेरिकी पेटेंट आवेदन सहकारी पेटेंट वर्गीकरण (सीपीसी) कोड के तहत दायर किया जाता है। ऐसी नौ वर्गीकरण श्रेणियां हैं: ए (मानव आवश्यकताएं), बी (प्रदर्शन संचालन; परिवहन), सी (रसायन विज्ञान; धातुकर्म), डी (कपड़ा; कागज), ई (फिक्स्ड कंस्ट्रक्शन), एफ (मैकेनिकल इंजीनियरिंग; लाइटनिंग; हीटिंग; हथियार; ब्लास्टिंग), जी (भौतिकी), एच (बिजली), और वाई (नई या क्रॉस-सेक्शनल तकनीक की सामान्य टैगिंग)

दो विशेषताएं हैं: - विवरण: पेटेंट का विस्तृत विवरण। - सारांश: पेटेंट सार।

FeaturesDict({
    'abstract': Text(shape=(), dtype=string),
    'description': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
सार मूलपाठ डोरी
विवरण मूलपाठ डोरी
@misc{sharma2019bigpatent,
    title={BIGPATENT: A Large-Scale Dataset for Abstractive and Coherent Summarization},
    author={Eva Sharma and Chen Li and Lu Wang},
    year={2019},
    eprint={1906.03741},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

big_patent/all (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • विन्यास विवरण : सभी श्रेणियों के तहत पेटेंट।

  • डेटासेट का आकार : 35.17 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 67,072
'train' 1,207,222
'validation' 67,068

बिग_पेटेंट/ए

  • कॉन्फिग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) के तहत पेटेंट: मानव आवश्यकताएं

  • डेटासेट का आकार : 5.16 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 9,675
'train' 174,134
'validation' 9,674

बिग_पेटेंट/बी

  • कॉन्फ़िग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) बी के तहत पेटेंट: संचालन करना; परिवहन

  • डेटासेट का आकार : 4.06 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 8,974
'train' 161,520
'validation' 8,973

बिग_पेटेंट/सी

  • कॉन्फ़िग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) सी के तहत पेटेंट: रसायन विज्ञान; धातुकर्म

  • डेटासेट का आकार : 3.63 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,614
'train' 101,042
'validation' 5,613

बिग_पेटेंट/डी

  • कॉन्फिग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) डी के तहत पेटेंट: कपड़ा; कागज़

  • डेटासेट का आकार : 255.56 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 565
'train' 10,164
'validation' 565

बिग_पेटेंट/ई

  • कॉन्फिग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) के तहत पेटेंट: निश्चित निर्माण

  • डेटासेट का आकार : 871.40 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 1,914
'train' 34,443
'validation' 1,914

big_patent/f

  • कॉन्फ़िग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) एफ के तहत पेटेंट: मैकेनिकल इंजीनियरिंग; बिजली चमकना; गरम करना; हथियार, शस्त्र; नष्ट

  • डेटासेट का आकार : 2.06 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 4,754
'train' 85,568
'validation' 4,754

बिग_पेटेंट / जी

  • कॉन्फिग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) जी के तहत पेटेंट: भौतिकी

  • डेटासेट का आकार : 8.19 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 14,386
'train' 258,935
'validation' 14,385

बड़ा_पेटेंट/एच

  • कॉन्फिग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) एच के तहत पेटेंट: बिजली

  • डेटासेट का आकार : 7.50 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 14,279
'train' 257,019
'validation' 14,279

big_patent/y

  • कॉन्फिग विवरण : सहकारी पेटेंट वर्गीकरण (सीपीसी) वाई के तहत पेटेंट: नई या क्रॉस-सेक्शनल तकनीक की सामान्य टैगिंग

  • डेटासेट का आकार : 3.46 GiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 6,911
'train' 124,397
'validation' 6,911