امروز برای رویداد محلی TensorFlow خود در همه جا پاسخ دهید!
این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.
Switch to English

حق_باخت بزرگ

  • توضیحات :

BIGPATENT ، متشکل از 1.3 میلیون پرونده از اسناد ثبت اختراع ایالات متحده به همراه خلاصه های انتزاعی نوشته شده توسط انسان. هر درخواست ثبت اختراع ایالات متحده تحت کد طبقه بندی ثبت اختراع تعاونی (CPC) ثبت می شود. نه طبقه بندی از این دست وجود دارد: A (نیازهای انسانی) ، B (انجام عملیات ؛ حمل و نقل) ، C (شیمی ؛ متالورژی) ، D (منسوجات ، کاغذ) ، E (سازه های ثابت) ، F (مهندسی مکانیک ؛ صاعقه ؛ گرمایش ؛ سلاح ؛ انفجار) ، G (فیزیک) ، H (برق) و Y (برچسب گذاری کلی فناوری جدید یا مقطعی)

دو ویژگی وجود دارد: - توضیحات: شرح دقیق حق ثبت اختراع. - خلاصه: حق ثبت اختراع.

  • صفحه اصلی : https://evasharma.github.io/bigpatent/

  • کد منبع : tfds.summarization.BigPatent

  • نسخه ها :

    • 1.0.0 : کلمات رمزگذاری شده با پرونده پایین
    • 2.0.0 : برای استفاده از رشته های خام محصور شده به روز کنید
    • 2.1.2 (پیش فرض): به روزرسانی را به رشته های خام پوشش داده شده برطرف کنید.
  • اندازه بارگیری : 9.45 GiB

  • ذخیره خودکار ( مستندات ): خیر

  • ویژگی ها :

FeaturesDict({
    'abstract': Text(shape=(), dtype=tf.string),
    'description': Text(shape=(), dtype=tf.string),
})
  • کلیدهای تحت نظارت (به as_supervised سند نظارت شده مراجعه کنید): ('description', 'abstract')

  • نقل قول :

@misc{sharma2019bigpatent,
    title={BIGPATENT: A Large-Scale Dataset for Abstractive and Coherent Summarization},
    author={Eva Sharma and Chen Li and Lu Wang},
    year={2019},
    eprint={1906.03741},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

big_patent / all (پیکربندی پیش فرض)

  • توضیحات پیکربندی : حق ثبت اختراع در همه دسته ها.

  • اندازه مجموعه داده : 35.17 GiB

  • تقسیم :

شکاف مثال ها
'test' 67،072
'train' 1،207،222
'validation' 67،068

بزرگ_پتنت / الف

  • شرح پیکربندی : حق ثبت اختراعات تحت طبقه بندی ثبت اختراعات تعاونی (CPC) a: نیازهای انسانی

  • اندازه مجموعه داده : 5.16 GiB

  • تقسیم :

شکاف مثال ها
'test' 9،675
'train' 174،134
'validation' 9،674

اختراع بزرگ / ب

  • شرح پیکربندی : حق ثبت اختراع تحت طبقه بندی ثبت اختراعات تعاونی (CPC) ب: انجام عملیات ؛ حمل و نقل

  • اندازه مجموعه داده : 4.06 GiB

  • تقسیم :

شکاف مثال ها
'test' 8،974
'train' 161،520
'validation' 8973

بزرگ_پتنت / ج

  • توضیحات پیکربندی : حق ثبت اختراعات تحت طبقه بندی ثبت اختراعات تعاونی (CPC) c: شیمی؛ متالورژی

  • اندازه مجموعه داده : 3.63 GiB

  • تقسیم :

شکاف مثال ها
'test' 5،614
'train' 101،042
'validation' 5،613

بزرگ_پتنت / روز

  • شرح پیکربندی : حق ثبت اختراع تحت طبقه بندی ثبت اختراعات تعاونی (CPC) d: منسوجات ؛ کاغذ

  • اندازه مجموعه داده : 255.56 MiB

  • تقسیم :

شکاف مثال ها
'test' 565
'train' 10164
'validation' 565

big_patent / e

  • توضیحات پیکربندی : حق ثبت اختراع تحت طبقه بندی ثبت اختراعات تعاونی (CPC) e: سازه های ثابت

  • اندازه مجموعه داده : 871.40 MiB

  • تقسیم :

شکاف مثال ها
'test' 1،914
'train' 34443
'validation' 1،914

بزرگ_پتنت / f

  • شرح پیکربندی : حق ثبت اختراع تحت طبقه بندی ثبت اختراع تعاونی (CPC) f: مهندسی مکانیک ؛ رعد و برق؛ گرمایش سلاح انفجار

  • اندازه مجموعه داده : 2.06 GiB

  • تقسیم :

شکاف مثال ها
'test' 4،754
'train' 85،568
'validation' 4،754

بزرگ_پتنت / گرم

  • شرح پیکربندی : حق ثبت اختراع تحت طبقه بندی ثبت اختراعات تعاونی (CPC) g: فیزیک

  • اندازه مجموعه داده : 8.19 GiB

  • تقسیم :

شکاف مثال ها
'test' 14386
'train' 258.935
'validation' 14385

امتیاز_بلند بزرگ / ساعت

  • توضیحات پیکربندی : حق ثبت اختراع تحت طبقه بندی ثبت اختراعات تعاونی (CPC) ساعت: برق

  • اندازه مجموعه داده : 7.50 GiB

  • تقسیم :

شکاف مثال ها
'test' 14،279
'train' 257،019
'validation' 14،279

big_patent / سال

  • توضیحات پیکربندی : حق ثبت اختراع تحت طبقه بندی ثبت اختراع تعاونی (CPC) y: برچسب گذاری کلی فناوری جدید یا مقطعی

  • اندازه مجموعه داده : 3.46 GiB

  • تقسیم :

شکاف مثال ها
'test' 6،911
'train' 124397
'validation' 6،911