Эта страница была переведа с помощью Cloud Translation API.
Switch to English

дирижабль

  • Описание :

BLiMP - это набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами.

Трещина Примеры
'train' 1,000
  • Особенности :
FeaturesDict({
    'UID': Text(shape=(), dtype=tf.string),
    'field': Text(shape=(), dtype=tf.string),
    'lexically_identical': tf.bool,
    'linguistics_term': Text(shape=(), dtype=tf.string),
    'one_prefix_method': tf.bool,
    'pair_id': tf.int32,
    'sentence_bad': Text(shape=(), dtype=tf.string),
    'sentence_good': Text(shape=(), dtype=tf.string),
    'simple_LM_method': tf.bool,
    'two_prefix_method': tf.bool,
})
  • Контролируемые ключи (см. as_supervised doc ): None

  • Цитата :

@article{warstadt2019blimp,
  title={BLiMP: A Benchmark of Linguistic Minimal Pairs for English},
  author={Warstadt, Alex and Parrish, Alicia and Liu, Haokun and Mohananey, Anhad and Peng, Wei, and Wang, Sheng-Fu and Bowman, Samuel R},
  journal={arXiv preprint arXiv:1912.00582},
  year={2019}
}

blimp / adjunct_island (конфигурация по умолчанию)

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму adjunct_island.

  • Размер загрузки : 350.86 KiB

  • Размер набора данных : 366.47 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / anaphor_gender_agreement

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму anaphor_gender_agreement.

  • Размер загрузки : 426.51 KiB

  • Размер набора данных : 332.31 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / anaphor_number_agreement

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму anaphor_number_agreement.

  • Размер загрузки : 440.29 KiB

  • Размер набора данных : 341.07 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / animate_subject_passive

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму animate_subject_passive.

  • Размер загрузки : 451.46 KiB

  • Размер набора данных : 345.50 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / animate_subject_trans

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму animate_subject_trans.

  • Размер загрузки : 422.95 KiB

  • Размер набора данных : 329.27 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / причинный

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает в себя причинную парадигму.

  • Размер загрузки : 309.73 KiB

  • Размер набора данных : 324.36 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / комплекс_NP_island

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму complex_NP_island.

  • Размер загрузки : 383.17 KiB

  • Размер набора данных : 398.78 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / координатная_структура_ограничение_комплекса_левая_ветвь

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигмуordin_structure_constraint_complex_left_branch.

  • Размер загрузки : 558.30 KiB

  • Размер набора данных : 410.43 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / координата_структуры_ограничение_объекта_экстракция

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму Coordinate_structure_constraint_object_extraction.

  • Размер загрузки : 357.47 KiB

  • Размер набора данных : 372.10 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ соглашение_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает в себя определение парадигмы имя-существительное_1.

  • Размер загрузки : 457.66 KiB

  • Размер набора данных : 356.93 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ соглашение_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает определение парадигмы имя-существительное_2.

  • Размер загрузки : 477.40 KiB

  • Размер набора данных : 357.01 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ соглашение_irregular_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает в себя определение парадигмы имя-существительное-согласование_irregular_1.

  • Размер загрузки : 463.80 KiB

  • Размер набора данных : 365.08 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ соглашение_irregular_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает определение парадигмы имя-существительное-согласие_irregular_2.

  • Размер загрузки : 479.35 KiB

  • Размер набора данных : 361.76 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ согласие_with_adj_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает определение парадигмы имя-существительное-согласие_with_adj_2.

  • Размер загрузки : 514.46 KiB

  • Размер набора данных : 379.92 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ согласие_with_adj_irregular_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает определение парадигмы имя-существительное-согласие_with_adj_irregular_1.

  • Размер загрузки : 487.95 KiB

  • Размер набора данных : 384.67 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ согласие_with_adj_irregular_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает определение парадигмы имя-существительное-согласие_with_adj_irregular_2.

  • Размер загрузки : 516.14 KiB

  • Размер набора данных : 384.54 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / определитель_ существительное_ согласие_with_adjective_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает в себя определение парадигмы имя-существительное-согласие_with_adjective_1.

  • Размер загрузки : 492.85 KiB

  • Размер набора данных : 385.25 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / distractor_agreement_relational_noun

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму distractor_agreement_relational_noun.

  • Размер загрузки : 513.33 KiB

  • Размер набора данных : 391.45 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / distractor_agreement_relative_clause

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму distractor_agreement_relative_clause.

  • Размер загрузки : 551.53 KiB

  • Размер набора данных : 416.14 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / drop_argument

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму drop_argument.

  • Размер загрузки : 297.07 KiB

  • Размер набора данных : 311.70 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / ellipsis_n_bar_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму ellipsis_n_bar_1.

  • Размер загрузки : 402.32 KiB

  • Размер набора данных : 417.06 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / многоточие_n_bar_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму ellipsis_n_bar_2.

  • Размер загрузки : 417.53 KiB

  • Размер набора данных : 432.47 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / existential_there_object_raising

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму existential_there_object_raising.

  • Размер загрузки : 537.77 KiB

  • Размер набора данных : 423.00 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / existential_there_quantifiers_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму existential_there_quantifiers_1.

  • Размер загрузки : 348.95 KiB

  • Размер набора данных : 363.58 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / existential_there_quantifiers_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму existential_there_quantifiers_2.

  • Размер загрузки : 350.80 KiB

  • Размер набора данных : 365.43 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / existential_there_subject_raising

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму existential_there_subject_raising.

  • Размер загрузки : 385.21 KiB

  • Размер набора данных : 399.84 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / expletive_it_object_raising

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму expletive_it_object_raising.

  • Размер загрузки : 573.88 KiB

  • Размер набора данных : 437.58 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / зародыш

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает начальную парадигму.

  • Размер загрузки : 291.71 KiB

  • Размер набора данных : 306.34 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / непереходный

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает непереходную парадигму.

  • Размер загрузки : 298.33 KiB

  • Размер набора данных : 312.96 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / irregular_past_participle_adjectives

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму irregular_past_participle_adjectives.

  • Размер загрузки : 434.10 KiB

  • Размер набора данных : 345.74 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / irregular_past_participle_verbs

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму irregular_past_participle_verbs.

  • Размер загрузки : 410.27 KiB

  • Размер набора данных : 327.21 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / irregular_plural_subject_verb_agreement_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях английского языка. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму irregular_plural_subject_verb_agreement_1.

  • Размер загрузки : 449.91 KiB

  • Размер набора данных : 366.17 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / irregular_plural_subject_verb_agreement_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму irregular_plural_subject_verb_agreement_2.

  • Размер загрузки : 442.75 KiB

  • Размер набора данных : 354.70 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / left_branch_island_echo_question

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму left_branch_island_echo_question.

  • Размер загрузки : 471.31 KiB

  • Размер набора данных : 348.84 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / left_branch_island_simple_question

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму left_branch_island_simple_question.

  • Размер загрузки : 335.40 KiB

  • Размер набора данных : 351.01 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / matrix_question_npi_licensor_present

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму matrix_question_npi_licensor_present.

  • Размер загрузки : 447.08 KiB

  • Размер набора данных : 354.14 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / npi_present_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму npi_present_1.

  • Размер загрузки : 427.75 KiB

  • Размер набора данных : 339.68 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / npi_present_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму npi_present_2.

  • Размер загрузки : 412.24 KiB

  • Размер набора данных : 329.11 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / only_npi_licensor_present

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму only_npi_licensor_present.

  • Размер загрузки : 448.41 KiB

  • Размер набора данных : 349.50 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / only_npi_scope

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму only_npi_scope.

  • Размер загрузки : 570.04 KiB

  • Размер набора данных : 408.52 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / пассив_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает пассивную парадигму_1.

  • Размер загрузки : 332.30 KiB

  • Размер набора данных : 346.93 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / пассив_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму passive_2.

  • Размер загрузки : 301.12 KiB

  • Размер набора данных : 315.75 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / принцип_A_c_command

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму принцип_A_c_command.

  • Размер загрузки : 515.32 KiB

  • Размер набора данных : 388.54 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / принцип_A_case_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает принцип парадигмы_A_case_1.

  • Размер загрузки : 466.05 KiB

  • Размер набора данных : 370.87 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / принцип_A_case_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает принцип парадигмы_A_case_2.

  • Размер загрузки : 481.42 KiB

  • Размер набора данных : 370.88 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / принцип_А_домен_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает принцип парадигмы_A_domain_1.

  • Размер загрузки : 488.15 KiB

  • Размер набора данных : 371.62 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / принцип_А_домен_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает принцип парадигмы_A_domain_2.

  • Размер загрузки : 481.63 KiB

  • Размер набора данных : 365.92 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / принцип_A_domain_3

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает принцип парадигмы_A_domain_3.

  • Размер загрузки : 501.84 KiB

  • Размер набора данных : 359.74 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / Princip_A_reconstruction

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму принцип_A_reconstruction.

  • Размер загрузки : 337.40 KiB

  • Размер набора данных : 353.00 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / regular_plural_subject_verb_agreement_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму regular_plural_subject_verb_agreement_1.

  • Размер загрузки : 441.26 KiB

  • Размер набора данных : 359.56 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / регулярное_пользовательское_предметное_говорное_агримент_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму regular_plural_subject_verb_agreement_2.

  • Размер загрузки : 445.78 KiB

  • Размер набора данных : 354.47 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / sentential_negation_npi_licensor_present

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму sentential_negation_npi_licensor_present.

  • Размер загрузки : 479.49 KiB

  • Размер набора данных : 372.30 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / sentential_negation_npi_scope

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму sentential_negation_npi_scope.

  • Размер загрузки : 600.52 KiB

  • Размер набора данных : 431.18 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / sentential_subject_island

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях английского языка. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму sentential_subject_island.

  • Размер загрузки : 357.25 KiB

  • Размер набора данных : 372.86 KiB

  • Примеры ( tfds.as_dataframe ):

blimp / superlative_quantifiers_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму superlative_quantifiers_1.

  • Размер загрузки : 372.25 KiB

  • Размер набора данных : 360.02 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / superlative_quantifiers_2

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, изолирующих определенные контрасты в синтаксисе, морфологии или семантике. Данные автоматически генерируются в соответствии с грамматикой, разработанной экспертами. Эта конфигурация включает парадигму superlative_quantifiers_2.

  • Размер загрузки : 504.02 KiB

  • Размер набора данных : 360.07 KiB

  • Примеры ( tfds.as_dataframe ):

дирижабль / tough_vs_raising_1

  • Описание конфигурации : BLiMP представляет собой набор задач для оценки того, какие языковые модели (LM) знают об основных грамматических явлениях в английском языке. BLiMP состоит из 67 поднаборов данных, каждый из которых содержит 1000 минимальных пар, выделяющих определенные контрасты в синтаксисе, морфологии или семантике. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm tough_vs_raising_1.

  • Download size : 334.99 KiB

  • Dataset size : 349.62 KiB

  • Examples ( tfds.as_dataframe ):

blimp/tough_vs_raising_2

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm tough_vs_raising_2.

  • Download size : 355.54 KiB

  • Dataset size : 370.17 KiB

  • Examples ( tfds.as_dataframe ):

blimp/transitive

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm transitive.

  • Download size : 449.50 KiB

  • Dataset size : 334.45 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_island

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_island.

  • Download size : 438.12 KiB

  • Dataset size : 343.47 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_questions_object_gap

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_questions_object_gap.

  • Download size : 378.35 KiB

  • Dataset size : 392.99 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_questions_subject_gap

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_questions_subject_gap.

  • Download size : 380.84 KiB

  • Dataset size : 395.47 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_questions_subject_gap_long_distance

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_questions_subject_gap_long_distance.

  • Download size : 451.82 KiB

  • Dataset size : 466.53 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_vs_that_no_gap

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_vs_that_no_gap.

  • Download size : 374.28 KiB

  • Dataset size : 388.91 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_vs_that_no_gap_long_distance

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_vs_that_no_gap_long_distance.

  • Download size : 431.08 KiB

  • Dataset size : 445.74 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_vs_that_with_gap

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_vs_that_with_gap.

  • Download size : 359.16 KiB

  • Dataset size : 373.79 KiB

  • Examples ( tfds.as_dataframe ):

blimp/wh_vs_that_with_gap_long_distance

  • Config description : BLiMP is a challenge set for evaluating what language models (LMs) know about major grammatical phenomena in English. BLiMP consists of 67 sub-datasets, each containing 1000 minimal pairs isolating specific contrasts in syntax, morphology, or semantics. The data is automatically generated according to expert-crafted grammars. This configuration includes the paradigm wh_vs_that_with_gap_long_distance.

  • Download size : 416.00 KiB

  • Dataset size : 430.63 KiB

  • Examples ( tfds.as_dataframe ):